Ход выполнения работы:
1)Установка RapidMiner и обновление его до последней версии.
2) Установка компонентов textMining и WebMining
3) Использование оператора CrawlWeb для сохранения документов на рабочий компьютер. ВНИМАНИЕ: установите ограничение не более 50 страниц.
3) Использование компоненты- Process Dociment from files и различных фильтров (минимум-3).
4) Проведение кластеризации документов.
5) Анализ полученных результатов.
ОТЧЕТ:
содержит скриншоты экрана каждого действия с комментариями, и с выводами по кластеризации.