Написать программу на языке python 3.6 в среде разработки PyСharm выполняющую ряд функций. Приложу в архиве задания, сразу оговорюсь что именно всё делать не нужно. Нужна сама программа и небольшой отчёт, как именно программа работает, в WORD, в свободной форме, главное - что бы было понятно.
Вот вырезка из задания, что должна делать программа:
Загрузку для обработки текста из файлов формата fb2
Разбиение текста на слова и предложения с последующим сохранением в текстовые файлы с названиями words_название_произведения.txt, sentences_название_произведения.txt)
Построение словаря произведения с сохранением в текстовый файл dict_название_произведения.txt. В файле напротив каждого слова должно быть приведено число появления этого слова в произведении (это необходимо для расчета частоты встречаемости)
Построение словаря произведения с удаленными местоимениями с сохранением в текстовый файл dict_without_pronouns_название_произведения.txt. В файле напротив каждого слова должно быть приведено число появления этого слова в произведении (это необходимо для расчета частоты встречаемости)
Построение словаря произведения с удаленными местоимениями и стоп-словами с сохранением в текстовый файл dict_without_stop_words_название_произведения.txt. В файле напротив каждого слова должно быть приведено число появления этого слова в произведении (это необходимо для расчета частоты встречаемости)
Построение словаря с удаленными местоимениями и стоп-словами и выполненным стеммингом
Построение списка слов характеризующего словарный запас автора произведения (с сохранением в текстовый файл с названием lexicon_фио_автора.txt)
Составление списка словосочетаний (для технической литературы)
Ещё оговорюсь, что разрешено пользоваться плагинами, если возникнут трудности. Например для подобных задач есть spaCy, textacy и neuralcoref.
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |