Есть .json датасет, необходимо:
предобработать текст (удаление лишних
символов, токенизация, удаление стоп-слов, лемматизация, нормализация).
Векторизовать тексты и с помощью моделей классического машинного обучения выполнить классификацию.
Добиться как можно лучшего качества и проанализировать результаты (сравнить метрики качества, сделать визуализации)