Оценка и анализ моделей распознавания юмора

user242482

Был(а) на сайте 13 часов назад

Раздел

Математические дисциплины

Предмет

Вычислительная математика

Тип

Дипломная работа

Просмотров

226

Покупок

Антиплагиат

Не указан

Размещена

10 Сен 2021 в 20:37

ВУЗ

МГУ

Курс

4 курс

Стоимость

3 000 ₽

Файлы работы

Каждая работа проверяется на плагиат, на момент публикации уникальность составляет не менее 40% по системе проверки eTXT.

Оценка и анализ моделей распознавания юмора Диплом Математика 95

1.8 Мбайт 3 000 ₽

Описание

Добрый день! Уважаемые студенты, Вашему вниманию представляется дипломная работа на тему: «Оценка и анализ моделей распознавания юмора»

Оригинальность работы 95%

Аннотация

В последнее время в связи с развитием систем общения задача распознавания юмора приобретает всё большую актуальность. Данная работа анализирует модели распознавания юмора, обученные на нескольких наборах данных, с помощью состязательных атак. В первой части работы проведен обзор предметной области и существующих исследований по распознаванию юмора и по состязательным атакам. Вторая часть содержит описание существующих наборов данных и построения моделей распознавания юмора на их основе, а также подробный анализ их работы. В третьей части описаны применяемые состязательные атаки и их влияние на результаты классификации. Наконец,

работа завершается подведением итогов и идеями для дальнейших исследований.

Recently, in connection with the development of communication systems, the task of humor detection is becoming increasingly relevant. This paper analyzes humor recognition models trained on multiple datasets using adversarial attacks. In the first part of the paper, the research area and existing works on humor recognition and adversarial attacks are reviewed. The second part contains description of existing datasets and construction of humor recognition models, as well as detailed analysis of their results. The third part describes adversarial attacks used and their impact on classification results. Finally, the work ends with a summary of obtained results and ideas for further research.

Список ключевых слов – распознавание юмора; модель-классификатор; логистическая регрессия; эмбеддинг; Bag of Words; Word2Vec; Universal Sentence Encoder; ClassifierDL; состязательные атаки

Оглавление

Аннотация ....................................................................................................................

Введение.......................................................................................................................

Обзор литературы........................................................................................................

Распознавание юмора ........................................................................................

Состязательные атаки......................................................................................

Выводы....................................................................................................................

Глава 1. Данные .........................................................................................................

1.1

One-Liners ..........................................................................................................

1.2

Humicroedit ........................................................................................................

1.3 Unfun.me ............................................................................................................

1.4 PUNS..................................................................................................................

Выводы и результаты.............................................................................................

Глава 2. Модели и метрики качества ......................................................................

2.1

Метрики качества.............................................................................................

2.2

Bag of Words & Logistic Regression ................................................................

2.2.1

Train on One-liners ......................................................................................

2.2.2

Train on Humicroedit ...................................................................................

2.2.3

Train on Unfunme ........................................................................................

2.2.4

Train on Puns ...............................................................................................

2.3

Word2Vec & Logistic Regression .....................................................................

2.3.1

Train on One-Liners .....................................................................................

2.3.2

Train on Humicroedit ...................................................................................

2.3.3

Train on Unfunme ........................................................................................

2.3.4

Train on Puns ...............................................................................................

2.4

Universal Sentence Encoder & ClassifierDL ....................................................

2.4.1

Train on One-liners ......................................................................................

2.4.2

Train on Humicroedit ...................................................................................

2.4.3

Train on Unfunme ........................................................................................

2.4.4

Train on Puns ...............................................................................................

2.5

Сравнение моделей ..........................................................................................

2.5.1

One-liners (train, test) ..................................................................................

2.5.2 Humicroedit (train, test)........................................................................ 54

2.5.3 Unfunme (train, test)............................................................................. 55

2.5.4 Puns (train, test).................................................................................... 56

2.5.5 Сравнение на всех датасетах.............................................................. 57

Выводы и результаты.................................................................................... 58

Глава 3. Состязательные атаки......................................................................... 59

3.1 Метрики качества..................................................................................... 61

3.2 Slang 18+.................................................................................................. 61

3.3 Антонимы................................................................................................. 63

3.4 Рифмы....................................................................................................... 65

3.5 Сравнение................................................................................................. 67

Выводы и результаты.................................................................................... 68

Глава 4. Применение состязательных атак....................................................... 69

4.1 Slang 18+.................................................................................................. 70

4.2 Антонимы................................................................................................. 73

4.3 Рифмы....................................................................................................... 76

Выводы и результаты.................................................................................... 78

Заключение........................................................................................................ 79

Библиографический список.............................................................................. 81

Приложениe 1. Результаты классификации BOW на исходных данных......... 84

Приложениe 2. Результаты классификации Word2Vec на исходных данных. 86

Приложениe 3. Результаты классификации USE на исходных данных.......... 88

Приложениe 4. Процент изменений текстов класса «non-humorous» для каждой

атаки................................................................................................................... 90

Приложениe 5. Процент ошибок для класса «non-humorous» в исходных

результатах........................................................................................................ 91

Приложениe 6. Результаты классификации после применения атаки «Slang 18+»

Приложениe 7. Результаты классификации после применения атаки «Антонимы»

Приложениe 8. Результаты классификации после применения атаки «Рифмы» 96

Список литературы

Библиографический список

[1] R, Mihalcea, and C. Strapparava. “Making Computers Laugh: Investigations

in Automatic Humor Recognition.” (2005). HLT/EMNLP.

[2] Британский Национальный корпус [сайт]. URL: https://www.english-corpora.org/bnc/

[3] F, Barbieri, and H. Saggion. “Automatic Detection of Irony and Humour in Twitter.” (2014).

[4] Yang et al. “Humor recognition and humor anchor extraction.” (2015).

EMNLP.

[5] Potash et al. “#HashtagWars: Learning a Sense of Humor.” (2016).

[6] Miller et al. “SemEval-2017 Task 7: Detection and Interpretation of English Puns.” (2017). SEMEVAL2017.

[7] WordNet (2010) [сайт]. URL: https://wordnet.princeton.edu

[8] L. Chen, and Chong Min Lee. “Predicting Audience's Laughter Using

Convolutional Neural Network.” (2017).

[9] TED-talks [сайт]. URL: https://www.ted.com/talks

[10] Ermilov et al. “Stierlitz Meets SVM: Humor Detection in Russian.” (2018).

AINL.

[11] C. Chang, and C. Lin. “LIBSVM: A library for support vector machines.”

(2011).

[12] A. Cattle, and X. Ma. “Recognizing Humour using Word Associations and Humour Anchor Extraction.” (2018).

[13] S. Attardo, and V. Raskin. “Script theory revis(it)ed: Joke similarity and joke representation model.”. (1991).

[14] Zhang et al. “Exploiting Syntactic Structures for Humor Recognition.”

(2018). COLING.

[15] Blinov et al. “Large Dataset and Language Model Fun-Tuning for Humor

Recognition.” (2019). ACL.

[16] J. Howard, and S. Ruder. “Universal Language Model Fine-tuning for Text

Classification.”(2018). ACL.

[17] O. Weller, and K. Seppi. “Humor Detection: A Transformer Gets the Last Laugh.” (2019). EMNLP.

[18] Reddit r/Jokes thread [сайт]. URL: https://www.reddit.com/r/Jokes/

[19] P. Chen, and V. Soo, “Humor recognition using deep learning” (2018).

Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 2 (Short Papers).

[20] Devlin et al. “BERT: Pre-training of Deep Bidirectional Transformers for

Language Understanding.” (2019). NAACL-HLT.

[21] Hossain et al. “President Vows to Cut Hair : Dataset and Analysis of Creative Text Editing for Humorous Headlines.” (2019).

[22] Hossain et al. “SemEval-2020 Task 7: Assessing Humor in Edited News

Headlines” (2020).

[23] Weller et al. “Can Humor Prediction Datasets be used for Humor Generation? Humorous Headline Generation via Style Transfer.” (2020).

[24] I. Annamoradnejad, and G. Zoghi “ColBERT: Using BERT Sentence Embedding for Humor Detection” (2020).

[25] Ziser et al. “Humor Detection in Product Question Answering Systems.”

(2020).

[26] Goodfellow et al. “Explaining and harnessing adversarial examples.”

(2015). In Proceedings of ICLR.

[27] R. Jia and P. Liang. “Adversarial Examples for Evaluating Reading Comprehension Systems.” (2017).

[28] Rajpurkar et al. “SQuAD: 100, 000+ Questions for Machine Comprehension of Text.” (2016). EMNLP.

[29] Zhou et al. “Learning to Discriminate Perturbations for Blocking Adversarial Attacks in Text Classification.” (2019). EMNLP/IJCNLP.

[30] Y. Malkov, and D. Yashunin. “Efficient and Robust Approximate Nearest Neighbor Search Using Hierarchical Navigable Small World Graphs.” (2016). IEEE Transactions on Pattern Analysis and Machine Intelligence.

[31] Xiaosen et al. “Natural Language Adversarial Attacks and Defenses in

Word Level.” (2019).

[32] Zhou et al. “Fake News Detection via NLP is Vulnerable to Adversarial Attacks.” (2019).

[33] Fakebox state-of-the-art model [сайт]. URL:

https://machinebox.io/docs/fakebox

[34] Wallace et al. “Universal Adversarial Triggers for Attacking and Analyzing

NLP.” (2019). EMNLP.

[35] Singh et al. “Model Robustness with Text Classification: Semantic-preserving adversarial attacks” (2020).

[36] R. West, and E. Horvitz, “Reverse-Engineering Satire, or «Paper on

Computational Humor Accepted despite Making Serious Advances»” (2019).

Proceedings of the AAAI Conference on Artificial Intelligence.

[37] Cer, Daniel Matthew, et al. “Universal Sentence Encoder.” (2018).

Вам подходит эта работа?

Похожие работы

Вычислительная математика

Практическое задание "Математика 1.2"

450 ₽

HelpMMU

Контрольная работа Контрольная

23 Мар в 10:39

0 покупок

Вычислительная математика

ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ - ИТОГОВЫЙ – ТЕСТ С ОТВЕТАМИ (НИУ МЭИ (ТУ) ИДДО)

290 ₽

RocketX

Тест Тест

6 Фев в 14:50

0 покупок

Вычислительная математика

Пpиближeнное вычиcление прoизводных

300 ₽

zema@produktion

Курсовая работа Курсовая

2 Фев в 16:19

0 покупок

Вычислительная математика

Итоговая аттестация (3 семестр)

350 ₽

Hilight

Тест Тест

30 Янв в 12:05

0 покупок

Вычислительная математика

Вычислительные системы, сети и телекоммуникации/СИНЕРГИЯ//МОСАП//МОИ//МТИ

250 ₽

StudHelping

Тест Тест

23 Янв в 15:50

0 покупок

Другие работы автора

Дизайн

ПЕРЕГОРОДКИ В СТИЛЕ «САФАРИ»

800 ₽

user242482

Курсовая работа Курсовая

6 Июл 2023 в 00:04

122

0 покупок

Информационные технологии

Особенности работы беспроводных информационных технологий Информационные технологии

550 ₽

user242482

Курсовая работа Курсовая

5 Июл 2023 в 23:59

205

0 покупок

Менеджмент

Оперативное планирование с применением Lean-технологий в ООО «Со-кольский Лесхоз», р. п. Сокольское Нижегородской области» Княгининского района Нижегородской области

550 ₽

user242482

Курсовая работа Курсовая

5 Июл 2023 в 23:55

156

0 покупок

Водный транспорт

Управление судами и подготовка их к выполнению перевозок на т/х «Краснодон», на участке р.Енисей, используя эффективность СЭУ.

2 500 ₽

user242482

Дипломная работа Дипломная

30 Янв 2023 в 15:52

158

0 покупок

Нефтегазовое дело

Технологии строительства эксплуатационной скважины с горизонтальным окончанием №119 на нефть, глубиной 2400 метров на Приобском месторождении ХМАО с применением бурового раствора на углеводородной основе.

5 000 ₽

user242482

Дипломная работа Дипломная

30 Янв 2023 в 15:47

131

0 покупок

Социология

Социальная политика в США в условиях глобализации: эволюция и противоречия

2 500 ₽

user242482

Дипломная работа Дипломная

30 Янв 2023 в 15:04

185

0 покупок

Уголовное право

Воинские преступления

450 ₽

user242482

Курсовая работа Курсовая

23 Янв 2023 в 15:06

260

1 покупка

Философия

Онтологическая настроенность в видеоиграх: смех и жуть

1 500 ₽

user242482

Курсовая работа Курсовая

23 Янв 2023 в 14:57

202

0 покупок

Животноводство

Методы диагностики и лечения мастита в условиях ООО «Экониваагро – восточное», Бобровский район Воронежской области.

2 500 ₽

user242482

Дипломная работа Дипломная

23 Янв 2023 в 14:45

173

0 покупок

Электроснабжение

Надежность и диагностика систем электроснабжения при выборе оптимальных технических решений

450 ₽

user242482

Курсовая работа Курсовая

21 Янв 2023 в 22:58

214

1 покупка

Техническое обслуживание и ремонт автомобилей

Участок по капитальному ремонту ДВС

550 ₽

user242482

Курсовая работа Курсовая

21 Янв 2023 в 22:53

175

0 покупок

Макроэкономика

Рынок заемных средств и особенности формирования процентных ставок в российской экономике

450 ₽

user242482

Курсовая работа Курсовая

21 Янв 2023 в 22:45

138

0 покупок

История

Женщины в Отечественной войне 1812 года

550 ₽

user242482

Курсовая работа Курсовая

21 Янв 2023 в 22:39

109

0 покупок

Реклама и PR

Исследование отношения потребителей к промо-акциям предприятия

550 ₽

user242482

Курсовая работа Курсовая

2 Окт 2022 в 14:06

159

0 покупок

Стратегический менеджмент

Формирование корневых компетенций организации

550 ₽

user242482

Курсовая работа Курсовая

19 Сен 2022 в 16:06

172

0 покупок

Гражданское право

Третьи лица в исковом судопроизводстве

500 ₽

user242482

Курсовая работа Курсовая

19 Сен 2022 в 16:01

178

1 покупка

Реклама и PR

Исследование контента предприятия и его конкурентов в социальной сети инстаграм

500 ₽

user242482

Курсовая работа Курсовая

19 Сен 2022 в 15:54

169

0 покупок

Реклама и PR

Создание сайта и бумажной рекламной продукции для салон-парикмахерских «ALASKA»

500 ₽

user242482

Курсовая работа Курсовая

19 Сен 2022 в 15:49

212

0 покупок

Педагогическая психология

Психолого-педагогические факторы формирования феномена групповой сплочённости

600 ₽

user242482

Курсовая работа Курсовая

19 Сен 2022 в 15:46

195

0 покупок

Лексикология

ФОРМИРОВАНИЕ ЛЕКСИЧЕСКИХ НАВЫКОВ ОБУЧАЮЩИХСЯ НА ОСНОВЕ ИГРОВЫХ ТЕХНОЛОГИЙ НА СРЕДНЕМ ЭТАПЕ ОБУЧЕНИЯ

2 500 ₽

user242482

Дипломная работа Дипломная

19 Сен 2022 в 15:28

173

0 покупок

Предыдущая работа

Экология задача

Следующая работа

Эволюция системы электронного декларирования, используемой при осуществлении таможенных операций с товарами

Закажите новую работу, выполненную по вашим требованиям у эксперта.

Темы журнала

Статьи справочника

Прямой эфир