Моделирование причинно-следственных связей в языке: обнаружение недействительных высказываний

user242482

Был(а) на сайте 7 дней назад

Раздел

Программирование

Предмет

Информационные технологии

Тип

Дипломная работа

Просмотров

172

Покупок

Антиплагиат

Не указан

Размещена

21 Сен 2021 в 21:06

ВУЗ

МГУ

Курс

4 курс

Стоимость

1 500 ₽

Файлы работы

Каждая работа проверяется на плагиат, на момент публикации уникальность составляет не менее 40% по системе проверки eTXT.

Моделирование причинно-следственных связей в языке обнаружение недействительных высказываний ВКР Информационные технологии 88

932 Кбайт 1 500 ₽

Описание

ДИПЛОМ

Добрый день! Уважаемые студенты, Вашему вниманию представляется дипломная работа на тему: «Моделирование причинно-следственных связей в языке: обнаружение недействительных высказываний»

Оригинальность работы 88%

Аннотация

Недействительные высказывания, описывающие события, которые не произошли (или не могли произойти) и события, которые могли бы возникнуть

в качестве их последствий, были изучены в различных областях науки, в том числе в лингвистике, философии и социологии. Тем не менее, в сфере вычислительной лингвистики эта тема не была широко изучена. Целью данного исследования является разработка метода для обнаружения подобных высказываний в коротких текстах на английском языке. Лучшим методом оказалась нейросетевая языковая модель, она смогла достичь значения f-меры в 0.86.

Ключевые слова – Недействительные высказывания, Представления слов, fasttext, GloVe, ELMo, BERT, Трансформер, Бинарная классификация, Несбалансированный набор данных

Abstract

Counterfactual statements, which describe an event that did not occur (or could not possibly occur) and its consequents, have been studied in different domains, including linguistics, philosophy, and human studies. Nevertheless, there has not been a great amount of research in computational linguistics. The main goal of this research was to develop a method for detecting counterfactuals in small texts in English. The best method we implemented was a neural net language model, which achieved an F1-score of 0.86 on the test set.

Оглавление

ОГЛАВЛЕНИЕ

1 ВВЕДЕНИЕ .................................................................................................... 5

2 ОБЗОР ЛИТЕРАТУРЫ.................................................................................... 7

2.1 РАСПОЗНАВАНИЕ НЕДЕЙСТВИТЕЛЬНЫХ ВЫРАЖЕНИЙ .......................... 7

2.2 СТАНДАРТНЫЕ МЕТОДЫ ОБРАБОТКИ ЕСТЕСТВЕННОГО ЯЗЫКА ............. 9

2.2.1 Предобработка текста................................................................. 9

2.2.2 Признаки TF-IDF ............................................................................ 9

2.2.3 Представления слов fastText ........................................................ 10

2.2.4 Представления слов GloVe .......................................................... 10

2.3 НЕЙРОСЕТЕВЫЕ МЕТОДЫ КЛАССИФИКАЦИИ ТЕКСТА ......................... 10

2.3.1 Свёрточные нейронные сети ...................................................... 10

2.3.2 Рекуррентные нейронные сети................................................... 11

2.3.3 Представления слов ELMo ........................................................... 12

2.3.4 Модели на основе модели Трансформер ..................................... 13

2.4 МЕТОДЫ РАБОТЫ С НЕСБАЛАНСИРОВАННЫМ НАБОРОМ ДАННЫХ ...... 14

2.4.1 Случайное ресемплирование ........................................................ 14

2.4.2 SMOTE............................................................................................ 15

2.4.3 Обратный перевод........................................................................ 15

2.5 ИСПОЛЬЗУЕМЫЕ ТЕХНОЛОГИИ............................................................ 15

2.5.1 Библиотека Imblearn [29, 30] ...................................................... 15

2.5.2 Библиотека fastText [31, 32] ........................................................ 16

2.5.3 Библиотека Hugging Face [33, 34] .............................................. 16

2.5.4 Библиотека fairseq [35, 36] .......................................................... 16

3 ПОСТАНОВКА ЗАДАЧИ И ИМЕЮЩИЙСЯ НАБОР ДАННЫХ ....................... 16

4 МЕТОДОЛОГИЯ .......................................................................................... 18

4.1 ПРЕДОБРАБОТКА ДАННЫХ................................................................... 18

4.2 РАБОТА С НЕСБАЛАНСИРОВАННЫМ НАБОРОМ ДАННЫХ ..................... 18

4.3 ПЛАН РЕШЕНИЯ ПОСТАВЛЕННОЙ ЗАДАЧИ .......................................... 18

5 СТАНДАРТНЫЕ МЕТОДЫ ........................................................................... 19

5.1 СТАТИСТИЧЕСКИЙ ПОДХОД ................................................................ 19

5.2 TF-IDF И РЕСЕМПЛИРОВАНИЕ ............................................................ 20

5.3 FASTTEXT............................................................................................. 20

6 НЕЙРОСЕТЕВЫЕ МЕТОДЫ ......................................................................... 21

6.1 СВЁРТОЧНЫЕ И РЕКУРРЕНТНЫЕ НЕЙРОННЫЕ СЕТИ ............................. 21

6.1.1 Свёрточные нейронные сети ...................................................... 21

6.1.2 Рекуррентные нейронные сети................................................... 21

6.1.3 Сравнение двух моделей ............................................................... 22

6.2 ЯЗЫКОВЫЕ МОДЕЛИ ВИДА ТРАНСФОРМЕР .......................................... 22

7 КОМБИНАЦИЯ СТАНДРАТНЫХ И НЕЙРОСЕТЕВЫХ МЕТОДОВ ................. 24

7.1 ELMO И ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ ................................................ 24

7.2 АНСАМБЛИРОВАНИЕ ........................................................................... 24

8 РЕЗУЛЬТАТЫ .............................................................................................. 25

9 ЗАКЛЮЧЕНИЕ ............................................................................................ 25

10 СПИСОК ЛИТЕРАТУРЫ .............................................................................. 25

Список литературы

10 Список литературы

(1) CodaLab-Competition. https://competitions.codalab.org/competitions/21691

(2) Nelson Goodman. 1947. “The problem of counterfactual conditionals.“ The Journal of Philosophy 44(5):113–128.

(3) Philip E Tetlock. 1996. “Counterfactual thought experiments in world politics: Logical, methodological, and psychological perspectives.“ Princeton University Press.

(4) Son, Youngseo, Anneke Buffone, Joe Raso, Allegra Larche, Anthony

Janocko, Kevin Zembroski, H. Andrew Schwartz, and Lyle Ungar, “Recognizing counterfactual thinking in social media texts“, In Proceedings of the 55th Annual

Meeting of the Association for Computational Linguistics, ACL 2017, pages 654– 658, Vancouver.

(5) Twitter, Inc. https://twitter.com/

(6) Sepp Hochreiter, Ju ̈rgen Schmidhuber, “Long Short-term Memory“, 1997

(7) Matthew Peters, Mark Neumann, Mohit Iyyer, Matt Gardner, Christo- pher Clark, Kenton Lee, and Luke Zettlemoyer. 2018. “Deep contextualized word representations.“ In Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long Papers), pages 2227–2237.

(8) Nitish Srivastava and Geoffrey Hinton and Alex Krizhevsky and Ilya Sutskever and Ruslan Salakhutdinov, “Dropout: A Simple Way to Prevent Neural Networks from Overfitting“, Journal of Machine Learning Research, 2014

(9) Kingma, D. and Ba, J. Adam: A method for stochastic optimization. arXiv preprint arXiv:1412.6980, 2014.

(10) Mitchell P. Marcus, Mary Ann Marcinkiewicz, and Beat- rice Santorini. 1993. Building a large annotated corpus of english: the penn treebank.

Computational Linguistics, 19(2):313–330.

(11) Jeffrey Pennington, Richard Socher, and Christopher D. Manning. 2014.

Glove: Global vectors for word representation. In Empirical Methods in Natural Language Processing (EMNLP), pages 1532– 1543.

(12) Piotr Bojanowski, Edouard Grave, Armand Joulin, and Tomas Mikolov. 2017. Enriching word vectors with subword information. TACL 5:135–146.

(13) N.V.Chawla,K.W.Bowyer,L.O.Hall,andW.P.Kegelmeyer,‘‘SMOTE: Synthetic minority over-sampling technique,’’ J. Artif. Intell. Res., vol. 16, pp. 321–357, Jun. 2002

(14) Sergey Edunov, Myle Ott, Michael Auli, and David Grangier. 2018. Understanding back-translation at scale. In Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing, pages 489–500, Brussels.

(15) Trabasso T., Bartolone J. Story understanding and counterfactual reasoning //Journal of Experimental Psychology: Learning, Memory, and Cognition. – 2003. – Т. 29. – №. 5. – С. 904.

(16) Maximilian Köper, Christian Scheible, and Sabine Schulte im Walde. 2015. Multilingual reliability and “semantic” structure of continuous word spaces. Proc. IWCS 2015.

(17) Bojanowski P. et al. Enriching word vectors with subword information //Transactions of the Association for Computational Linguistics. – 2017. – Т. 5. –

С. 135-146.

(18) Pennington J., Socher R., Manning C. D. Glove: Global vectors for word representation //Proceedings of the 2014 conference on empirical methods in natural language processing (EMNLP). – 2014. – С. 1532-1543.

(19) Kim Y. Convolutional neural networks for sentence classification //arXiv preprint arXiv:1408.5882. – 2014.

(20) Jacovi A., Shalom O. S., Goldberg Y. Understanding convolutional neural networks for text classification //arXiv preprint arXiv:1809.08037. – 2018.

(21) Peters M. E. et al. Deep contextualized word representations //arXiv preprint arXiv:1802.05365. – 2018.

(22) Vaswani A. et al. Attention is all you need //Advances in neural information processing systems. – 2017. – С. 5998-6008.

(23) Devlin J. et al. Bert: Pre-training of deep bidirectional transformers for language understanding //arXiv preprint arXiv:1810.04805. – 2018.

(24) Chawla N. V. et al. SMOTE: synthetic minority over-sampling technique //Journal of artificial intelligence research. – 2002. – Т. 16. – С. 321-357.

(25) Sennrich R., Haddow B., Birch A. Improving neural machine translation models with monolingual data //arXiv preprint arXiv:1511.06709. – 2015.

(26) Edunov S. et al. Understanding back-translation at scale //arXiv preprint arXiv:1808.09381. – 2018.

(27) Yu A. W. et al. Qanet: Combining local convolution with global self-attention for reading comprehension //arXiv preprint arXiv:1804.09541. – 2018.

(28) Xie Q. et al. Unsupervised data augmentation for consistency training. –

2019.

(29) Lemaître G., Nogueira F., Aridas C. K. Imbalanced-learn: A python toolbox to tackle the curse of imbalanced datasets in machine learning //The Journal of Machine Learning Research. – 2017. – Т. 18. – №. 1. – С. 559-563.

(30) https://github.com/scikit-learn-contrib/imbalanced-learn

(31) Joulin A. et al. Bag of tricks for efficient text classification //arXiv preprint arXiv:1607.01759. – 2016.

(32) https://fasttext.cc

(33) Wolf T. et al. Huggingface’s transformers: State-of-the-art natural language processing //ArXiv, abs/1910.03771. – 2019.

(34) https://github.com/huggingface/transformers

(35) Ott M. et al. fairseq: A fast, extensible toolkit for sequence modeling //arXiv preprint arXiv:1904.01038. – 2019.

(36) https://github.com/pytorch/fairseq

Вам подходит эта работа?

Похожие работы

Информационные технологии

Информационные технологии юр Синергия / МТИ / МОИ / МосАП

150 ₽

Emir22

Тест Тест

3 Мая в 14:36

3 +3

0 покупок

Информационные технологии

💯 Введение в технологию блокчейн.фит_БАК — ответы на тест Синергия / МОИ / МТИ / МосАП

300 ₽

k4linkin

Тест Тест

3 Мая в 13:46

4 +4

0 покупок

Информационные технологии

Современные технологии предоставили людям доступ к множеству удобств

130 ₽

Aleks_Cash

Эссе Эссе

2 Мая в 16:49

5 +5

0 покупок

Информационные технологии

[Росдистант] Информационные технологии в сфере безопасности (промежуточные) 2024

200 ₽

artur851

Тест Тест

2 Мая в 15:07

11 +4

0 покупок

Информационные технологии

Управление большими данными. Синергия. Ответы на КОМПЕТЕНТНОСТНЫЙ ТЕСТ

250 ₽

Anna_Bond

Тест Тест

2 Мая в 13:28

13 +7

0 покупок

Другие работы автора

Дизайн

ПЕРЕГОРОДКИ В СТИЛЕ «САФАРИ»

800 ₽

user242482

Курсовая работа Курсовая

6 Июл 2023 в 00:04

127 +2

0 покупок

Информационные технологии

Особенности работы беспроводных информационных технологий Информационные технологии

550 ₽

user242482

Курсовая работа Курсовая

5 Июл 2023 в 23:59

211 +1

0 покупок

Менеджмент

Оперативное планирование с применением Lean-технологий в ООО «Со-кольский Лесхоз», р. п. Сокольское Нижегородской области» Княгининского района Нижегородской области

550 ₽

user242482

Курсовая работа Курсовая

5 Июл 2023 в 23:55

159 +1

0 покупок

Водный транспорт

Управление судами и подготовка их к выполнению перевозок на т/х «Краснодон», на участке р.Енисей, используя эффективность СЭУ.

2 500 ₽

user242482

Дипломная работа Дипломная

30 Янв 2023 в 15:52

162 +2

0 покупок

Нефтегазовое дело

Технологии строительства эксплуатационной скважины с горизонтальным окончанием №119 на нефть, глубиной 2400 метров на Приобском месторождении ХМАО с применением бурового раствора на углеводородной основе.

5 000 ₽

user242482

Дипломная работа Дипломная

30 Янв 2023 в 15:47

133 +1

0 покупок

Социология

Социальная политика в США в условиях глобализации: эволюция и противоречия

2 500 ₽

user242482

Дипломная работа Дипломная

30 Янв 2023 в 15:04

188

0 покупок

Уголовное право

Воинские преступления

450 ₽

user242482

Курсовая работа Курсовая

23 Янв 2023 в 15:06

266 +3

1 покупка

Философия

Онтологическая настроенность в видеоиграх: смех и жуть

1 500 ₽

user242482

Курсовая работа Курсовая

23 Янв 2023 в 14:57

207 +3

0 покупок

Животноводство

Методы диагностики и лечения мастита в условиях ООО «Экониваагро – восточное», Бобровский район Воронежской области.

2 500 ₽

user242482

Дипломная работа Дипломная

23 Янв 2023 в 14:45

177 +1

0 покупок

Электроснабжение

Надежность и диагностика систем электроснабжения при выборе оптимальных технических решений

450 ₽

user242482

Курсовая работа Курсовая

21 Янв 2023 в 22:58

219 +1

1 покупка

Техническое обслуживание и ремонт автомобилей

Участок по капитальному ремонту ДВС

550 ₽

user242482

Курсовая работа Курсовая

21 Янв 2023 в 22:53

180 +2

0 покупок

Макроэкономика

Рынок заемных средств и особенности формирования процентных ставок в российской экономике

450 ₽

user242482

Курсовая работа Курсовая

21 Янв 2023 в 22:45

142 +1

0 покупок

История

Женщины в Отечественной войне 1812 года

550 ₽

user242482

Курсовая работа Курсовая

21 Янв 2023 в 22:39

113 +1

0 покупок

Реклама и PR

Исследование отношения потребителей к промо-акциям предприятия

550 ₽

user242482

Курсовая работа Курсовая

2 Окт 2022 в 14:06

163 +1

0 покупок

Стратегический менеджмент

Формирование корневых компетенций организации

550 ₽

user242482

Курсовая работа Курсовая

19 Сен 2022 в 16:06

173 +1

0 покупок

Гражданское право

Третьи лица в исковом судопроизводстве

500 ₽

user242482

Курсовая работа Курсовая

19 Сен 2022 в 16:01

183 +1

1 покупка

Реклама и PR

Исследование контента предприятия и его конкурентов в социальной сети инстаграм

500 ₽

user242482

Курсовая работа Курсовая

19 Сен 2022 в 15:54

172 +1

0 покупок

Реклама и PR

Создание сайта и бумажной рекламной продукции для салон-парикмахерских «ALASKA»

500 ₽

user242482

Курсовая работа Курсовая

19 Сен 2022 в 15:49

214 +1

0 покупок

Педагогическая психология

Психолого-педагогические факторы формирования феномена групповой сплочённости

600 ₽

user242482

Курсовая работа Курсовая

19 Сен 2022 в 15:46

199 +1

0 покупок

Лексикология

ФОРМИРОВАНИЕ ЛЕКСИЧЕСКИХ НАВЫКОВ ОБУЧАЮЩИХСЯ НА ОСНОВЕ ИГРОВЫХ ТЕХНОЛОГИЙ НА СРЕДНЕМ ЭТАПЕ ОБУЧЕНИЯ

2 500 ₽

user242482

Дипломная работа Дипломная

19 Сен 2022 в 15:28

178 +1

0 покупок

Предыдущая работа

Как называется способность материала формы противостоять разрушению при транспортировке и заливке?

Следующая работа

Подлежащее групповых статистических таблиц содержит

Закажите новую работу, выполненную по вашим требованиям у эксперта.

Темы журнала

Статьи справочника

Прямой эфир