Меню
Лотем Пелед. Фото: Технион

Без смайликов: студентка Техниона научила компьютер чувствовать сарказм

Автоматическое распознавание эмоций в тексте - очень сложная задача. Новая компьютерная система, созданная студенткой Техниона, поможет среди прочего людям с аутизмом и синдромом Аспергера

Лотем Пелед. Фото: пресс-служба Техниона
Лотем Пелед. Фото: пресс-служба Техниона
 

Автоматическое распознавание эмоций в тексте является очень сложной задачей. Над ее решением работает много исследователей по всему миру - как из-за коммерческого потенциала, так и из научного интереса. Идентификация эмоций может служить социальным и коммерческим целям, улучшить связь между человеком и компьютером, помочь людям, которые используют социальные сети.

 

Несмотря на значительное продвижение в этой области и успехи в анализе эмоций, существующие приложения не умеют понимать сарказма, заложенного автором. Например, если мы буквально интерпретируем саркастическую запись в твиттере "Новый фильм "Форсаж" - ну просто отличный", то полностью потеряем ее суть.

 

Лотем Пелед, которая учится на вторую академическую степень на факультете промышленной инженерии в Технионе, разработала систему для интерпретации саркастических замечаний. Эта система, созданная под руководством профессора Рои Райхерта, называется "sarcasm SIGN" (Sarcasm Sentimental Interpretation GeNerator).

 

По словам Пелед, "есть много систем по выявлению сарказма, но это первая, которая интерпретирует сарказм в письменном тексте. Мы надеемся, что в будущем она поможет среди прочего людям с аутизмом и синдромом Аспергера, которые испытывают трудности с восприятием сарказма, иронии и юмора".

 

Новая система основана на машинном переводе, но превращает саркастические высказывания в простые повествовательные, свободные от сарказма. Упомянутая фраза "Новый фильм "Форсаж" - ну просто отличный" будет переведена так: "Новый фильм "Форсаж" – ужасен".

 

Для того чтобы обучить систему пониманию сарказма, исследователи собрали базу данных из 3000 саркастических твитов, помеченных именно как таковые (#sarcasm) своими авторами. Система была протестирована судьями-людьми, и было найдено, что в большинстве случаев она дает истинное понимание высказывания - как семантически, так и грамматически.

 

Лотем Пелед представит свое исследование на престижной конференции Association for Computational Linguistics (ACL 2017) – которая будет проходить в августе в Ванкувере (Канада).

 

  Вернуться на главную страницу

 

 новый комментарий
Предостережение
Стереть ваш текущий комментарий