Как классифицировать и понимать эмоции людей, использующих жаргон чатов и текстовых сообщений и смайлики?

Я ищу научные рецензируемые статьи, в которых обсуждается обработка естественного языка (НЛП) с использованием жаргона/акронимов в чате или текстовых сообщениях, а также влияние участников чата на основе языка и смайликов. У кого-нибудь есть хорошая рекомендация?

Я уже знаком с недавней работой , связанной с использованием Твиттера для оценки общего настроения общества как средства прогнозирования фондового рынка. Они использовали Google-профиль состояний настроения (GPOMS), который измеряет настроение как Спокойное, Бдительное, Уверенное, Жизненно важное, Доброе или Счастливое. Я ищу другие примеры, которые оценивают общий аффект, в идеале применяя более научные психометрические тесты к НЛП.

Я не пытаюсь использовать данные для предсказания. Я пытаюсь использовать алгоритмы машинного обучения для классификации/категоризации разговоров.

Использованная литература:

Боллен Дж., Мао Х., Цзэн XJ. (2011). Настроение Twitter предсказывает фондовый рынок. Журнал вычислительной науки, 2 (1), 1-8. [ДОИ]

Just of todays findings: "Cooooooooooooooollllllllllllll!!!!!!!!!!!!!! Using Word Lengthening to Detect Sentiment in Microblogs" (I haven't it yet, but its title is so charming that I didn't the прошу выложить сюда).
У Microsoft Cognitive Sciences есть API для этого, хотя я думаю, что он предназначен для обычных слов: text-analytics-demo.azurewebsites.net
Спасибо @RJB - я проверю это. В эти дни я также обнаружил Lexalytics

Ответы (2)

Область, в которой выполняется описанная вами работа, — это анализ настроений . Из Википедии:

Основная задача анализа настроений — классифицировать полярность данного текста на уровне документа, предложения или характеристики/аспекта — независимо от того, является ли выраженное мнение в документе, предложении или характеристике/аспекте объекта положительным, отрицательным или нейтральным. Расширенная классификация чувств «вне полярности» рассматривает, например, такие эмоциональные состояния, как «сердитый», «грустный» и «счастливый».

Из вводного курса (много хороших ссылок на этой странице)

Эта работа относится к общей области анализа настроений, извлечения или извлечения мнений, а также обобщения мнений на основе характеристик из пользовательского контента или пользовательских медиа в Интернете, например, обзоров, форумов и групповых обсуждений, а также блогов. В нашем КДД-2004(Миньцин Ху и Бинг Лю. «Изучение и обобщение отзывов клиентов». Материалы международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных, Сиэтл, Вашингтон, США, 22–25 августа 2004 г.). Модель, основанная на анализе мнений, которая теперь также называется анализом мнений на основе аспектов (поскольку термин «функция» здесь может быть спутан с термином «функция», используемым в машинном обучении). Результатом такого анализа мнений является сводка мнений, основанная на функциях, или сводка мнений, основанная на аспектах. Эта область также связана с классификацией настроений. Наша текущая работа ведется по двум основным направлениям, которые отражают два вида мнений (или оценок):

  • Добыча обычных (или прямых) мнений. Пример: (1). Эта камера великолепна. (2). После приема препарата у меня появились боли в желудке.
  • Сравнительные мнения по добыче полезных ископаемых. Пример: Кока-кола вкуснее, чем пепси.

Что касается ваших фактических целей, прокрутите вниз до дополнительных баллов на этой странице, и вы найдете упражнение, которое проходит по сценарию, близкому к тому, что вы описываете с помощью смайликов.

Что касается рецензирования, Chmiel A, Sienkiewicz J и др. (2011). Коллективные эмоции в сети и их влияние на жизнь сообщества, PLoS One, 6(7), e22207. PDF . Я уверен, что в основных журналах по НЛП есть и другие, но мне не хватает базы данных, в которой они перечислены.

Я бы искал в теме аффективных вычислений , особенно в обнаружении и распознавании эмоциональной информации , а затем специализировался бы на методах НЛП в этой области.

Вот несколько интересных статей:

Визуализация аффективной структуры текстового документа

Модель восприятия текстового аффекта с использованием реальных знаний

Заурус: эмоционально взвешенный тезаурус


Использованная литература:

Гулдстон Дж., Лю Х., Либерман Х., Исии Х. (2006). Заурус: эмоционально взвешенный тезаурус. Вычислительная эстетика: подходы искусственного интеллекта к красоте и счастью , Технический отчет WS-06-04.

Лю, Х., Селкер, Т., Либерман, Х. (2003). Визуализация эмоциональной структуры текстового документа. Материалы конференции по человеческому фактору в вычислительных системах , CHI 2003, 5-10 апреля 2003 г., Ft. Лодердейл, Флорида, США. ACM 2003, ISBN 1-58113-637-4, стр. 740-741.

Лю, Х., Либерман, Х., Селкер, Т. (2003). Модель восприятия текстового аффекта с использованием реальных знаний. Материалы Международной конференции 2003 г. по интеллектуальным пользовательским интерфейсам , IUI 2003, 12-15 января 2003 г., Майами, Флорида, США. ACM 2003, ISBN 1-58113-586-6, стр. 125-132. Майами, Флорида.