Извлечение и использование оценочных слов в задаче классификации отзывов на три класса
Лукашевич Н.В., Четверкин И.И.

Предлагается подход к автоматическому извлечению оценочных слов для заданной предметной области на основе порождения признаков из нескольких текстовых коллекций. Полученные оценочные слова применяются в задаче классификации отзывов на три класса, в которой необходимо разделить отзывы на классы: "понравилось", "понравилось, но есть замечания", "не понравилось". В задаче классификации исследуются разные виды весов для слов, учитываются знаки препинания и слова-операторы, которые могут менять тональность следующих за ними слов. Работа частично поддержана грантом РФФИ № 11-07-00588-а.

Ключевые слова: извлечение знаний из текстов, извлечение оценочных слов, классификация отзывов, машинное обучение

Название статьи, аннотация и ключевые слова на английском языке

Лукашевич Н.В., вед. науч. сотр., e-mail: louk_nat@mail.ru - Научно-исследовательский вычислительный центр, Московский государственный университет им. М.В. Ломоносова, Ленинские горы, д. 1, стр. 4, 119991, Москва;
Четверкин И.И., аспирант, e-mail: ilia2010@yandex.ru - Московский государственный университет им. М.В. Ломоносова, факультет вычислительной математики и кибернетики, Ленинские горы, 119991, Москва