WWW.LIBRUS.DOBROTA.BIZ
БЕСПЛАТНАЯ  ИНТЕРНЕТ  БИБЛИОТЕКА - собрание публикаций
 


«ОТЗЫВОВ НА ОСНОВЕ ИНТЕРНЕТ-РЕСУРСА ЯНДЕКС.МАРКЕТ Чечнева Н.С. (chechnevanadegda Санкт-Петербургский государственный университет, Санкт-Петербург, Россия В ...»

СЛОВАРЬ ОЦЕНОЧНОЙ ЛЕКСИКИ ПОТРЕБИТЕЛЬСКИХ

ОТЗЫВОВ НА ОСНОВЕ ИНТЕРНЕТ-РЕСУРСА ЯНДЕКС.МАРКЕТ

Чечнева Н.С. (chechnevanadegda@mail.ru)

Санкт-Петербургский государственный университет, Санкт-Петербург,

Россия

В докладе описывается создание словаря оценочной лексики потребительских отзывов .

Корпус отзывов сформирован на основе интернет-ресурса Яндекс.Маркет. На первом

этапе извлекаются оценочные слова или словосочетания и относящиеся к ним оцениваемые параметры. На втором этапе полученные оцениваемые параметры группируются во взаимосвязанные семантические категории, упорядоченные по иерархическому принципу. Затем полученный словарь был расширен автоматически на основании правил. В результате был получен тезаурус, в котором каждой семантической категории соответствуют перечни оценочных слов или словосочетаний с указанием полярности (положительной или отрицательной) .

Ключевые слова: словарь, тезаурус, оценочная лексика, анализ тональности, интернетмагазин, Яндекс-маркет, потребительские отзывы

THE LEXICON OF SENTIMENT-RELATED WORDS IN PRODUCT

REVIEWS ON THE BASIS OF THE INTERNET RESOURCE

YANDEX.MARKET

Chechneva N. S. (chechnevanadegda@mail.ru) St. Petersburg State University, St. Petersburg, Russia The paper describes the creation of the lexicon of sentiment-related words in customer product reviews .
The corpus of reviews is formed on the basis of the online store Yandex.Market. At the first stage, the sentiment-related words or phrases and the estimated parameters related to them are extracted. At the second stage, the evaluated parameters are grouped into interrelated semantic categories arranged in a hierarchical manner. Then the resulting lexicon was expanded automatically based on the list of rules. As a result, a thesaurus was obtained in which each semantic category corresponds to lists of sentiment-related words or phrases with attribution of polarity (positive or negative) .

Key words: lexicon, thesaurus, sentiment-related words, sentiment analysis, online store, Yandex.Market, customer product reviews

1. Введение В последние годы происходит бурное развитие интернета, в том числе его русскоязычного сегмента. В своей повседневной жизни мы каждый день сталкиваемся с оценками: читаем отзывы, прежде чем что-нибудь купить, ставим «лайки», пишем комментарии, читаем новости, оставляем записи в блогах. Нас окружает мир оценок, рейтинговый мир. Общество в современном мире в большой мере подвержено оценочной деятельности сознания в культуре и дискурсе, и это явление можно проанализировать, изучив оценочную лексику русского языка .

Категория оценки является предметом изучения широкого круга наук: от философии и аксиологии до психологии, политологии и лингвистики. Семантика оценки включает в себя систему ценностей окружающего мира и ценность человека в нем, выраженные в единицах языка. Лингвистика изучает такие средства и способы выражения оценок в тексте и речи на всех уровнях языка: фонетическом, морфологическом, лексическом, синтаксическом .

На фонетическом уровне оценка может быть выражена звукоподражаниями, ритмоподражаниями, фонетическими каламбурами, а также аллитерацией или ассонансом. То есть определенные сочетания гласных и согласных звуков, находясь во взаимодействии с другими языковыми средствами, создают нужный психоэмоциональный фон. Фонетические единицы языка прямую оценку не выражают, а лишь косвенно влияют на восприятие высказывания .





На уровне морфологии положительная или отрицательная оценка может быть представлена суффиксами субъективной оценки, которые придают словам различные оттенки (ласкательное, сочувствия, пренебрежения, презрения, уничижения, иронии, также реального уменьшения или увеличения) .

На синтаксическом уровне оценки явно не выражаются. Синтаксические конструкции могут только усиливать то или иное (положительное или отрицательное) восприятие адресантом отношения субъекта речи к ее объекту .

Наиболее ярко и полно оценки могут быть выражены на лексическом уровне .

Лексические единицы языка с оценочным компонентом значения эксплицитно могут выражать положительную или отрицательную оценку в тексте или речи, а выбор того или иного слова напрямую оказывает воздействие на восприятие адресантом высказывания .

Интерес к изучению оценочной лексики можно объяснить следующими причинами:

Во-первых, возможность использования анализа оценочной лексики в практических целях. Например, в области маркетинга анализ оценочной лексики в отзывах на товары и услуги позволяет производителям узнать, как потребители относятся к их товарам. Изучая лексику с оценочным значением в текстах СМИ и социальных медиа, можно определить, как преподносятся разные социально значимые темы, и, соответственно, как они воспринимаются людьми. Психологи, анализируя комментарии человека в социальных сетях, могут составить его психологический портрет .

Во-вторых, по данным некоторых исследований, в русском языке доля лексических единиц, обладающих оценочным компонентом значения, достигает 40%, но при этом словарей оценочной лексики существует немного [Tikhonova M.A. 2015] .

Одним из примеров практического применения оценочной лексики является анализ тональности Анализ тональности (сентимент-анализ) или [Liu B.2012] .

автоматизированный анализ эмоциональной окраски текстов (хорошо/плохо, нравится/не нравится и т.д.) – одна из областей компьютерной лингвистики, которая занимается анализом оценок, мнений, чувств и эмоций людей по отношению к различным объектам .

Анализ тональности позволяет узнать, не что говорят о каком-то объекте, а насколько эмоционально о нем говорят [Pang B., Lee L. 2008] .

Основные подходы к автоматическому определению тональности текста можно разделить на две большие группы [Khokhlova M.V 2017]. Подходы первой группы основаны на применении методов машинного обучения, вторая группа методов использует словари оценочной лексики и правила. У каждого из подходов есть свои достоинства и недостатки .

Подходы первой группы требуют наличия размеченных коллекций текстов для тренировки моделей машинного обучения. Кроме того, многие существующие программы доступны только для английского языка. Но зато они не требуют больших затрат сил и времени .

Подходы второй группы не предполагают размеченных коллекций текстов и показывают хорошие показатели точности. Но зато они весьма трудоемки и сильно зависят от предметной области .

Для русского языка чаще всего используется второй подход, поскольку для русского языка существует немного доступных размеченных корпусов [Menshikov I.L., 2012] .

Все вышесказанное делает в настоящее время задачу создания словарей оценочной лексики еще более актуальной .

2. Словари оценочной лексики Разработке словарей оценочной лексики, как важному компоненту систем анализа тональности, посвящено много исследований. Такие словари могут быть, например, представлены в виде списка слов с указанием рассчитанной вероятности их быть оценочными. Чаще всего словари используются в сочетании с правилами. Правила представляют собой какие-то условия. Например, «если предложение содержит глагол из списка «обожать», «любить», «нравится» и не содержит отрицательную частицу «не», то считать полярность этого предложения положительной». Большая часть существующих словарей оценочной лексики была создана для английского языка .

Одним из примеров такого словаря может служить словарь оценочной лексики английского языка MPQA [Wilson et al., 2005]. В словаре представлено более 8000 оценочных слов. Каждое слово в словаре имеет указание полярности (положительная, отрицательная или нейтральная), а также силы оценочного содержания (сильное или слабое) .

Другим примером словаря оценочной лексики является англоязычный словарь AFINN, который был создан вручную [Nielsen, 2012]. Данный словарь был дополнен нецензурными и сленговыми выражениями с целью получения лучшего результата при автоматическом анализе сообщений в социальных сетях. Его объем — около 2400 слов .

Каждому слову приписано числовое значение полярности. Так, слова с самой высокой положительной оценкой имеют значение полярности, равное +5, а слова с резко отрицательным значением имеют значение полярности, равное -5 .

Словарь SentiWordNet [Baccianella et al., 2010] был создан на основе автоматической разметки синонимических рядов тезауруса английского языка WordNet:

каждому ряду были приписаны три числа (доля положительной, отрицательной и нейтральной оценки слов из данного синонимического ряда). Следовательно, многозначные слова могут иметь разные оценки тональности .

Для русского языка известны словари оценочной лексики РуСентиЛекс [Loukachevitch N.V., 2016] и ProductSentiRus [Loukachevitch N.V., 2015] .

РуСентиЛекс был создан автоматическим образом из нескольких источников:

оценочные слова из тезауруса РуТез, сленговые слова из Твиттера и слова с позитивными или негативными коннотациями из корпуса новостей. Словарь содержит более десяти тысяч слов и выражений, выражающих некоторую оценку .

Словарь ProductSentiRus был получен применением обученной модели к наборам отзывов в нескольких предметных областях. Словарь представлен как список 5 тысяч слов, упорядоченных по мере снижения вычисленной вероятности их оценочности без указания позитивной или негативной тональности .

Многие исследователи пытались решить проблему создания словарей оценочной лексики для нескольких языков .

В работе [Steinberger, J.,2012] описывается опыт создания словарей для нескольких языков, основанный на методе триангуляции. Материалом для исследования была коллекция новостных текстов. На первом этапе работы авторы создали словари оценочной лексики высокого уровня для двух языков (английский и испанский), затем переводили их на третий язык (например, французский). Перевод выполнялся автоматически с помощью сервиса Google translate. Те слова, которые встречались в обоих списках слов, переведенных с двух языков, были использованы в качестве основы для словаря на третьем языке. Затем полученный перечень подвергался корректировке: нерелевантные слова исключались, добавлялись морфологические словоформы. Такой параллельный словарь был подготовлен для восьми языков: английского, испанского, арабского, чешского, французского, немецкого, итальянского и русского .

Работа [Volkova, S 2013] также посвящена описанию подхода к созданию словарей оценочной лексики для нескольких языков. Основой метода послужила техника бутстрэппинг. Авторы анализировали публикации в социальных медиа на примере Твиттера. Для своего эксперимента авторы использовали две тысячи размеченных твитов для запуска процедуры бутстрэппинга, две тысячи размеченных твитов для оценки работы алгоритма и один миллион неразмеченных для анализа. Каждый твит размечался пятью независимыми экспертами с ресурса Amazon Mechanical Turk. В итоге, твиту приписывалась та оценка, которую поставило большинство. Для создания исходного словаря оценочной лексики они использовали разработанный ранее словарь MPQA и небольшой набор размеченных вручную твитов. Затем выполнялась процедура бутстрэппинга: на вход алгоритма поступал неразмеченный твит. Если данный твит содержал хотя бы одно слово из первоначального словаря, то твит считался оценочным .

Затем для каждого слова в данном твите вычислялась его вероятность быть оценочным .

Все новые оценочные слова с их удельными весами добавлялись в исходный словарь .

Следующая итерация бутстрэппинга выполнялась уже на основе нового расширенного словаря. И процедура повторялась. Таким образом был подготовлен словарь для трех языков: английского, испанского и русского .

Многие словари оценочной лексики позволяют осуществлять классификацию текстов по тональности лишь по двум полярным категориям — «положительная» и «отрицательная» .

Для более глубокого анализа тональности текстов требуется создание более сложных словарей. В своем исследовании мы поставили задачу получить такой словарь, который позволял бы определить не только нравится или не нравится субъекту какой-то объект, но и что именно в этом объекте ему нравится, а что нет. Такую задачу можно решить только при использовании словарей-тезаурусов с семантическими связями между единицами словаря, разработанных для конкретных предметных областей .

3. Создание словаря оценочной лексики

Материал исследования 3.1 .

В качестве базы для исследования были использованы отзывы на товары, размещенные на портале Яндекс.Маркет. Отзывы как материал для исследования были выбраны потому, что они представляют собой тексты с высокой концентрацией оценочной лексики. В качестве группы товаров были выбраны кофемашины, т.к. они представляют собой изделие средней технической сложности, которым может пользоваться широкий круг потребителей, а не только узкие специалисты .

Отзывы, как правило, содержат следующие компоненты:

Субъект мнения – чаще всего, это автор отзыва;

Объект мнения – то, чему посвящен отзыв (продукт или услуга);

Аспект объекта – это какие-то характеристики, признаки объекта;

Оценочный компонент – собственно оценки, мнения, чувства субъекта по поводу объекта или аспекта;

Дата и время, в которое был написан отзыв .

Все пять компонентов тесно взаимосвязаны друг с другом .

Для извлечения отзывов была разработана программа на python, использующая API Яндекс.Маркета. Отзывы извлекались в формате json, метаинформация сохранялась для дальнейшего анализа, а для составления словаря использовался непосредственно сам текст отзывов .

Таким образом, был получен корпус общим объемом 3850 отзывов (368193 словоупотребления) .

Этапы разработки словаря 3.2 .

Создание словаря происходило в несколько этапов. На первом этапе извлекались оценочные слова или словосочетания и относящиеся к ним оцениваемые параметры. Для этого вручную была проанализирована часть отзывов по следующей схеме: отдельно выписывалось оценочное слово или словосочетание и отдельно – оцениваемый параметр, т.е. то, к чему эта оценка относится. Кроме того, у оценочного слова сразу же определялась полярность – положительная или отрицательная.

Например:

Вкусный кофе (+), страшный шум (-)(1)

Оценочное слово вкусный относится к оцениваемому параметру кофе и обладает положительной полярностью (+). Оценочное слово страшный относится к оцениваемому параметру шум и обладает отрицательной полярностью (-) .

На втором этапе полученные оцениваемые параметры были сгруппированы во взаимосвязанные семантические категории, упорядоченные по иерархическому принципу (Рис.1). На первом уровне иерархии все оцениваемые параметры делятся на две большие группы: объект оценки (изделие) и сам субъект оценки (автор отзыва). При этом, категория «объект оценки (изделие)» включает в себя семантические категории второго уровня, такие как «внешний вид», «функциональность», «эксплуатация», «цена», «уход» и т.д. Семантические категории второго уровня, в свою очередь, могут включать в себя категории третьего уровня .

Рис. 1. Группировка оцениваемых параметров в обобщенные семантические категории В результате был получен тезаурус, в котором каждой семантической категории соответствуют перечни оценочных слов или словосочетаний с указанием полярности (положительной или отрицательной) .

Объем словаря после первых двух этапов составил 1500 словарных единиц .

На третьем этапе полученный словарь был дополнен автоматически на основании набора правил .

Во-первых, были использованы правила, учитывающие сочетания лексем. Поиску подлежали такие слова, которые часто сочетаются с оценочными лексемами, т.е. объекты и аспекты, которые оцениваются в отзывах. Добавление таких словосочетаний было сделано автоматически. Для этой проверки все слова были приведены к словарной форме, их частеречная принадлежность была определена с помощью морфологического анализатора pymorphy2 [Korobov, M. 2015] .

Таким образом, автоматически извлекались словосочетания при выполнении правил:

Если Часть речи слова «Х» = Прил. И за этим словом следует слово из списка (2) «кофе», «пенка», «цена», «дизайн», «модель», «машина», «кофемашина», «шум»

Если Часть речи слова «Х» = Нареч. И до/после этого слова следует слово из (3) списка «варить», «готовить», «мыть», «ухаживать», «чистить», «ломаться», «делать», «стоить»

Кроме этого, использовались правила, основанные на поиске слов-операторов, которые усиливают или ослабляют оценочное значение. Такие слова чаще всего являются наречиями, и они практически всегда используются в сочетании с оценочными словами .

Таким образом, извлекались словосочетания при выполнении правила:

Если «Х» – слово из списка «очень», «чрезвычайно», «безумно» «излишне» «чуть»

(4) «достаточно» «недостаточно» «почти» «слишком» «невероятно» «действительно»

«весьма» «самый» «ужасно» И за ним следует словосочетание «Y» (прилагательное) + «Z» (существительное)

–  –  –

Итого, прирост:

Словарной единицей является слово или словосочетание. Слово или словосочетание может быть представлено только лексемами, выражающими оценку, либо лексемой, выражающей оценку, в сочетании с лексемой, обозначающей объект или аспект объекта. Слова не приводились к начальной форме, они представлены в той форме, в которой они чаще всего встречаются в отзыве .

Результаты 3.3 .

Таким образом, был подготовлен тезаурус оценочных слов и словосочетаний, упорядоченных по семантическим категориям трех уровней. Общий объем словаря – 2900 словарных единиц.

Словарь доступен в сети Интернет по адресу:

https://github.com/Chechneva/CoffeeThesaurus. Распределение словарных единиц по семантическим категориям представлено в Таблице 3 .

Таблица 3. Распределение словарных единиц по семантическим категориям

–  –  –

Как видно из Таблицы 4, некоторые слова встречаются в большом количестве категорий, другие же слова представлены только в одной из категорий. Это связано с тем, что существуют «универсальные» оценочные слова, при помощи которых можно описать практически любой объект или аспект, а также есть более специальные оценочные лексемы, которые отражают специфические свойства объекта .

Также необходимо отметить, что среди единиц словаря есть как явные (эксплицитные) оценки:

Ущербный дизайн (-), приятная цена (+) (5)

Так и дескриптивные (имплицитные) оценки:

Дала течь (-), справится даже ребенок (+) (6) Если в явных оценках оценочный компонент выражен прямо, то в дескриптивных он не столь нагляден, однако описанное положение вещей может однозначно расцениваться как хорошее (желаемое) или плохое (нежелаемое) .

Анализируя структуру семантических категорий, можно заметить, что выделенные категории соотносятся с различными традиционными классификациями оценок, предложенными такими учеными как Н.Д. Арутюнова [Arutyunova N.D., 1988], Г. Х. фонВригт [Fon V.G.Kh, 1986], Н. Н. Миронова [Mironova N.N., 1997] .

Сопоставление семантических категорий тезауруса оценочных слов с классификацией оценок Арутюновой представлено в Таблице 5 .

–  –  –

Таким образом, оценки такой узкой предметной области как отзывы на кофемашины во многом носят универсальный характер .

В связи с этим, можно предположить, что другие классы товаров (фотоаппараты, ноутбуки, телефоны и т.д.) будут иметь схожую структуру категорий оценок. В отзывах на них, вероятней всего, также будут встречаться оценки как самих изделий в целом, так и их эксплуатационных свойств, конструкционных характеристик, внешнего вида, цены, ухода, результатов их работы и т.д. Авторы отзывов, с большой долей вероятности, будут описывать свои личные эмоции от опыта использования данных изделий .

Таким образом, полученная нами структура семантических категорий оценок может носить в некоторой степени универсальный характер применительно к отзывам на разные группы товаров .

Экспериментальная проверка 3.4 .

С помощью разработанного нами тезауруса был проведен автоматический анализ тональности. Были проанализированы новые отзывы, не включенные в первоначальный корпус. Результат применения словаря для первых 15 отзывов представлен в Таблице 6 .

Таблица 6. Результаты применения тезауруса оценочной лексики

–  –  –

17955112 2(2;0) 3(3;0) 1(1;0) 1(1;0) 1(1;0) 1(1;0) 9(9;0) 21552269 1(1;0) 1(1;0) 1(1;0) 3(3;0) 26262233 2(2;0) 1(1;0) 3(3;0) 2(2;0) 8(8;0) 29922395 1(1;0) 1(1;0) 1(1;0) 1(1;0) 4(4;0) 29966280 1(1;0) 3(3;0) 1(1;0) 2(2;0) -1(1;-2) 6(8;-2) 31949589 -1(0;-1) 1(1;0) 2(3;-1) 0(1;-1) 2(5;-3) 32461420 -2(0;-2) 1(1;0) 2(2;0) 2(2;0) 3(5;-2) 34561124 1(1;0) 1(1;0) 2(2;0) 1(1;0) 5(5;0) 34579963 1(1;0) -1(0;-1) -1(0;-1) -1(1;-2) 34633602 1(1;0) -1(0;-1) 1(1;0) -1(0;-1) 1(1;0) 1(3;-2) 35054530 1(1;0) -2(0;-2) -1(0;-1) -2(1;-3) 35150814 3(3;0) 1(1;0) -1(0;-1) 2(2;0) 5(6;-1) 36340921 2(2;0) 1(2;-1) 3(4;-1) 36671881 1(1;0) -1(0;-1) 3(3;0) -1(0;-1) 1(1;0) 1(3;-2) 4(8;-4) 36789441 -1(0;-1) 1(1;0) 1(1;0) 1(1;0) 4(1;0) 1(4;0) 7(8;-1) Результат работы представлен в виде матрицы ID отзыва - семантическая категория 2-ого уровня, в которой строкам соответствуют ID отзыва, а столбцам – встречающиеся в них семантические категории. Ячейка таблицы содержит следующие данные:

Первое число в скобках - количество встречаемых словарных единиц из тезауруса с положительной полярностью .

Второе число в скобках - количество встречаемых словарных единиц из тезауруса с отрицательной полярностью .

Число перед скобками - суммарное значение по каждой категории (т.е. сумма двух вышеназванных чисел) .

Кроме этого, была проведена первичная оценка результатов для задачи классификации отзывов по общей полярности. В качестве метрик были выбраны точность (precision) и полнота (recall). Точность в пределах класса – это доля документов, действительно принадлежащих данному классу, относительно всех документов, причисленных к этому классу. Полнота – отношение числа найденных документов, принадлежащих классу, к числу всех документов этого класса .

На точность и полноту тестировалась только правильность определения общей полярности отзывов. Точность и полнота для задачи определения семантических категорий не оценивалась из-за отсутствия размеченного корпуса с указанием семантических категорий. Для тестирования точности и полноты результаты классификации, выполненной при помощи словаря, сравнивались с классификацией, выполненной вручную. Проверка осуществлялась на коллекции из 120 отзывов. Оценка качества результата приведена в Таблице 7 .

–  –  –

Таким образом, применение словаря дает неплохие показатели точности и полноты. Данные показатели получились ниже для отрицательных отзывов. Это можно объяснить тем, что для определения отрицательной полярности помимо самого словаря использовалось лишь одно правило, учитывающее сочетание частицы «не» со словарными единицами .

Для улучшения показателей точности и полноты для отрицательных отзывов требуется разработка новых правил и настройка системы весов для оценочных слов .

4. Заключение Таким образом, данная статья посвящена проблеме разработки тезауруса оценочных слов для заданной предметной области. На основе коллекции из 3850 отзывов на кофемашины был составлен тезаурус оценочных слов и словосочетаний, упорядоченных по семантическим категориям трех уровней, который затем был автоматически расширен с помощью правил. Общий объем словаря составил 2900 словарных единиц .

Первичная оценка результатов показала неплохие значения точности и полноты для задачи классификации отзывов по общей полярности .

В дальнейшем планируется расширить спектр правил и настроить систему весов оценочных слов для улучшения производительности. Кроме этого, планируется более тщательно оценить эффективность тезауруса .

Еще одно направление будущей работы - попытаться адаптировать тезаурус к другим предметным областям .

Литература

1. Arutyunova N.D. Types of language meaning. Estimation. Event. Fact. [Tipy yazykovykh znachenij. Otsenka. Sobytie. Fact.] - Moscow, Nauka, 1988. 346 p .

2. Baccianella, S., Esuli, A., Sebastiani F (2010) SentiWordNet 3.0: An Enhanced Lexical Resource for Sentiment Analysis and Opinion Mining. Proceedings of LREC-2010, Malta, Vol .

10, P. 2200-2204 .

3. Fon V.G.Kh. Logico-philosophical surveys: selected works. [Logiko-filosofskie issledovaniya: izbrannye trudy]. - Moscow, Progress. 1986. 600 p .

4. Khokhlova M.V (2017) Sentiment analysis [Analiz tonalnosti], Applied and computer linguistics [Prikladnaya I komp’uternaya lingvistika], URSS, Moscow, pp 245-258

5. Korobov, M. (2015). Morphological analyzer and generator for Russian and Ukrainian languages, International Conference on Analysis of Images, Social Networks and Texts, Yekaterinburg pp. 320-332

6. Liu B.(2012) Sentiment analysis and opinion mining, Synthesis lectures on human language technologies. Vol. 5. no. 1. pp 1-167 .

7. Loukachevitch N.V., Levchik A.V (2016) Creating Russian sentiment lexicon [Sozdanie leksikona otsenochnykh slov RuSentiLex], Proceedings of the conference “Open Semantic Technologies for Intelligent Systems -2016”, Minsk, pp 377-382

8. Loukashevich N. V., Chetviorkin I. I. (2015) Combining corpus and thesaurus information for extracting sentiment words [Kombinirovanie tesaurusnikh I korpusnikh znanij dlya izvlecheniya otsenochnykh slov], Systems and Means of Informatics [Sistemy i sredstva informatsii], Vol. 25, no. 1, pp. 20-33 .

9. Menshikov I.L., Kudryavtsev A.G. (2012) A review of the systems for sentiment analysis of the text in Russian language [Obzor system analiza tonalnosti teksta na russkom yazike],Young Scientist [Molodoi uchenij]. No. 12, pp 140-143 .

10. Mironova N.N.(1997) Evaluative discourse: problems of sematic analysis. [Otsenochnyi diskurs: problemy semanticheskogo analiza], Izvestiya, literature and language series [Izvestiya Rossiyskoy akademii nauk. Seriya literatury i yazyka]. Vol. 56, No 4. pp. 52-59

11. Nielsen, F. (2012) A new ANEW: Evaluation of a word list for sentiment analysis in microblogs, Proceedings of the ESWC2011 Workshop on 'Making Sense of Microposts': Big things come in small packages, Heraklion, pp 93-98

12. Pang B., Lee L. (2008) Opinion Mining and Sentiment Analysis, Foundations and Trends in Information Retrieval, Vol. 2, no. 1–2, pp. 1–135 .

13. Steinberger, J., Ebrahim, M., Ehrmann, M., Hurriyetoglu, A., Kabadjov, M., Lenkova, P .

& Zavarella, V. (2012). Creating sentiment dictionaries via triangulation. Decision Support Systems, 53(4), 689-694 .

14. Tikhonova M.A. (2015) Sentiment-related words of the Russian language: problems of lexicography [Otsenochnaya leksika russkogo yazyka: problemy leksikografirovaniya], Bulletin of the Moscow State University of Press [Vestnik Moskovskogo universiteta pechati], No. 2., pp 352-358

15. Volkova, S., Wilson, T., & Yarowsky, D. (2013). Exploring sentiment in social media:

Bootstrapping subjectivity clues from multilingual twitter streams. In Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers) Vol .

2, pp. 505-510 .

16. Wilson T., Wiebe J., Hoffmann P. (2005) Recognizing contextual polarity in phrase-level sentiment analysis, Proceedings of the conference on human language technology and empirical methods in natural language processing. Vancouver, pp 347-354 .






Похожие работы:

«Справка по программе "Converter 5.0.0.0" Справка по русской версии программы "Converter 5.0.0.0" Справка по программе "Converter 5.0.0.0" О программе Перед Вами русская версия программы "Converter 5.0.0.0", позволяющая рассчитывать двухтактные автогенераторные преобразователи напряжения по схеме Ройера с насыщающимися...»

«г. Москва 2017 год Договор оферта на прием международного экзамена по английскому языку IELTS Общество с ограниченной ответственностью "Центр поддержки языковых школ и курсов иностранных языков" (ООО "Центр поддержки языковых школ...»

«Волков Виктор Валерьевич ВНУТРЕННЯЯ ФОРМА ТОПОНИМОВ КАК ОСНОВА МИКРОСИСТЕМЫ (НА МАТЕРИАЛЕ ТОПОНИМИЧЕСКОГО ПРОСТРАНСТВА ВЛАДИМИРСКОЙ ОБЛАСТИ Статья посвящена внутренней форме топон...»

«Vestnik slavianskikh kul’tur. 2018. Vol. 49 УДК 398.8 ББК 82.3(2Рос=Рус)-6 This is an open access article distributed under the Creative Commons Attribution 4.0 International (CC BY 4.0) © 2018 г. Т. В. Топорова г. Москва, Россия ЛИНГВИСТИЧЕСКИЙ АНАЛИЗ ОБОЗНАЧЕНИЙ ДОРОГИ, ПУТИ В РУССКИХ...»

«КОЖЕВНИКОВА Татьяна Андреевна РИТОРИЧЕСКИЙ АСПЕКТ АРГУМЕНТАЦИИ В СОВРЕМЕННОМ АМЕРИКАНСКОМ ПОЛИТИЧЕСКОМ ИНТЕРВЬЮ Специальность 10.02.04 — "Германские языки" Диссертация на соискание ученой степени кандидата филологических наук аучный руководитель: Н доктор филологических наук, профес...»

«Паутова Ульяна Владимировна КОНЦЕПТЫ "МУШКАРАЦ" ‘МУЖЧИНА’ И "ЖЕНА" ‘ЖЕНЩИНА’ В СЕРБОХОРВАТСКОМ ЯЗЫКЕ Специальность 10.02.03 – Славянские языки АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата филологических наук Санкт-Петербург Работа выполнена в ФГБОУ ВПО "Санкт-Петербургский государственный универс...»

«465 ПОДХОДЫ К ИССЛЕДОВАНИЮ КОНЦЕПТОВ А.А. Габриелян (Москва, Россия) Разнообразие подходов может способствовать более тщательному и глубокому анализу концептов, которые являются ключевыми для носителей языка. В статье будут рассмотр...»







 
2019 www.librus.dobrota.biz - «Бесплатная электронная библиотека - собрание публикаций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.