سال انتشار:
2013
ترجمه فارسی عنوان مقاله:
تحلیل عقاید چند کلاسه با خوشه بندی و نمایش نمره
عنوان انگلیسی مقاله:
Multi-Class Sentiment Analysis with Clustering and Score Representation
منبع:
2013 IEEE 13th International Conference on Data Mining Workshops
نویسنده:
Mohsen Farhadloo, Erik Rolland
چکیده انگلیسی:
Sentiment analysis or opinion mining is the field
of computational study of people’s opinion expressed in written
language or text. Sentiment analysis brings together various research areas such as natural language processing, data mining
and text mining, and is fast becoming of major importance
to organizations as they integrate online commerce into their
operations. This paper proposes improved methods for aspectlevel sentiment analysis. We propose to utilize bag of nouns
instead of bog of words to improve the clustering results for
aspect identification and a new feature set, score representation,
that leads to more accurate sentiment identification. This
scheme is based upon the three scores (positiveness, neutralness
and negativeness) that are learned from the data for each term.
Using this new score representation scheme, we improve the
performance of 3-class sentiment analysis on sentences by 20 %
in terms of f1-measure, as compared to previously published
research. We demonstrate the usefulness of the methodology
using data from the popular online travel information site
TripAdvisor.com.
Keywords: Sentiment Analysis | Text Mining | User Reviews;
چکیده فارسی:
تحلیل عقاید یا واکاوی عقیده، رشته مطالعه محاسباتی عقیده افراد است که به شکل زبانی یا متن مکتوب بیان شده باشد. تحلیل عقاید، حوزه های مختلفی از تحقیق مثل پردازش زبانی طبیعی، واکاوی داده و واکاوی متن را درکنار هم قرار می دهد و هب سرعت درحال تبدیل شدن به یک رشته بسیار مهم برای سازمان ها می باشد چراکه سازمان ها تجارت آنلاین را وارد عملیات و فعالیتهای خود کرده اند. این مقاله روشهای بهبود یافته ای را برای تحلیل عقاید درسطح جنبه پیشنهاد می دهد. ما برای بهبود نتایج خوشه بندی برای شناسایی جنبه و یک سری مشخصه های جدید، نمایش نمره، استفاده از کیف اسمها را به جای کیف کلمات پیشنهاد می کنیم که منجر به شناسایی دقیق تر عقاید می شود. این طرح مبتنی بر سه نمره است (مثبت بودن، خنثی بودن و منفی بودن) که از داده های به دست آمده برای هر بخش حاصل می شوند. ما با استفاده از این طرح جدید نمایش نمره، عملکرد تحلیل عقاید 3 کلاسه روی جملات را ازنظر سنجه f1، درمقایسه با تحقیق قبلا" چاپ شده تا 20 درصد بهبود می بخشیم. ما مفید بودن روش استفاده از داده های حاصل از سایت مشهور اطلاعات مسافرتی آنلاین TripAdvisor.com را نشان می دهیم.
کلیدواژه ها: تحلیل عقاید | واکاوی متن | بازدیدهای کاربر
حجم فایل: 754 کیلوبایت
قیمت:
14000 تومان
11200 تومان
(20 % تخفیف)
توضیحات اضافی:
تعداد نظرات : 0