سال انتشار:
2018
ترجمه فارسی عنوان مقاله:
شناسایی زبان خشونت آمیز (پرخاشگرانه) با استفاده از ویژگی های جداساز (تعبیه شده) و احساسی
عنوان انگلیسی مقاله:
Aggressive language identification using word embeddings and sentiment features
منبع:
Proceedings of the First Workshop on Trolling, Aggression and Cyberbullying, pages 113–119 Santa Fe, USA, August 25, 2018:
نویسنده:
Constantin Orasan
چکیده انگلیسی:
This paper describes our participation in the First Shared Task on Aggression Identification. The method proposed relies on machine learning to identify social media texts which contain aggression. The main features employed by our method are information extracted from word embeddings and the output of a sentiment analyser. Several machine learning methods and different combinations of features were tried. The official submissions used Support Vector Machines and Random Forests. The official evaluation showed that for texts similar to the ones in the training dataset Random Forests work best, whilst for texts which are different SVMs are a better choice. The evaluation also showed that despite its simplicity the method performs well when compared with more elaborated methods.
چکیده فارسی:
این مقاله مشارکت ما را در اولین تکلیف مشترک در شناسایی پرخاشگری توصیف میکند. روش پیشنهادی متکی بر یادگیری ماشین برای شناسایی متن های رسانهای اجتماعی است که دارای پرخاشگری هستند. ویژگی های اصلی مورد استفاده در روش ما اطلاعات استخراج شده از کلمه جداساز و خروجی آنالیز احساسی میباشد. چندین روش یادگیری ماشین و ترکیبهای مختلف ویژگی ها امتحان شدند. ملاحظات رسمی از ماشینهای بردار پشتیبان و جنگلهای تصادفی استفاده کرد. ارزیابی رسمی نشان داد که برای متون مشابه آنهایی که در مجموعه داده آموزشی هستند، جنگلها به بهترین نحو کار میکنند، در حالی که برای متونی که svmها متفاوت هستند انتخاب بهتری هستند. این ارزیابی همچنین نشان داد که با وجود سادگی روش، این روش در مقایسه با روش های دقیقتر عملکرد خوبی دارد.
حجم فایل: 150 کیلوبایت
قیمت:
26250 تومان
21000 تومان
(20 % تخفیف)
توضیحات اضافی:
تعداد نظرات : 0