Nowadays, the rapid growth of the Internet and its easy access in everywhere, has made significant advances in e-commerce services, which only make it easy for people to access the goods and services online, but also brings the e-commerce into social media. People become more and more aware of the strengths and weaknesses of each product through social media. Potential buyers are well researched before buying anything. As a result online reviews are powerful sources for industry owners and buyers. Based on statistics; for nearly 9 in 10 consumers, an online review is as important as a personal recommendation. However these recommendation are not reliable enough. Occasionally, opportunistic people are trying to destructing or promoting of their desired product by publishing fake comments which are named spam opinion. So far, many models have been developed to detect spam opinions, but none have addressed the issue of spam attack which is a way that a smart spammer named the spam attacker can deceive the system in a way in which he can continue generating spams without the fear of detecting and blocking by the system. If a spam detection method is not robust enough against these types of attacks, the collected opinions are not reliable. In this paper, the deception of spam detection methods is discussed. Moreover the paper proposed a robust graph-base spam detection method. The proposed method respectively estimates honesty, trust and reliability values of reviews, reviewers, and products considering possible deception scenarios. The paper also present the efficiency of the proposed method compared other graph-base methods using some case studies.
ارائه یک روش مقاوم در برابر فریب جهت شناسایی نظرات اسپم
زلیخا رحمانیان، بهمن 1397
امروزه ردپای تجارت الکترونیک علاوه بر وبسایتهای خریدوفروش کالا و ارائهدهندگان خدمات، در شبکههای اجتماعی نیز قابل مشاهده است. از طرفی رشد سریع اینترنت و دسترسی آسان آن در تمامی نقاط، باعث شده است مردم بتوانند بهراحتی کالاها و مایحتاج خود را بهصورت آنلاین خریداری کنند دراینبین نظرات کاربران هم برای صاحبان صنعت و هم برای خریداران کالاها بسیار ارزشمند و تأثیرگذار است. روزبهروز افراد نسبت به خریدهای اینترنتی آگاهتر و هوشیارتر میشوند. خریداران بالقوه قبل از خرید بهخوبی تحقیق و جستجو میکنند. اما دراینبین کم نیستند افرادی که با تولید نظرات اسپم بر صحت و اعتبار نظرها تأثیر سو میگذارند. تاکنون کارهای زیادی در زمینه شناسایی نظرات اسپم انجام شده است. اکثر کارهای اولیه از طریق محتوای نظرات، شباهت نظرات و ویژگیهای زبانی به شناسایی نظرات اسپم میپردازند. اگرچه روشهای اولیه ارزشمند هستند اما توسط اسپمرهای هوشمند بهراحتی قابل فریب خوردن هستند. منظور از فریب این است که اسپمر هوشمند با آگاهی از روشهای شناسایی اسپمرها بهراحتی میتواند آنها را دور بزند. در این پایاننامه دو نوع فریب معرفی شده است: فریب در طول و فریب در عرض. علاوه بر روشهای مبتنی بر متن که بهراحتی با تغییر متن نظرات قابل فریب خوردن هستند روشهای مبتنی بر گراف نیز از این دو طریق قابل فریب خوردن هستند. در ادامه سعی شده است روشی مبتنی بر گراف ارائه شود که در برابر حملههای فریبکارانه اسپمرها مقاوم عمل میکند. گراف روش پیشنهادی متشکل از سه نود نظر، نظر دهنده و محصول است و از طریق روابط این نودها با یکدیگر نمره صداقت نظرات، اعتماد نظردهندگان و اعتبار محصول محاسبه و در نهایت نظر دهنده اسپمی شناسایی میشود. این مدل با چند مدل مبتنی بر گراف دیگر مقایسه شده و نتایج نشان میدهد همچنان الگوریتم جدید ارائه شده بهبود یافته و نتایج بهتری حاصل شده است.