کتاب بهبود ‏ساختار ‏سیستم ‏فازی ‏در ‏متن ‏های ‏شبکه ‏های ‏اجتماعی ‏فارسی ‏به ‏شیوه ‏ی ‏جدید

کتاب بهبود ‏ساختار ‏سیستم ‏فازی ‏در ‏متن ‏های ‏شبکه ‏های ‏اجتماعی ‏فارسی ‏به ‏شیوه ‏ی ‏جدید

139,000 تومان

تعداد صفحات

64

شابک

978-622-378-379-1

فهرست
عنوان صفحه
فصـل اول 1
مقدمه 1
فصـل دوم 3
عقیده کاوی 3
سطوح عقیده کاوی 4
مشکلات عقیده کاوی 5
تقاضا برای تکنیک های عقیده کاوی 6
طبقه بندی و روش ها 7
رویکرد مبتنی بر دانش 7
رویکرد مبتنی بر ارتباط 8
مدل زبان 8
رویکرد مبتنی بر مباحثه 8
مهندسی ویژگی ها 8
حضور یا فراوانی کلمه 9
برچسب زنی اجزای کلام 9
نحو و نفی 9
کارهای مرتبط 9
تفکر فازی 17
تابع عضویت 18
قوانین فازی 19
خوشه بندی کاهشی 21
الگوریتم تکامل تفاضلی 23
مقداردهی اولیه 24
جهش 24
بازترکیبی 25
انتخاب 25
فصـل سوم 27
سیستم پیشنهادی 27
نمایش راه حل ها 29
محاسبه ی تناسب 30
پارامترهای ارزیابی داده کاوی 32
فصـل چهارم 35
محیط شبیه‌سازی 35
مجموعه داده ها 36
لغت نامه 37
بررسی نحوهی بهبود دقت سیستم 38
بررسی تاثیر ابعاد مجموعه داده بر نحوهی بهبود دقت سیستم 39
بررسی منحنی ROC و ماتریس درهم ریختگی 40
مقایسه با سایر کارها 43
فصـل پنجم 47
نتیجه‌گیری 47
منـابع و مآخـذ 49
منابع فارسی 49
منابع غیر فارسی 51

 

 

رویکرد مبتنی بر ارتباط

در اینجا طبقه بندی وظیفه ها را می توان بر اساس روابط مختلفی که در بین امکانات و اجزا وجود دارد، به دست آورد. چنین روابطی شامل روابط بین شرکت کنندگان گفتمان، روابط بین ویژگی های محصول و … می باشد. برای مثال، اگر فردی می خواهد عقیده و احساس مشتریان را در مورد یک برند تجاری بداند، یکی از راه های ممکن در نظر گرفتن آن به عنوان تابعی است از عقیده ی مشتریان روی ویژگی های مختلف آن برند و یا عقیده ی مردم بر روی محصولات و اجزای آن[Gebremeskel, 2011].

مدل زبان

این روش طبقه بندی با ساخت مدل های زبان n-gram انجام می‌شود. در بازیابی اطلاعات[1] سنتی و طبقه بندی موضوع گرا، فراوانی n-gram برای رسیدن به نتایج بهتر مورد استفاده قرار می گیرد[Gebremeskel, 2011].

رویکرد مبتنی بر مباحثه

در این روش، رابطه ی مباحثه بین اجزاء متن برای هدایت طبقه بندی استفاده می‌شود. به عنوان مثال با توجه به بررسی ها، این نتیجه به دست می آید که احساس کلی معمولا در پایان متن بیان می‌شود. با توجه به این مسئله، عقیده و احساس موجود در پاراگراف پایانی مورد بررسی، معمولا وزن بیشتری را در تعیین احساسات کل متن دارد[Gebremeskel, 2011].

مهندسی ویژگی ها

از آنجا که بسیاری از روش های عقیده کاوی از روش های یادگیری ماشین استفاده می‌کنند یا به آن بستگی دارند، ویژگی های برجسته ی متن و یا مدارک به صورت بردار ویژگی نمایش داده می‌شود. در ادامه ویژگی های مورد استفاده در عقیده کاوی معرفی می شوند[Gebremeskel, 2011].

حضور یا فراوانی کلمه

در استاندارد بازیابی اطلاعات و طبقه بندی متون، تکرار کلمه بیش تر از حضور آن ترجیح داده می‌شود. پنگ و همکاران در تحقیقی در سال 2002 بیان می‌کنند که این شاخصی است که نشان می‌دهد عقیده کاوی متفاوت از طبقه بندی متون استاندارد است زیرا در عقیده کاوی فراوانی کلمه فاکتور مهمی از موضوع است [Pang et al, 2002].

برچسب زنی اجزای کلام

برچسب‌گذاری اجزای کلام، درواقع عمل انتساب برچسب به کلمات تشکیل‌دهنده ی متن است. این برچسب‌گذاری براساس نقش آن کلمه در متن صورت می گیرد، مانند، اسم، فعل، قید، صفت، و غیره. با استفاده از برچسب گذاری اجزای کلام، می توان صفت ها و قیدهایی را که معمولا به عنوان شاخص احساسات مختلف مورد استفاده قرار می گیرند، شناسایی کرد[Gebremeskel, 2011].

نحو و نفی

ترتیب و ویژگی های دیگر نحوی، می تواند به منظور افزایش عملکرد به کار روند. در برخی از وظایف طبقه بندی متن های کوتاه (در سطح جمله)، الگوریتم هایی با استفاده از ویژگی های نحوی و الگوریتم هایی با استفاده از ویژگی های n-gram  عملکرد یکسانی ارائه می دهند [Pang et al, 2008].

نفی[2] نیز یک ویژگی مهم به حساب می آید از آنجا که این ویژگی پتانسیل معکوس کردن احساس را دارد. در تحقیقات مختلف تلاش های زیادی شده است تا با استفاده از تمرکز بر روی این ویژگی کارایی الگوریتم ها را افزایش داد [Das et al, 2001].

کارهای مرتبط

در زمینه عقیده کاوی و تجزیه و تحلیل احساسات در سال های اخیر تحقیقات بسیار گسترده ای انجام شده است. در این فصل به معرفی و توضیح مختصر تعدادی از کارهای انجام شده در طی سال های اخیر خواهیم پرداخت.

در سال 2002 پنگ و همکاران در تحقیقی، اثرات تکنیک های مختلف یادگیری ماشین، بیز ساده[3] (NB)، حداکثر آنتروپی[4] (ME)، و ماشین بردار پشتیبانی[5] (SVM) را در حوزه ی بازبینی فیلم مورد بررسی قرار داده اند [Pang et al, 2002]. طبق نتایج به دست آمده در این تحقیق روش های مبتنی بر SVM قادر به دستیابی به دقت 82.9٪ شدند.

همچنین محققان بسیاری در زمینه ی عقیده کاوی در متن نیز کار کرده اند. انواع متعددی از تکنیک های ماشین بردار پشتیبان توسعه یافته اند که در میان آن ها کلاس چندگانه SVM بیشتر برای طبقه بندی عقیده [Xu, 2011] مورد استفاده قرار می گیرد.

هنگامی که تکنیک های SVM، نایو بیز[6] و مدل n-gram مورد استفاده قرار گرفت، یه و همکارانش [Ye et al, 2009] در تحقیق خود دریافتند که SVM بهتر از دو طبقه بند دیگر بر روی متن ها عمل می کند.

در تحقیقی در سال 2002، ترنی یک الگوریتم ساده، به نام معنا گرایی، برای تشخیص احساسات ارائه داده است [Turney et al, 2002].

پنگ و همکاران در تحقیقی در سال 2004 الگوریتمی سلسله مراتبی ارائه داده اند که در آن ابتدا متن به صورت احساسات طبقه بندی می‌شود، سپس طبقه بندی احساسات به دسته های  مثبت یا منفی صورت می گیرد [Pang et al, 2004].

تکنیک K نزدیکترین همسایه[7] (KNN) به عنوان يكي از بهترين روشهاي دسته بندي براي دسته بندي متن هاي انگليسي شناخته شده است. با توجه به سند تست d، سیستم k نزدیکترین همسایه را در میان اسناد آموزشی پیدا می کند. نمره تشابه هر نزدیکترین سند همسایه با سند تست به عنوان وزن کلاس همسایه در نظر گرفته می‌شود [Tan, 2008] .

رید در تحقیقی در سال 2005 از شکلک ها به عنوان برچسب هایی برای احساسات مثبت و منفی استفاده کرده است. در این تحقیق بیان شده که مطالعه در این زمینه برای توییتر بسیار مهم و ضروری است به این دلیل که بسیاری از کاربران در توییت های خود برای ابراز احساسات از شکلک ها استفاده می‌کنند [Read, 2005].

باربوسا و همکاران در تحقیقی در سال 2010 از یک رویکرد دو مرحله ای برای انجام عقیده کاوی در توییتر استفاده کرده اند. این دو مرحله عبارتند از: 1) طبقه بندی مجموعه داده به دو کلاس عینی و ذهنی (تشخیص ذهنیت) و 2) طبقه بندی جملات ذهنی به طبقات مثبت و منفی (تشخیص تمایل یا تشخیص قطب) [Barbosa et al, 2010].

کلمپس و همکاران در تحقیقی در سال 2011 مسئله ی استفاده از ویژگی های زبانی برای تشخیص احساسات در پیام ها را مورد بررسی قرار داده اند. سودمندی منابع واژگان موجود و همچنین ویژگی های زبان رسمی مورد استفاده در میکروبلاگینگ در این زمینه مورد بررسی قرار گرفته است. در این تحقیق یک رویکرد نظارتی برای مسئله ارائه شده است و از هشتگ های موجود در داده های توییتر برای ساخت داده های آموزشی استفاده شده است [Kouloumpis et al, 2011].

برادی و همکاران در تحقیقی در سال 2011 یک روش اتوماتیک ارائه داده اند که تاثیر طول کلمه بر احساسات واژگان را مشخص می کند و به طور خاص برای توییتر و شبکه های اجتماعی پیامی مشابه بررسی شده است. در این روش، ابتدا طول پیام به عنوان یک پدیده رایج در توییتر و پیام های اجتماعی بررسی شده، اهمیت بررسی آن نشان داده می‌شود. پس از آن در این تحقیق نشان داده می‌شود که طول پیام به شدت با ذهنیت و احساسات فرد در ارتباط است. در نهایت، یک روش اتوماتیک ارائه می‌شود که به تشخیص ارتباط این مسئله و دامنه خاص احساسات کلمات می پردازد [Brody et al, 2011].

سیف و همکاران در تحقیقی در سال 2012 یک رویکرد جدید ارائه داده اند که معانی جدیدی را به عنوان ویژگی های اضافی به مجموعه های آموزشی برای تجزیه و تحلیل احساسات اضافه می کند. در این پژوهش برای هر یک از نهاد های ارسال پیام مفاهیم معنایی به عنوان یک ویژگی های اضافی افزوده شده و همبستگی مفاهیم با احساسات منفی و مثبت اندازه گیری شده است [Saif et al, 2012].

سیف و همکاران در سال 2012 در تحقیقی دیگر پیشنهاد داده اند که برای کاهش مشکل پراکندگی داده ها از دو مجموعه متفاوت ویژگی ها استفاده شود. یکی از آن ها، مجموعه ی ویژگی های معنایی است که از مفاهیم معنایی پنهان در پیام ها استخراج می‌شود و سپس ترکیب با آموزش های طبقه بندی کننده خواهد شد. مجموعه دوم، مجموعه ی ویژگی احساسی-موضوعی است که در آن مباحث نهفته و احساسات مرتبط با موضوع از پیام استخراج می‌شود. پس از آن فضای ویژگی های اصلی با این احساسات موضوع تکمیل خواهد شد. نتایج تجربی این تحقیق در دانشگاه استنفورد انجام شده و نشان می‌دهد که هر دو مجموعه از ویژگی های مدل پایه بهتر عمل می‌کنند [Saif et al, 2012].

دهخارقانی و همکاران در تحقیقی در سال 2014 مفهوم جدید “قوانین علت و معلولی احساسات” را پیشنهاد داده اند که روابط علت و معلولی میان جنبه های مختلف استخراج شده از داده های متنی را ترکیب می کند. همچنین در این تحقیق تکنیک های استخراج این قواعد علت و معلولی، توصیف شده و تاثیر آن ها بر روی تعیین احساس بررسی شده است [Dehkharghani et al, 2014].

سیف و همکاران در تحقیقی در سال 2014 سه روش طبقه بندی با مجموعه ویژگی های مختلف را برای دسته بندی احساسات در توییتر به صورت مثبت، خنثی و یا منفی ارائه داده اند. دراین پژوهش برای تصمیم گیری در مورد احساس از میانگین نتایج روش ها استفاده شده و نمرات به طور متوسط شده است [Saif et al, 2014].

کولومپوس و همکاران در تحقیقی در سال 2013 رویکردی با نام SentiCircle ارائه داده اند. این رویکرد مبتنی بر واژگان جدید است که معانی متنی و مفهومی کلمات را شمارش می کند و در هنگام شمارش گرایش احساسات و قدرت آن ها را در توییتر مشخص می نماید [Kontopoulos et al, 2013].

زرندی و همکاران در سال 1392 مقاله ای با عنوان “مقایسه کارایی طبقه بندهای مختلف متن برای عقیده کاوی درنقدکالا” را ارائه داده اند. در این مقاله یک سیستم عقیده کاوی برای طبقه بندی مجموعه ای ازنقدهای مشتریان درمورد 8دسته کالا طراحی شده است. در این رویکرد پس از استخراج سه مجموعه ویژگی متفاوت از متن و کاهش اندازه این مجموعه ها از طریق انتخاب ویژگی های برتر، فرآیند آموزش طبقه بندها با استفاده از این مجموعه ویژگی ها صورت می پذیرد. کارایی رویکرد پیشنهادی در این مقاله با مقایسه ای بین طبقه بندهای مختلف و نقاط ضعف و قوت آنها نشان داده شده است [برهانی زرندی و همکاران ۱۳۹۲].

زرندی و همکاران در سال 1392 مقاله ای با عنوان “عقیده کاوی در نقد کالا با استفاده از شبکه واژگان احساسی” ارائه داده اند. در این مقاله، یک سیستم عقیده کاوی که از تکنیک های پردازش زبان طبیعی و شبکه واژگان احساسی برای عقیده کاوی در مجموعه ای از نقدهای کالا استفاده می نماید، بررسی شده است. در این سیستم ابتدا در مرحله پیش پردازش داده ها با جداسازی کلمات و جملات، برچسب گذاری اجزای سخن و ریشه یابی کلمات، اطلاعات مورد نیاز از نقدها استخراج شده است. در مرحله بعد با استخراج ویژگی های کالا از نقدها، آن دسته از ویژگی ها که از نظر کاربران اهمیت بیشتری دارند مشخص شده اند. سپس طبقه بندی احساسی مجموعه داده بر اساس بار احساسی واژگان موجود در متن صورت پذیرفته است [برهانی زرندی و همکاران ۱۳۹۲].

احمدی و همکاران در سال 1394 مقاله ای با عنوان “ارائه روشی مبتنی بر پیش پردازش برای بهبود عقیده کاوی در توییتر فارسی” ارائه داده اند. هدف از این مقاله پیدا کردن روشی است که به صورت خودکار بتواند عقیده موجود در توییت های ارسال شده ی فارسی را تعیین کند. هدف روش پیشنهادی توسعه طبقه بندی مبتنی بر روش های پیش پردازش و تکنیک های هوش مصنوعی که شامل ترکیب الگوریتم ژنتیک و استنتاج فازی است که با استفاده از آن بتوان به صورت خودکار نظرات بیان شده در قالب توییت را در دسته های مثبت، منفی طبقه بندی کرد. استفاده از این روش خودکار می تواند بلافاصله پس از پست توییت جدید اعلام کند که محتوای آن حاوی چه عقیده و احساسی می باشد[احمدی مشکانی و همکاران ۱۳۹۴].

کریمیان و همکاران در سال 1394 مقاله ای با عنوان ” کمی سازی گرایش احساسی نظرات متنی فارسی مشتریان بر روی ویژگی های کالا در وب ” ارائه داده اند. هدف اصلی در این مقاله، معرفی یک روش مبتنی بر واژه نامه برای استخراج و کمی سازی گرایش احساسی مشتریان در مورد ویزگی های یک کالا با بررسی و تحلیل نظرات آنها به زبان فارسی بیان شده است.. در این تحقیق، نظرات مشتریان پیرامون 11 ویزگی 3 مدل گوشی تلفن همراه در فروشگاه آنلاین دیجی کالا در تابستان سال 1393 جمع آوری گردید و در هشت گام شامل: انتخاب کالای مورد نظر و جمع آوری نظرات، پیش پردازش داده های متنی، استخراج ویژگی های کالا، ایجاد واژه نامه ها، استخراج الگوهای نظرات، تعیین قطبیت یا گرایش احساسی بخش های نظرات، پس پردازش و در انتها جمع بندی و کمی سازی گرایش احساسی نظرات مورد تحلیل قرار گرفت [کریمیان و همکاران ۱۳۹۴].

علی مردانی و همکاران در سال 1394 از تركيب الگوريتم نظارتی SVM و  همراه با لغت نامه، برا ي عقیده کاوی در سطح سند استفاده کرده اند. در این تحقیق براي ايجاد لغت نام ه، از لغت نامة SentiWordNet بهره برده شده است. از مجموعة لغت هاي اين لغت نامه، به منزلة ويژگي هاي ورودي دسته بندي كننده استفاده مي شود. در این مقاله، فرض های متعددی تعریف شده و در ادامه مورد ارزیابی قرار گرفته است. این فرض ها شامل موارد زیر می باشد.

  • تعداد تكرار كلمات
  • حضورداشتن و حضورنداشتن هر كلمه
  • حاصل ضرب تكرار هر كلمه در مقدار قطبيت آن
  • حاصل ضرب حضورداشتن و حضورنداشتن هر كلمه در مقدار قطبيت آن

تعداد صفحات

64

شابک

978-622-378-379-1

نقد و بررسی‌ها

هنوز بررسی‌ای ثبت نشده است.

.فقط مشتریانی که این محصول را خریداری کرده اند و وارد سیستم شده اند میتوانند برای این محصول دیدگاه(نظر) ارسال کنند.