دیتاست تحلیل احساسات فارسی (نظرات کاربران رسانه)

فرمت فایل
zip
حجم محصول
1 مگابایت
زبان
فارسی
تاریخ انتشار
2025
تعداد فایل
1 فایل
تعداد فروش
0 فروش
1,000,000 تومان

دیتاست |دیتاست تحلیل احساسات فارسی | دیتاست نظرات کاربران فارسی | دیتاست تحلیل احساسات کاربران |

این مجموعه داده (دیتاست)، یک منبع ارزشمند و باکیفیت از نظرات واقعی کاربران فارسی‌زبان است که به طور خاص برای آموزش و ارزیابی مدل‌های هوش مصنوعی در حوزه تحلیل احساسات (Sentiment Analysis) گردآوری شده است. نظرات موجود در این دیتاست عمدتاً بر روی نقد و بررسی محصولات رسانه‌ای (مانند فیلم، سریال و انیمیشن) متمرکز هستند، که آن را به ابزاری ایده‌آل برای درک بازخورد مخاطبان در این حوزه تبدیل می‌کند.

تمام داده‌ها به دقت برچسب‌گذاری شده‌اند تا فرآیند آموزش مدل‌های یادگیری ماشین را تسریع بخشیده و دقت آن‌ها را به حداکثر برسانند.داده های این دیتاست 34000 مورد می باشد .

ویژگی‌های کلیدی دیتاست

  • زبان: فارسی (Persian)
  • منبع داده: نظرات واقعی و طبیعی کاربران (جمع‌آوری شده از پلتفرم‌های نمایش فیلم و نقد و بررسی)
  • برچسب‌گذاری دقیق: هر نظر به صورت دستی به یکی از دو دسته اصلی احساسی برچسب‌گذاری شده است.
  • حوزه تخصصی: تمرکز ویژه بر نظرات مربوط به فیلم، سریال و محتوای ویدیویی.
  • فرمت ساده: ارائه شده در فرمت استاندارد CSV برای بارگذاری و استفاده آسان در پایتون (Pandas)، R و سایر ابزارهای علم داده.
  • آماده استفاده: داده‌ها تا حدودی پاکسازی شده و آماده ورود به خط لوله (Pipeline) یادگیری ماشین هستند.

ساختار دیتاست

فایل CSV شامل دو ستون اصلی است:

۱. comment (متن نظر): * نوع: رشته (String) * توضیح: متن کامل نظری که توسط کاربر ثبت شده است. این ستون حاوی زبان محاوره‌ای، اصطلاحات رایج و بیان طبیعی احساسات است.

۲. label (برچسب احساسی): * نوع: عددی (Integer) * توضیح: برچسب تخصیص‌داده‌شده به هر نظر. * 1: نشان‌دهنده احساسات مثبت (Positive) * 2: نشان‌دهنده احساسات منفی (Negative) * 0: نشان‌دهنده احساسات خنثی

دیتاست تحلیل احساسات فارسی
دیتاست تحلیل احساسات فارسی
دیتاست تحلیل احساسات فارسی

موارد استفاده دیتاست تحلیل احساسات فارسی (Use Cases)

این دیتاست می‌تواند توسط افراد و تیم‌های زیر مورد استفاده قرار گیرد:

  • متخصصان علم داده و هوش مصنوعی:
    • آموزش (Train) و ارزیابی (Evaluate) مدل‌های طبقه‌بندی متن (Text Classification).
    • ساخت مدل‌های پیشرفته تحلیل احساسات مبتنی بر ترنسفورمرها (مانند ParsBERT یا AraBERT) برای زبان فارسی.
  • شرکت‌های رسانه‌ای و پلتفرم‌های VOD:
    • تحلیل خودکار بازخورد کاربران بر روی محصولات.
    • درک سریع نقاط قوت و ضعف یک فیلم یا سریال از دید مخاطبان.
    • توسعه موتورهای پیشنهادگر (Recommendation Engines) هوشمندتر.
  • تیم‌های بازاریابی و مدیریت برند:
    • رصد لحظه‌ای احساسات کاربران نسبت به کمپین‌های تبلیغاتی یا محصولات جدید.
    • شناسایی ترندهای مثبت یا منفی در شبکه‌های اجتماعی.
  • محققان و دانشجویان:
    • انجام پروژه‌های تحقیقاتی در حوزه پردازش زبان طبیعی فارسی (Persian NLP).
    • ایجاد یک مدل پایه (Baseline) قوی برای مقایسه با سایر روش‌ها.

در صورتی که نحوه کار با نرم افزار Octoparse را نمی دانید می توانید از آموزش استخراج داده از سایتها با نرم افزار Octoparse استفاده نمایید.

در صورتی که برای استخراج دیتا از سایت های مختلف نیاز به الگوهای آماده دارید می توانید از پروژه های استخراج داده با Octoparse که توسط فروشگاه فایل های دیجیتال طراحی و ارائه شده اند استفاده کنید.

و در صورتی که برای انجام پروژه های تحقیقاتی و یا شناسایی رفتار کاربران و بازار هدف در حوزه های گوناگون نیاز به دیتاست آماده دارید می توانید از دیتاست های فروشگاه فایل های دیجیتال استفاده نمایید.

مطالعه بیشتر

راهنمای خرید:
  • لینک دانلود فایل بلافاصله پس از پرداخت وجه به نمایش در خواهد آمد.
  • پس از خرید به صورت خودکار در سایت ثبت نام می شوید و اطلاعات ورود به حساب کاربری برایتان ایمیل می شود.
  • از طریق بخش حساب کاربری امکان دسترسی به محصولات خریداری شده وجود دارد.
  • دریافت آپدیت یا بروزرسانی محصولات تنها از طریق پروفایل کاربری خواهد بود و هیچگونه آپدیتی به ایمیل خریدار ارسال نخواهد شد.
  • همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
  • ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
  • در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.
  • لطفا قبل از خرید قوانین ما را مطالعه فرمایید.
دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *