دیتاست |دیتاست تحلیل احساسات فارسی | دیتاست نظرات کاربران فارسی | دیتاست تحلیل احساسات کاربران |
این مجموعه داده (دیتاست)، یک منبع ارزشمند و باکیفیت از نظرات واقعی کاربران فارسیزبان است که به طور خاص برای آموزش و ارزیابی مدلهای هوش مصنوعی در حوزه تحلیل احساسات (Sentiment Analysis) گردآوری شده است. نظرات موجود در این دیتاست عمدتاً بر روی نقد و بررسی محصولات رسانهای (مانند فیلم، سریال و انیمیشن) متمرکز هستند، که آن را به ابزاری ایدهآل برای درک بازخورد مخاطبان در این حوزه تبدیل میکند.
تمام دادهها به دقت برچسبگذاری شدهاند تا فرآیند آموزش مدلهای یادگیری ماشین را تسریع بخشیده و دقت آنها را به حداکثر برسانند.داده های این دیتاست 34000 مورد می باشد .
ویژگیهای کلیدی دیتاست
- زبان: فارسی (Persian)
- منبع داده: نظرات واقعی و طبیعی کاربران (جمعآوری شده از پلتفرمهای نمایش فیلم و نقد و بررسی)
- برچسبگذاری دقیق: هر نظر به صورت دستی به یکی از دو دسته اصلی احساسی برچسبگذاری شده است.
- حوزه تخصصی: تمرکز ویژه بر نظرات مربوط به فیلم، سریال و محتوای ویدیویی.
- فرمت ساده: ارائه شده در فرمت استاندارد CSV برای بارگذاری و استفاده آسان در پایتون (Pandas)، R و سایر ابزارهای علم داده.
- آماده استفاده: دادهها تا حدودی پاکسازی شده و آماده ورود به خط لوله (Pipeline) یادگیری ماشین هستند.
ساختار دیتاست
فایل CSV شامل دو ستون اصلی است:
۱. comment (متن نظر): * نوع: رشته (String) * توضیح: متن کامل نظری که توسط کاربر ثبت شده است. این ستون حاوی زبان محاورهای، اصطلاحات رایج و بیان طبیعی احساسات است.
۲. label (برچسب احساسی): * نوع: عددی (Integer) * توضیح: برچسب تخصیصدادهشده به هر نظر. * 1: نشاندهنده احساسات مثبت (Positive) * 2: نشاندهنده احساسات منفی (Negative) * 0: نشاندهنده احساسات خنثی
موارد استفاده دیتاست تحلیل احساسات فارسی (Use Cases)
این دیتاست میتواند توسط افراد و تیمهای زیر مورد استفاده قرار گیرد:
- متخصصان علم داده و هوش مصنوعی:
- آموزش (Train) و ارزیابی (Evaluate) مدلهای طبقهبندی متن (Text Classification).
- ساخت مدلهای پیشرفته تحلیل احساسات مبتنی بر ترنسفورمرها (مانند ParsBERT یا AraBERT) برای زبان فارسی.
- شرکتهای رسانهای و پلتفرمهای VOD:
- تحلیل خودکار بازخورد کاربران بر روی محصولات.
- درک سریع نقاط قوت و ضعف یک فیلم یا سریال از دید مخاطبان.
- توسعه موتورهای پیشنهادگر (Recommendation Engines) هوشمندتر.
- تیمهای بازاریابی و مدیریت برند:
- رصد لحظهای احساسات کاربران نسبت به کمپینهای تبلیغاتی یا محصولات جدید.
- شناسایی ترندهای مثبت یا منفی در شبکههای اجتماعی.
- محققان و دانشجویان:
- انجام پروژههای تحقیقاتی در حوزه پردازش زبان طبیعی فارسی (Persian NLP).
- ایجاد یک مدل پایه (Baseline) قوی برای مقایسه با سایر روشها.
در صورتی که نحوه کار با نرم افزار Octoparse را نمی دانید می توانید از آموزش استخراج داده از سایتها با نرم افزار Octoparse استفاده نمایید.
در صورتی که برای استخراج دیتا از سایت های مختلف نیاز به الگوهای آماده دارید می توانید از پروژه های استخراج داده با Octoparse که توسط فروشگاه فایل های دیجیتال طراحی و ارائه شده اند استفاده کنید.
و در صورتی که برای انجام پروژه های تحقیقاتی و یا شناسایی رفتار کاربران و بازار هدف در حوزه های گوناگون نیاز به دیتاست آماده دارید می توانید از دیتاست های فروشگاه فایل های دیجیتال استفاده نمایید.
- لینک دانلود فایل بلافاصله پس از پرداخت وجه به نمایش در خواهد آمد.
- پس از خرید به صورت خودکار در سایت ثبت نام می شوید و اطلاعات ورود به حساب کاربری برایتان ایمیل می شود.
- از طریق بخش حساب کاربری امکان دسترسی به محصولات خریداری شده وجود دارد.
- دریافت آپدیت یا بروزرسانی محصولات تنها از طریق پروفایل کاربری خواهد بود و هیچگونه آپدیتی به ایمیل خریدار ارسال نخواهد شد.
- همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
- ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
- در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.
- لطفا قبل از خرید قوانین ما را مطالعه فرمایید.
فروشگاه فایلهای دیجیتال | ارائه کننده محصولات تخصصی