دیتاست |دیتاست تشخیص اخبار جعلی | دیتاست اخبار خبرگزاریهای خارجی | دیتاست تشخیص اخبار جعلی |
دیتاست (انگلیسی: Data set) به مجموعهای از دادههای آماری یا دیتاهای رایانهای مربوط به یک پایگاه داده اطلاق میشود، که با هدف یکپارچه نمودن دادهها، محتویات آن را در قالب یک جدول پایگاه داده تنظیم و مرتب مینمایند، که در آن، هر ستون از پایگاه داده، نشان دهنده یک متغیر خاص است و هر ردیف نیز به یکی از اعضای مجموعه دادههای مورد نظر مرتبط میباشد.
دیتاست مجموعه داده تشخیص اخبار جعلی زبان انگلیسی حاوی اخبار خبرگزاری های خارجی در موضوعات و دسته بندی های مختلفی می باشد که به وسیله نرم افزار Octoparse از سایت CNN وReuters استخراج و ارائه شده است.
مجموعه داده تشخیص اخبار جعلی NLP یک مجموعه داده تخصصی است که برای آموزش و تست الگوریتمهای پردازش زبان طبیعی (NLP) طراحی شده است. این مجموعه داده شامل متون واقعی و جعلی است که از منابع مختلف جمعآوری شدهاند تا به توسعهدهندگان کمک کند تا مدلهایی بسازند که قادر به تشخیص دقیق اخبار نادرست از اخبار واقعی باشند. استفاده از این مجموعه داده در پروژههای مرتبط با امنیت اطلاعات و حفظ دقت و صداقت در رسانهها و شبکههای اجتماعی میتواند بسیار مفید باشد.
این دیتاست از دو بخش اخبار درست و اخبار غلط تشکیل شده که بخش اخبار درست دارای 23502 خبر و اخبار غلط دارای 21417 خبر به زبان انگلیسی می باشد.
مجموعه داده تشخیص اخبار جعلی NLP دارای ستونهای زیر است:
- عنوان: عنوان مقاله خبری
- متن: متن کامل مقاله خبری
- موضوع: موضوع مقاله خبری
- تاریخ: تاریخ انتشار مقاله خبری
این ستونها به تحلیلگران و سیستمهای مبتنی بر هوش مصنوعی کمک میکنند تا با استفاده از محتوای متنی و متا دادهها، به شناسایی الگوهای مرتبط با اخبار جعلی و واقعی بپردازند. اطلاعات در این ستونها میتوانند برای آموزش مدلهای پیچیدهی NLP استفاده شوند تا قابلیت تشخیص بین متون واقعی و جعلی را بهبود بخشند.
تاریخ انتشار این اخبار بین سالهای 2020 الی 2023 می باشد.
ویژگیهای کلیدی و کاربردها:
- کاربرد در آموزش مدلهای یادگیری ماشین: این دیتاست میتواند برای آموزش الگوریتمهای یادگیری ماشین و عمیق به منظور تشخیص محتوای جعلی و واقعی استفاده شود.
- تجزیه و تحلیل محتوایی: محتوای متنی میتواند برای تجزیه و تحلیل احساسات، استخراج نامها، نهادها و موضوعات کلیدی مورد استفاده قرار گیرد.
- استفاده از متادیتا: تاریخ و موضوع میتوانند برای تحلیل روندهای خبری بر اساس زمان یا دستهبندیهای خبری استفاده شوند.
- کمک به تقویت دقت سیستمهای تشخیص: بهبود توانایی سیستمها در تشخیص دقیق و سریع اخبار جعلی، که بخش مهمی در مبارزه با شایعات و اطلاعات نادرست است.
این دیتاست میتواند به پژوهشگران و توسعهدهندگان کمک کند تا ابزارهای قدرتمندی برای حفظ اعتبار و صحت اطلاعات در فضای خبری آنلاین فراهم آورند.
کاربردهای دیتاست:
- تحلیلگران و علاقمندان به داده های آماری
- کاوش در فناوری های آینده و بازارهای نوظهور
- شناسایی چالش های موجود
- برنامه ریزی ، مدیریت و تحقیق و توسعه محصولات مرتبط
مشخصات فنی دیتاست :
- عنوان محصول: دیتاست مجموعه داده تشخیص اخبار جعلی زبان انگلیسی
- کد محصول:dataset194
- تاریخ انتشار: 1403
- تعداد نمونه : 44919
- تعداد ویژگی: 4
- عنوان ویژگی: عنوان ، متن، موضوع،تاریخ انتشار
- نوع فایل: csv
- نرم افزار: Microsoft Office 2010 up
- حجم فایل: 110 مگابایت
- قابلیت ویرایش: دارد
- راهنما: ندارد
در صورتی که نحوه کار با نرم افزار Octoparse را نمی دانید می توانید از آموزش استخراج داده از سایتها با نرم افزار Octoparse استفاده نمایید.
در صورتی که برای استخراج دیتا از سایت های مختلف نیاز به الگوهای آماده دارید می توانید از پروژه های استخراج داده با Octoparse که توسط فروشگاه فایل های دیجیتال طراحی و ارائه شده اند استفاده کنید.
و در صورتی که برای انجام پروژه های تحقیقاتی و یا شناسایی رفتار کاربران و بازار هدف در حوزه های گوناگون نیاز به دیتاست آماده دارید می توانید از دیتاست های فروشگاه فایل های دیجیتال استفاده نمایید.
- لینک دانلود فایل بلافاصله پس از پرداخت وجه به نمایش در خواهد آمد.
- پس از خرید به صورت خودکار در سایت ثبت نام می شوید و اطلاعات ورود به حساب کاربری برایتان ایمیل می شود.
- از طریق بخش حساب کاربری امکان دسترسی به محصولات خریداری شده وجود دارد.
- دریافت آپدیت یا بروزرسانی محصولات تنها از طریق پروفایل کاربری خواهد بود و هیچگونه آپدیتی به ایمیل خریدار ارسال نخواهد شد.
- همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
- ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
- در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.
- لطفا قبل از خرید قوانین ما را مطالعه فرمایید.