پروژه استخراج جملات با کلمات کلیدی از سایتها به زبان پایتون

فرمت فایل
Zip
حجم محصول
100 کیلوبایت
زبان
انگلیسی
تاریخ انتشار
2024
تعداد فایل
1 فایل
تعداد فروش
0 فروش
1,450,000 تومان

پروژه استخراج جملات از سایتها | سورس کد پروژه استخراج جمله با کلمه کلیدی از سایت | سورس کد پروژه استخراج جملات فارسی در پایتون | پروژه وب اسکرپینگ سایت با پایتون | پروژه های پایتون

پایتون یکی از محبوب‌ترین و پرکاربردترین زبان‌های برنامه‌نویسی در جهان است. این زبان در اواخر دهه 1980 توسط خیدو فان روسوم توسعه یافت و اولین نسخه آن در سال 1991 منتشر شد. از آن زمان تاکنون، پایتون به یکی از زبان‌های برنامه‌نویسی پرطرفدار تبدیل شده است که در بسیاری از زمینه‌ها مورد استفاده قرار می‌گیرد.

این برنامه یک وب‌خراش یا Web Crawler است که به کمک آن، می‌توانید به صورت اتوماتیک اطلاعات مورد نیاز خود را از صفحات وب استخراج کنید. با وارد کردن کلمات کلیدی (تا 5 مورد) و آدرس‌ سایت مورد نظر، برنامه به صورت خودکار اطلاعات را جمع‌آوری کرده و در پایگاه داده‌ای محلی ذخیره می‌کند.

این پروژه محدودیت زبانی برای محتوا ندارد اما ممکن است روی برخی از سایتها که دارای قفل گذاری محتوا ،مسدود کردن رباتهای خزشگر و ساختار ناقص و غیراستاندارد باشند عملکرد مناسبی نشان ندهد که در بین سایت های فارسی بیشتر دیده می شود.

پیش نمایش پروژه استخراج جملات با کلمات کلیدی از سایتها به زبان پایتون

پکیج های مورد استفاده:

tkinter-ttk-requests-BeautifulSoup (bs4)-sqlite3-threading–logging-nltk

توضیحات مربوط به هر پکیج و کارآیی آن و دستورات نصب در فایل راهنما موجود می باشد.

ویژگی‌های برنامه

  • رابط کاربری گرافیکی: برنامه دارای یک رابط کاربری گرافیکی است که امکان ورود اطلاعات توسط کاربر را فراهم می‌سازد.
  • جمع‌آوری اطلاعات: از طریق اتصال به وب‌سایت‌ها، برنامه اطلاعات مربوط به کلمات کلیدی مورد نظر را استخراج می‌کند.
  • پشتیبانی از چندین مرورگر: کاربر می‌تواند مرورگر مورد نظر برای درخواست‌های HTTP را انتخاب کند (Chrome، Firefox، Edge).
  • نمایش پیشرفت فرایند: برنامه امکان مشاهده درصد پیشرفت جمع‌آوری اطلاعات را برای کاربر فراهم می‌کند.
  • ذخیره اطلاعات: اطلاعات جمع‌آوری شده در پایگاه داده SQLite ذخیره می‌شود تا در آینده مورد استفاده قرار گیرد.

فرآیند استفاده

  1. ورود اطلاعات: کاربر کلمات کلیدی و آدرس‌ سایتهای مورد نظر را وارد می‌کند.بهترین حالت استفاده از این پروژه دادن لینک اصلی مقالات می باشد تا بصورت دقیق و سریعتر جملات و عبارات مرتبط با کلمه کلیدی را پیدا و ذخیره نماید.
  2. انتخاب مرورگر: کاربر مرورگر دلخواه خود را برای ارسال درخواست‌های HTTP انتخاب می‌کند.
  3. جمع‌آوری اطلاعات: برنامه به صورت خودکار به وب‌سایت‌ها متصل شده، اطلاعات مربوط به کلمات کلیدی را جمع‌آوری می‌کند.
  4. ذخیره‌سازی اطلاعات: اطلاعات استخراج شده به همراه کلمه کلیدی مرتبط و آدرس صفحه وب مربوطه در پایگاه داده ذخیره می‌شوند.
  5. نمایش پیام: پس از پایان فرآیند، پیامی به کاربر نمایش داده می‌شود که نشان دهنده موفقیت عملیات یا وقوع خطا است.
  6. دریافت خروجی: خروجی نهایی به فرمت db در محل ذخیره پروژه ایجاد خواهد شد.

ویدئوی پیش نمایش

مشخصات فنی پروژه:

  • عنوان محصول:پروژه استخراج جملات با کلمات کلیدی از سایتها به زبان پایتون
  • کد محصول:Python03
  • تاریخ انتشار: 1403/03
  • نسخه :1.0
  • زبان رابط کاربری: انگلیسی
  • تعداد فایل:2
  • نوع فایل:py+docx
  • حجم پروژه: 100 کیلوبایت
  • ویرایش: دارد
  • محدودیت در اجرا: ندارد
  • راهنما: دارد

مطالعه بیشتر

راهنمای خرید:
  • لینک دانلود فایل بلافاصله پس از پرداخت وجه به نمایش در خواهد آمد.
  • پس از خرید به صورت خودکار در سایت ثبت نام می شوید و اطلاعات ورود به حساب کاربری برایتان ایمیل می شود.
  • از طریق بخش حساب کاربری امکان دسترسی به محصولات خریداری شده وجود دارد.
  • دریافت آپدیت یا بروزرسانی محصولات تنها از طریق پروفایل کاربری خواهد بود و هیچگونه آپدیتی به ایمیل خریدار ارسال نخواهد شد.
  • همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
  • ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
  • در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.
  • لطفا قبل از خرید قوانین ما را مطالعه فرمایید.
دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *