پروژه استخراج جملات از سایتها | سورس کد پروژه استخراج جمله با کلمه کلیدی از سایت | سورس کد پروژه استخراج جملات فارسی در پایتون | پروژه وب اسکرپینگ سایت با پایتون | پروژه های پایتون
پایتون یکی از محبوبترین و پرکاربردترین زبانهای برنامهنویسی در جهان است. این زبان در اواخر دهه 1980 توسط خیدو فان روسوم توسعه یافت و اولین نسخه آن در سال 1991 منتشر شد. از آن زمان تاکنون، پایتون به یکی از زبانهای برنامهنویسی پرطرفدار تبدیل شده است که در بسیاری از زمینهها مورد استفاده قرار میگیرد.
این برنامه یک وبخراش یا Web Crawler است که به کمک آن، میتوانید به صورت اتوماتیک اطلاعات مورد نیاز خود را از صفحات وب استخراج کنید. با وارد کردن کلمات کلیدی (تا 5 مورد) و آدرس سایت مورد نظر، برنامه به صورت خودکار اطلاعات را جمعآوری کرده و در پایگاه دادهای محلی ذخیره میکند.
این پروژه محدودیت زبانی برای محتوا ندارد اما ممکن است روی برخی از سایتها که دارای قفل گذاری محتوا ،مسدود کردن رباتهای خزشگر و ساختار ناقص و غیراستاندارد باشند عملکرد مناسبی نشان ندهد که در بین سایت های فارسی بیشتر دیده می شود.
پکیج های مورد استفاده:
tkinter-ttk-requests-BeautifulSoup (bs4)-sqlite3-threading–logging-nltk
توضیحات مربوط به هر پکیج و کارآیی آن و دستورات نصب در فایل راهنما موجود می باشد.
ویژگیهای برنامه
- رابط کاربری گرافیکی: برنامه دارای یک رابط کاربری گرافیکی است که امکان ورود اطلاعات توسط کاربر را فراهم میسازد.
- جمعآوری اطلاعات: از طریق اتصال به وبسایتها، برنامه اطلاعات مربوط به کلمات کلیدی مورد نظر را استخراج میکند.
- پشتیبانی از چندین مرورگر: کاربر میتواند مرورگر مورد نظر برای درخواستهای HTTP را انتخاب کند (Chrome، Firefox، Edge).
- نمایش پیشرفت فرایند: برنامه امکان مشاهده درصد پیشرفت جمعآوری اطلاعات را برای کاربر فراهم میکند.
- ذخیره اطلاعات: اطلاعات جمعآوری شده در پایگاه داده SQLite ذخیره میشود تا در آینده مورد استفاده قرار گیرد.
فرآیند استفاده
- ورود اطلاعات: کاربر کلمات کلیدی و آدرس سایتهای مورد نظر را وارد میکند.بهترین حالت استفاده از این پروژه دادن لینک اصلی مقالات می باشد تا بصورت دقیق و سریعتر جملات و عبارات مرتبط با کلمه کلیدی را پیدا و ذخیره نماید.
- انتخاب مرورگر: کاربر مرورگر دلخواه خود را برای ارسال درخواستهای HTTP انتخاب میکند.
- جمعآوری اطلاعات: برنامه به صورت خودکار به وبسایتها متصل شده، اطلاعات مربوط به کلمات کلیدی را جمعآوری میکند.
- ذخیرهسازی اطلاعات: اطلاعات استخراج شده به همراه کلمه کلیدی مرتبط و آدرس صفحه وب مربوطه در پایگاه داده ذخیره میشوند.
- نمایش پیام: پس از پایان فرآیند، پیامی به کاربر نمایش داده میشود که نشان دهنده موفقیت عملیات یا وقوع خطا است.
- دریافت خروجی: خروجی نهایی به فرمت db در محل ذخیره پروژه ایجاد خواهد شد.
ویدئوی پیش نمایش
مشخصات فنی پروژه:
- عنوان محصول:پروژه استخراج جملات با کلمات کلیدی از سایتها به زبان پایتون
- کد محصول:Python03
- تاریخ انتشار: 1403/03
- نسخه :1.0
- زبان رابط کاربری: انگلیسی
- تعداد فایل:2
- نوع فایل:py+docx
- حجم پروژه: 100 کیلوبایت
- ویرایش: دارد
- محدودیت در اجرا: ندارد
- راهنما: دارد
- لینک دانلود فایل بلافاصله پس از پرداخت وجه به نمایش در خواهد آمد.
- پس از خرید به صورت خودکار در سایت ثبت نام می شوید و اطلاعات ورود به حساب کاربری برایتان ایمیل می شود.
- از طریق بخش حساب کاربری امکان دسترسی به محصولات خریداری شده وجود دارد.
- دریافت آپدیت یا بروزرسانی محصولات تنها از طریق پروفایل کاربری خواهد بود و هیچگونه آپدیتی به ایمیل خریدار ارسال نخواهد شد.
- همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
- ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
- در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.
- لطفا قبل از خرید قوانین ما را مطالعه فرمایید.