برنامه نویسی

خزشگر های وب یا Web Crawler ها چیست؟

این روز ها با پیشرفت علم و تکنولوژی موتور جستجو های وب دست به کار شده اند و ابزاری به نام خزشگر وب را بررسی عنوان و محتویات صفحات وب ابداع کردند. عملا خزشگر های وب در یک موتور جستجو فعالیت می کنند. به صورت کلی کاری که یک خزشگر وب انجام می دهد، بررسی محتوای صفحات و ایندکس کردن آنها می باشد.

این روز ها با پیشرفت علم و تکنولوژی موتور جستجو های وب دست به کار شده اند و ابزاری به نام خزشگر وب را بررسی عنوان و محتویات صفحات وب ابداع کردند. عملا خزشگر های وب در یک موتور جستجو فعالیت می کنند. به صورت کلی کاری که یک خزشگر وب انجام می دهد، بررسی محتوای صفحات و ایندکس کردن آنها می باشد.

خزشگر وب دقیقا مثل یک انسان عمل می کند. فرض کنید این انسان مسئولیت مدیریت یک کتابخانه را به عهده دارد و مسئول طبقه بندی کتاب می باشد. این کتابخانه بسیار نامرتب است و کتاب ها هنوز طبقه بندی نشده اند. خزشگر وب نیز به همین صورت صفحات وب را با استفاده از تگ ها (Tag) دسته بندی می کند و با هر جستجو صفحات مربوط به متن جستجو را نمایش می دهد.

مقاله‌ی مرتبط:

 

خزشگر وب چگونه کار می کند؟

اینترنت فضایی هست که روز به روز درحال گسترش و صفحات جدیدتری به آن اضافه می شوند. عملا انجام این کار ها می تواند برای یک خزشگر وب کار ساده ای نباشد. اما طبق الگوریتم آن ابتدا صفحاتی که دامین (Domain) آنها نسبت به سایر دامین ها رتبه و ارزش بیشتری دارد کارش را روی آن صفحات شروع می کند.

موتور جستجو های Google، Yahoo و Bing اما با الگوریتم های متفاوت برای رتبه بندی و بررسی محتویات صفحاتشان است، از خزشگر های وب استفاده می کنند. اما در میان نیز آگهی های استخدام برنامه نویس خزشگر وب وجود دارد. برای نمونه می توانیم به خزشگر GoogleBot اشاره کنیم که کمپانی Google و خزشگر Yahoo Slurp که کمپانی Yahoo از آن استفاده می کند. اما این خزشگر ها متن باز (Open Source) نمی باشد. برخلاف آن خزشگر YaCy متن باز است.

 

ممنونم که ما را انتهای این مقاله همراهی کردید. اگر نظری، انتقادی و پیشنهادی دارید خوشحال میشم با ما به اشتراک بگذارید. شاد و موید و پیروز باشید و خدانگهدار.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

نوشته های مشابه

دکمه بازگشت به بالا