چهارشنبه, ۵ اردیبهشت, ۱۴۰۳ / 24 April, 2024
مجله ویستا

جست‌و‌جو، کلید حل معما در اینترنت


جست‌و‌جو، کلید حل معما در اینترنت
● اشاره:
اینترنت شبكه‌ای بسیار گسترده است و حاوی مطالب زیادی در موضوعات گوناگون. این رسانه جدید كه انقلابی در زمینه اطلاعات ایجاد كرده قرن نوین را به قرن اطلاعات بدل نموده است. اگر در گذشته یافتن مطالب مورد نیازمان احتیاج به مسافرت و یا صرف وقت زیادی داشت و سخت بود، امروزه با نشستن در پشت كامپیوتر و اتصال به شبكه جهانی اینترنت آن اطلاعات و دانش در اختیار ما قرار می‌گیرد. اما چگونه می‌توانیم در بین این حجم اطلاعات در این رسانه مطلب مورد نظر خود را بیابیم. جست‌وجو كلید حل این معماست.
● ابزار‌های جست‌وجو
همان طوركه فهرست مطالب و نمایه‌ها ابزارهای اصلی برای دسترسی به محتوای كتاب‌ها و مجلات به شمار می‌روند، ابزارهای كاوش نیز جست‌وجو و بازیابی منابع اطلاعاتی موجود در شبكه اینترنت را تسهیل می‌نمایند. هر كدام از ابزارهای كاوش، محتوا، پوشش و واسط منحصر به فرد خود را دارند و برای استفاده از آنها و همچنین انجام جست‌وجوی موفق و مفید در آنها باید از مجموعه‌ای از اصول و قواعد جست‌وجو در این ابزارها آگاه بود.
آشنایی با این ابزارها برای جست‌وجوگران اطلاعات در اینترنت امری ضروری می‌باشد و لازم است. ضمن شناسایی ابزارهای كاوش اینترنت در حوزه‌های مختلف، با روش‌های جست‌وجو در آنها آشنا شده و مناسب‌ترین آنها را برای رفع نیازهای اطلاعاتی خود انتخاب نمایند.
● ابزارهای كاوش اینترنت در یك دسته‌بندی كلی در دو دسته موتورهای جست‌وجو و راهنماهای موضوعی تقسیم‌بندی می‌شوند.
۱) راهنماهای موضوعی وب (Web Directory): راهنماهای وب یكی از مهم‌ترین ابزارهای كاوش در اینترنت به شمار می‌روند كه گزینشی بوده و منابع آنها بر اساس موضوع دسته‌بندی شده‌اند. در این ابزارها جست‌وجو را می‌توان در ساختار موضوعی و به صورت سلسله مراتبی انجام داد.
راهنماهای وب بر خلاف موتورهای جست‌وجوی كلید واژه‌ای، امكان دسترسی سریع و مناسب به اطلاعات معتبر و ارزشمند تحلیل شده را منطبق با نیازهای مخاطبان از طریق ساختار موضوعی نظام‌مند در اختیار قرار می‌دهند. در واقع نتایج جست‌وجو از طریق راهنماهای موضوعی در هم ریختگی كمتری دارد، زیرا منابع و وب سایت‌هایی كه پیدا می‌شوند در اغلب موارد به وسیلهٔ متخصصان موضوعی گزینش شده‌اند، لذا كاربر كل شبكه وب را جست‌وجو نمی‌كند، بلكه روی طبقه موضوعی انتخاب شده به جست‌وجو می‌پردازد و از این طریق از اتلاف وقت كاربر جلوگیری می‌شود.
به عبارت دیگر، راهنماهای وب مجموعه‌ای از منابع شبكه وب را در ساختار موضوعی كلی (فرضاً سلسله مراتبی یا درختی) دسته‌بندی كرده و آنها را در طبقه موضوعی كلی و هر طبقه را به موضوعات ریز و خاص‌تر تقسیم می‌كنند. نقطه قوت این ابزارها دقیق و مرتبط بودن نتیجه جست‌وجو با موضوع مورد نظر و اعتبار و كیفیت بالای منابع بازریابی شده و نقطه ضعف آنها نیز پوشش محدود منابع وب، چند مرحله‌ای بودن فرآیند جست‌وجو و همچنین پایین بودن سرعت روزآمدی منابع آنها می‌باشد.
۲) موتورهای جست‌وجو (Search Engines):
موتورهای جست وجو ابزارهایی هستند كه برای كاوش انواع منابع اطلاعاتی موجود در شبكه اینترنت طراحی شده‌اند. موتورهای جست‌وجو با جمع‌آوری صفحات وب و ایجاد پایگاه‌های اطلاعاتی فرآیند مرور و جست‌وجو را برای استفاده‌كنندگان تسهیل می‌كنند. به كمك این ابزارها و از طریق كلید واژه، عبارت و سایر قابلیت‌ها می‌توان به جست‌وجوی اطلاعات در اینترنت پرداخت.
هر كدام از موتورهای جست‌وجو از برخی جنبه‌ها با هم تفاوت دارند و نقاط قوت و ضعف و نیز گسترهٔ اطلاعات خاص خود را دارا می‌باشند كه باید بر اساس نیاز اطلاعاتی و نوع مدرك مورد جست‌وجو هر یك از این ابزارها را برای جست‌وجوی منابع وب انتخاب كرد. در واقع موتورهای جست‌وجو از نظر تنوع، محتوا و استراتژی‌های جست‌وجو، تهیه منابع و مجموعهٔ ابزارهایی كه برای كمك به استفاده‌كنندگان ارائه می‌دهند، تفاوت‌ها و پیچیدگی‌های خاص خود را دارا هستند. از طرفی بوسیله هیچ یك از موتورهای جست‌وجو نمی‌توان در تمام منابع اطلاعاتی موجود در اینترنت جست‌وجوكرد.
با تایپ واژه یا عبارت مربوط به موضوع مورد نظر خود در هر كدام از این ابزارها، همه صفحات و سایت‌های مرتبط با آن موضوع بازیابی می‌شوند. از نقاط قوت این ابزارها می‌توان به پوشش وسیع منابع وب و سرعت در روزآمد‌سازی منابع و از نقاط ضعف آن نیز می‌توان به بازیابی بعضی منابع كم ربط یا نامربوط با موضوع مورد نظر اشاره كرد.
تفاوت اصلی این دو گروه نیز در نحوه تشکیل پایگاه داده و جمع‌آوری اطلاعات آنهاست. در فهرست‌ها، این کار به عهده انسان است اما در موتورهای جست‌وجوگر جمع‌آوری اطلاعات پایگاه داده را نرم‌افزارها انجام می‌دهند. دانستن تفاوت کار این دو گروه بسیار مهم است زیرا هر یک از آنها به گونه‌ای متفاوت رفتار می‌نمایند. فهرست هرگز از وجود یك سایت اطلاع نمی‌یابد مگر زمانی‌که شخصی آن را به وی معرفی نماید.
بعد از معرفی است که ویراستار آن فهرست به سایت شما مراجعه نموده، در صورت رعایت قوانین فهرست و انتخاب گروه مناسب، آن سایت را به پایگاه داده فهرست اضافه می‌نماید. اما در موتورهای جست‌وجوگر وضع به گونه‌ای دیگر است، موتور جست‌وجوگر می‌تواند از وجود آن سایت اطلاع یابد اگر راه ورود آن فراهم شده باشد. در واقع نرم‌افزار موتور جست‌وجوگر هر لحظه در حال وبگردی و به روزرسانی اطلاع قدیمی و همین طور افزودن اطلاعات جدید به پایگاه داده موتور جست‌وجوگر است.
● بخش‌های مختلف یك موتور جست‌وجو
جست‌وجویی در یک موتور جست‌وجوگر انجام و نتایج جست‌وجو ارائه می‌شود، كاربران در واقع نتیجه كار بخش‌های متفاوت موتور جست‌وجوگر را می‌بینند. موتور جست‌وجوگر قبلا پایگاه داده‌اش را آماده كرده است و این گونه نیست كه درست در همان لحظه جست‌وجو، تمام وب را بگردد. هیچ موتور جست‌وجوگری توانایی انجام این كار را ندارند. همه آنها در زمان پاسخ گویی به جست‌وجوهای كاربران، تنها در پایگاه داده‌ای كه در اختیار دارند به جست‌وجو می‌پردازند و نه در وب! موتور جست‌وجوگر به كمك بخش‌های متفاوت خود، اطلاعات مورد نیاز را قبلا جمع‌آوری، تجزیه و تحلیل می‌كند، آن را در پایگاه داده‌اش ذخیره می‌نماید و به هنگام جست‌وجوی کاربر تنها در همین پایگاه داده می‌گردد.
● بخش‌های مجزای یك موتور جست‌وجوگر عبارتند از: Spider ، Crawler ، Indexer ، Database و Ranker حال هر كدام را به تفضیل بررسی می‌كنیم:
▪ Spider (عنکبوت): اسپایدر نرم‌افزاری است كه كار جمع‌آوری اطلاعات مورد نیاز یك موتور جست‌وجوگر را بر عهده دارد. اسپایدر به صفحات مختلف سر می‌زند، محتوای آنها را می‌خواند، لینک‌ها را دنبال، اطلاعات مورد نیاز را جمع‌آوری و آن را در اختیار سایر بخش‌های موتور جست‌وجوگر قرار می‌دهد. همانطور كه كاربران، صفحات مختلف را بازدید می‌كنند، اسپایدر هم درست این كار را انجام می‌دهد با این تفاوت كه اسپایدر كدهای HTML صفحات را می‌بیند اما كاربران نتیجه حاصل از كنار هم قرار گرفتن این كدها را. اسپایدر، به هنگام مشاهده صفحات، بر روی سرورها رد پا برجای می‌گذارد.
شما اگر اجازه دسترسی به آمار دید و بازدیدهای صورت گرفته از یک سایت و اتفاقات انجام شده در آن را داشته باشید، می‌توانید مشخص كنید كه اسپایدر كدام یک از موتورهای جست‌وجوگر صفحات سایت را مورد بازدید قرار داده است.
▪ Crawler (خزنده): كراولر، نرم‌افزاری است كه به عنوان یك فرمانده برای اسپایدر عمل می‌كند. خزنده مشخص می‌كند که اسپایدر كدام صفحات را مورد بازدید قرار دهد. در واقع کراولر تصمیم می‌گیرد كه كدام یك از لینك‌های صفحه‌ای كه اسپایدر در حال حاضر در آن قرار دارد، دنبال شود. کراولر، ممكن است قبلا برنامه‌ریزی شده باشد که آدرس‌های خاصی را طبق برنامه، در اختیار اسپایدر قرار دهد تا از آنها دیدن کند. دنبال كردن لینك‌های یک صفحه به این بستگی دارد كه موتور جست‌وجوگر چه حجمی از اطلاعات یک سایت را می‌تواند در پایگاه داده‌اش ذخیره كند. همچنین ممكن است اجازه دسترسی به بعضی از صفحات به موتورهای جست‌وجوگر داده نشده باشد. دارنده سایت، همان طور كه دوست دارد موتورهای جست‌وجوگر اطلاعات سایت را با خود ببرند، می‌تواند آنها را از بعضی صفحات سایت‌ دور كند و اجازه دسترسی به محتوای آن صفحات را به آنها ندهد.
▪ Indexer (بایگانی كننده): تمام اطلاعات جمع‌آوری شده توسط اسپایدر در اختیار ایندکسر قرار می‌گیرد. در این بخش اطلاعات ارسالی مورد تجزیه و تحلیل قرار می‌گیرند و به بخش‌های متفاوتی تقسیم می‌شوند. تجزیه و تحلیل بدین معنی است كه مشخص می‌شود اطلاعات از كدام صفحه ارسال شده است، چه حجمی دارد، كلمات موجود در آن كدامند، کلمات چند بار تكرار شده‌اند، كلمات در كجای صفحه قرار دارند و ... . در حقیقت ایندکسر، صفحه را به پارامترهای آن خرد می‌کند و تمام این پارامترها را به یک مقیاس عددی تبدیل می‌کند تا سیستم رتبه‌بندی بتواند پارامترهای صفحات مختلف را با هم مقایسه کند. در زمان تجزیه و تحلیل اطلاعات، ایندکسر برای كاهش حجم داده‌ها از بعضی كلمات كه بسیار رایج هستند صرف‌نظر می‌کند. كلماتی نظیر a، an، the، www، is و ... از این گونه كلمات هستند.
▪ DataBase (پایگاه داده): تمام داده‌های تجزیه و تحلیل شده در ایندکسر، به پایگاه داده ارسال می‌گردد. در این بخش داده‌ها گروه‌بندی، كدگذاری و ذخیره می‌شود. همچنین داده‌ها قبل از آنكه ذخیره شوند، طبق تکنیک‌های خاصی فشرده می‌شوند تا حجم كمی از پایگاه داده را اشغال كنند. یك موتور جست‌وجوگر باید پایگاده داده عظیمی داشته باشد و به طور مداوم حجم محتوای آنرا گسترش دهد و البته اطلاعات قدیمی را هم به روز رسانی نماید. بزرگی و به روز بودن پایگاه داده یك موتور جست‌وجوگر برای آن امتیاز محسوب می‌گردد. یكی از تفاوت‌های اصلی موتورهای جست‌وجوگر در حجم پایگاه داده آنها و همچنین روش ذخیره‌سازی داده‌ها در پایگاه داده است.
▪ Ranker (سیستم رتبه‌بندی): كاربران برای استفاده از یك موتور جست‌وجو چند كلمه را در جعبه جست‌وجوی آن وارد می‌كنند و سپس با فشردن Enter منتظر پــاسخ می‌مانند. برای پاسخگویی به درخواست کاربر، ابتدا تمام صفحات موجود در پایگاه داده كه به موضوع جست‌وجو شده، مرتبط هستند، مشخص می‌شوند. پس از آن سیستم رتبه‌بندی وارد عمل شده، آنها را از بیشترین ارتباط تا كمترین ارتباط مرتب می‌كند و به عنوان نتایج جست‌وجو به كاربر نمایش می‌دهد.
حتی اگر موتور جست‌وجوگر بهترین و كامل‌ترین پایگاه داده را داشته باشد اما نتواند پاسخ‌های مرتبطی را ارائه كند، یك موتور جست‌وجوگر ضعیف خواهد بود. در حقیقت سیستم رتبه‌بندی قلب تپنده یك موتور جست‌وجوگر است و تفاوت اصلی موتورهای جست‌وجوگر در این بخش قرار دارد. سیستم رتبه‌بندی برای پاسخ‌گویی به سوالات كاربران، پارامترهای بسیاری را در نظر می‌گیرد تا بتواند بهترین پاسخ‌ها را در اختیار آنها قرار دارد.
● راه ورود موتور جست‌وجوگر به یك سایت
موتور جست‌وجوگر می‌تواند از راه‌های متفاوتی به یک سایت وارد شود. این راه‌ها همان لینک‌ها هستند. موتور جست‌وجوگر برای خواندن صفحات سایت مجوزهای لازم و محدودیت‌ها را در فایل ROBOTS.TXT بررسی می‌کند، هر چند که می‌تواند آن مجوزها را به طور کلی نادیده بگیرد. موتور جست‌وجوگر می‌تواند انواع فایل را بخواند: فایل DOC، PDF، HTML، PHP و ... شب به سایت سر بزند و یا روز. گاهی هم که به سایت سر می‌زند با دست خالی بر می‌گردد زیرا سرور سایت جواب نمی‌دهد و سایت موقتا و یا برای همیشه فعال نیست.
اگر می‌خواهید موتور جست‌وجوگر را به میهمانی سایتتان دعوت کنید باید راه را هم به وی نشان دهید و وی آدرس سایت شما را بداند. موتور جست‌وجوگر بهانه‌های بسیاری برای نپذیرفتن این دعوت دارد زیرا در همان لحظه به سایت‌های بسیار دیگری هم دعوت شده است! بنابراین باید در آدرس دادن نهایت دقت را انجام دهید. پیوندی هم که شما با آن موتور جست‌وجوگر را به سایتتان دعوت می‌کنید، بسیار مهم است. همواره پیوند به سایتتان را در سایت (صفحات) مهم دیگر قرار دهید تا موتور جست‌وجوگر نه یکبار که چندین بار به سایت شما از آن طریق مراجعه کند.
موتور جست‌وجوگر، کافیست که آدرس سایت شما را یاد بگیرد. آن وقت می‌توانید مطمئن باشید که هر ماه حداقل یکبار بدان مراجعه می‌کند. اما اگر پیوندهای سایتتان در سایت‌های معتبر و مهمی باشند آن وقت بیش از یک بار در ماه و حتی هر چند روز یک بار بدان مراجعه می‌کند. پیوند دادن و پیوند گرفتن امروزه مقوله‌ای بسیار جدی میان مدیران سایت‌هاست. شاید هر روزه میلیون‌ها پست الکترونیک فقط برای این موضوع میان مدیران سایت‌ها رد و بدل می‌شود
مهدی رودكی
منبع : روزنامه تفاهم


همچنین مشاهده کنید