پنج شنبه ۶ فروردین ۱۳۹۴ / Thursday, 26 March, 2015
موتورهای جستجوگر اینترنتی

موتورهای جستجوگر اینترنتیموتور جستجو یا جویشگریا جستجوگر به طور عمومی به برنامه‌ای گفته می‌شود که کلمات کلیدی را در یک سند یا بانک اطلاعاتی جستجو می‌کند. در اینترنت به برنامه‌ای گفته می‌شود که کلمات کلیدی موجود در فایلهاو سندهای وب جهانی، گروههای خبری، منوهای گوفر و آرشیوهای FTP را جستجو می‌کند.
برخی از موتورهای جستجو برای تنها یک وب‌گاه(پایگاه وب) اینترنت به کار برده می‌شوند و در اصل موتور جستجویی اختصاصی آن وب‌گاه هستند و تنها محتویات همان وب‌گاه را جستجو می‌کنند.
برخی دیگر نیز ممکن است با استفاده از SPIDERها محتویات وب‌گاههای زیادی را پیمایش کرده و چکیده‌ای از آن را در یک پایگاه اطلاعاتی به شکل شاخص‌گذاری‌شده نگهداری می‌کنند. کاربران سپس می‌توانند با جستجو کردن در این پایگاه داده به پایگاه وبی که اطلاعات موردنظر آنها را در خود دارد پی ببرند.
● انواع جستجوگرها در اینترنت
موتورهای جستجو به دو دسته کلی تقسیم می‌شوند. موتورهای جستجوی پیمایشی (خودکار) و فهرست‌های تکمیل‌دستی (غیر خودکار). هر کدام از آن‌ها برای تکمیل فهرست خود از روش‌های متفاوتی استفاده می‌کنند البته لازم به ذکر است که گونه ای جدید از موتورهای جستجوگر تحت عنوان "ابر جستجوگر" (Meta Search Engines) نیز وجود دارد که در ادامه به توضیح هر یک از این موارد خواهیم پرداخت :
▪ موتورهای جستجوی پیمایشی
موتورهای جستجوی پیمایشی (Crawler-Based Search Engines) مانند گوگل فهرست خود را بصورت خودکار تشکیل می‌دهند. آنها وب را پیمایش کرده، اطلاعاتی را ذخیره می‌کنند، سپس کاربران از میان این اطلاعات ذخیره شده، آنچه را که می‌خواهند جستجو می‌کنند. اگر شما در صفحه وب خود تغییراتی را اعمال نمایید، موتورهای جستجوی پیمایشی آنها را به طور خودکار می‌یابند و سپس این تغییرات در فهرست‌ها اعمال خواهد شد. عنوان، متن و دیگر عناصر صفحه، همگی در این فهرست قرار خواهند گرفت.وجه مشخصه این گروه از جستجوگرها وجود نرم افزار موسوم به SPIDER در آنهاست. این شبه نرم افزار کوچک بصورت خودکار به کاوش در شبکه جهانی پرداخته و از پایگهای وب یادداشت برداری و فهرست برداری میکند سپس این اطلاعات را برای تجزیه و تحلیل و طبقه بندی به بانک اطلاعاتی موتور جستجوگر تحویل می دهد.
▪ فهرست‌های دست نویس شده
فهرست‌های دست نویس شده یا (Human-Powered Directories) مانند فهرست بازی (Open Directory) مانند Dmoz وابسته به کاربرانی است که آن را تکمیل می‌کنند. شما صفحه مورد نظر را به همراه توضیحی کوتاه در فهرست ثبت می‌کنید یا این کار توسط ویراستارهایی که برای آن فهرست در نظر گرفته شده، انجام می‌شود. عمل جستجو در این حالت تنها بر روی توضیحات ثبت شده صورت می‌گیرد و در صورت تغییر روی صفحه وب، روی فهرست تغییری به وجود نخواهد آورد. چیزهایی که برای بهبود یک فهرست‌بندی در یک موتور جستجو مفید هستند، تأثیری بر بهبود فهرست‌بندی یک دایرکتوری ندارند. تنها استثناء این است که یک سایت خوب با پایگاه داده‌ای با محتوای خوب شانس بیشتری نسبت به یک سایت با پایگاه داده ضعیف دارد. البته در مورد جستجوگرهای مشهور مانند گوگل و یاهو، یک مولفه دیگر هم برای بهبود فهرستبندی وجود دارد که کمک مالی (یا به اصطلاح اسپانسر) است، یعنی وب‌گاههایی که مایل به بهبود مکان وب‌گاه خود در فهرست بندی هستند، می‌توانند با پرداخت پول به این جستجوگرها به هدف خویش برسند.
▪ موتورهای جستجوی ترکیبی با نتایج مختلف
به موتورهایی گفته می‌شود که هر دو حالت را در کنار هم نمایش می‌دهند. غالباً، یک موتور جستجوی ترکیبی در صورت نمایش نتیجه جستجو از هر یک از دسته‌های فوق، نتایج حاصل از دسته دیگر را هم مورد توجه قرار می‌دهد. مثلاً موتور جستجوی ام.اس.ان (MSN) بیشتر نتایج حاصل از فهرست‌های تکمیل‌دستی را نشان می‌دهد اما در کنار آن نیم نگاهی هم به نتایج حاصل از جستجوی پیمایشی دارد.
▪ ابر جستجوگرها
این گونه جدید از موتورهای جستجوگر که قدمت چندانی نیز ندارند،بصورت همزمان از چندین موتورجستجوگر برای کاوش در شبکه برای کلید واژه مورد نظر استفاده می کنند .بدین معنی که این موتور عبارت مورد نظر شما را در چندین موتورجستجوگر ‍ِ جستجو کرده و نتایج آنها را با هم ترکیب کرده و یک نتیجه کلی به شما ارائه می‌دهد.به‌عنوان مثال موتورجستجوگر داگ پایل [۱] از نتایج حاصل از موتورهای Google - Yahoo - MSN و ASK استفاده کرده و نتیجه حاصله را به شما ارائه می‌دهد.لازم به ذکر است که روش و یا راهکار مشخص و یکسانی برای ترکیب نتایج حاصله از موتورهای پایه - موتورهایی که به عنوان موتور جستجوگر استفاده میشوند مانند Yahoo که یک موتور پایه برای dogpile میباشد - وجود ندارد.
▪ بررسی یک موتور جستجوی پیمایشی
موتورهای جستجوی پیمایشی شامل سه عنصر اصلی هستند. اولی در اصطلاح عنکبوت (Spider) است که پیمایش‌گر (Crawler) هم نامیده می‌شود. پیمایش‌گر همین که به یک صفحه می‌رسد، آن را می‌خواند و سپس پیوند‌های آن به صفحات دیگر را دنبال می‌نماید. این چیزی‌ست که برای یک سایت پیمایش‌شده (Crawled) اتفاق افتاده است. پیمایش‌گر با یک روال منظم، مثلاً یک یا دو بار در ماه به سایت مراجعه می‌کند تا تغییرات موجود در آن را بیابد. هر چیزی که پیمایش‌گر بیابد به عنصر دوم یک موتور جستجو یعنی فهرست انتقال پیدا می‌کند. فهرست اغلب به کاتالوگی بزرگ اطلاق می‌شود که شامل لیستی از آنچه است که پیمایش‌گر یافته است. مانند کتاب عظیمی که فهرستی را از آنچه پیمایش‌گرها از صفحات وب یافته‌اند، شامل شده است. هرگاه سایتی دچار تغییر شود، این فهرست نیز به روز خواهد شد. از زمانی که تغییری در صفحه‌ای از سایت ایجاد شده تا هنگامی که آن تغییر در فهرست موتور جستجو ثبت شود مدت زمانی طول خواهد کشید. پس ممکن است که یک سایت پیمایش‌شده باشد اما فهرست‌شده نباشد. تا زمانی که این فهرست‌بندی برای آن تغییر ثبت نشده باشد، نمی‌توان انتظار داشت که در نتایج جستجو آن تغییر را ببینیم. نرم‌افزار موتور جستجو، سومین عنصر یک موتور جستجو است و به برنامه‌ای اطلاق می‌شود که به صورت هوشمندانه‌ای داده‌های موجود در فهرست را دسته‌بندی کرده و آنها را بر اساس اهمیت طبقه‌بندی می‌کند تا نتیجه جستجو با کلمه‌های درخواست شده هر چه بیشتر منطبق و مربوط باشد.
▪ رتبه‌بندی صفحات وب توسط موتورهای جستجو
وقتی شما از موتورهای جستجوی پیمایشی چیزی را برای جستجو درخواست می‌نمایید، تقریباً بلافاصله این جستجو از میان میلیون‌ها صفحه صورت گرفته و مرتب می‌شود بطوریکه مربوط‌ترین آنها نسبت به موضوع مورد درخواست شما رتبه بالاتری را احراز نماید. البته باید در نظر داشته باشید که موتورهای جستجو همواره نتایج درستی را به شما ارائه نخواهند داد و مسلماً صفحات نامربوطی را هم در نتیجه جستجو دریافت می‌کنید و گاهی اوقات مجبور هستید که جستجوی دقیقتری را برای آنچه می‌خواهید انجام دهید اما موتورهای جستجو کار حیرت‌انگیز دیگری نیز انجام می‌دهند. فرض کنید که شما به یک کتابدار مراجعه می‌کنید و از وی درباره «سفر» کتابی می‌خواهید. او برای این که جواب درستی به شما بدهد و کتاب مفیدی را به شما ارائه نماید با پرسیدن سؤالاتی از شما و با استفاده از تجارب خود کتاب مورد نظرتان را به شما تحویل خواهد داد. موتورهای جستجو همچنین توانایی ندارند اما به نوعی آنها را شبیه‌سازی می‌کنند. پس موتورهای جستجوی پیمایشی چگونه به پاسخ مورد نظرتان از میان میلیونها صفحه وب می‌رسند؟ آنها یک مجموعه از قوانین را دارند که الگوریتم نامیده می‌شود. الگوریتم‌های مورد نظر برای هر موتور جستجویی خاص و تقریباً سری هستند اما به هر حال از قوانین زیر پیروی می‌کنند:
▪ مکان و بسامد
یکی از قوانین اصلی در الگوریتم‌های رتبه‌بندی موقعیت و بسامد (تعداد تکرار) واژه‌هایی است که در صفحه مورد استفاده قرار گرفته‌اند که بطور خلاصه روش مکان-بسامد (Location/Frequency Methode) نامیده می‌شود. کتابدار مذکور را به خاطر می‌آورِد؟ لازم است که او کتاب‌های در رابطه با واژه «سفر» را طبق درخواست شما بیابد. او در وحله اول احساس می‌کند که شما به دنبال کتاب‌هایی هستید که در نامشان کلمه «سفر» را شامل شوند. موتورهای جستجو هم دقیقاً همان کار را انجام می‌دهند. آنها هم صفحاتی را برایتان فهرست می‌کنند که در برچسب عنوان (Title) موجود در کد زبان نشانه‌گذاری اَبَرمتنی (زنگام) (HTML) حاوی واژه «سفر» باشند. موتورهای جستجو همچنین به دنبال واژه مورد نظر در بالای صفحات و یا در آغاز بندها (پاراگراف‌ها) هستند. آنها فرض می‌کنند که صفحاتی که حاوی آن واژه در بالای خود و یا در آغاز بندها و عناوین باشند به نتیجه مورد نظر شما مربوط‌تر هستند. بسامد عامل بزرگ و مهم دیگری است که موتورهای جستجو از طریق آن صفحات مربوط را شناسایی می‌نمایند. موتورهای جستجو صفحات را تجزیه کرده و با توجه به تکرار واژه‌ای در صفحه متوجه می‌شوند که آن واژه نسبت به دیگر واژه‌ها اهمیت بیش‌تری در آن صفحه دارد و آن صفحه را در درجه بالاتری نسبت به صفحات دیگر قرار می‌دهند.
چگونگی کارکرد دقیق موتورهای جستجو درباره روش‌هایی از قبیل مکان-تکرار فاش نمی‌شود و هر موتور جستجویی روش خاص خود را دنبال می‌کند. به همین دلیل است که وقتی شما واژه‌های همانندی را در موتورهای متفاوت جستجو می‌کنید، به نتایج متفاوتی می‌رسید.الگوریتم های اولیه موتورهای جستجوی معتبر و بزرگ همچنان محرمانه نگهداری می شوند. برخی موتورهای جستجو نسبت به برخی دیگر صفحات بیشتری را فهرست کرده‌اند. نتیجه این خواهد شد که هیچ موتور جستجویی نتیجه جستجوی مشترکی با موتور دیگر نخواهد داشت و شما نتایج متفاوتی را از آنها دریافت می‌کنید. موتورهای جستجو همچنین ممکن است که برخی از صفحات را از فهرست خود حذف کنند البته به شرطی که آن صفحات با هرزنامه (Spam) شدن سعی در گول زدن موتورهای جستجو داشته باشند. فرستادن هرزنامه (Spamming) روشی است که برخی از صفحات برای احراز رتبه بالاتر در موتورهای جستجو در پیش می‌گیرند و آن به این صورت است که با تکرار بیش از حد واژه‌ها و یا بزرگ نوشتن یا بسیار ریز نوشتن متنها بطور عمدی کوشش در بر هم زدن تعادل و در نتیجه فریب موتورهای جستجو دارند. آنها سعی دارند که با افزایش عامل تکرار، در رتبه بالاتری قرار بگیرند. البته آنگونه که گفته شد تعداد تکرار ها اگر از حد و اندازه خاصی فراتر رود نتیجه معکوس می‌دهد.موتورهای جستجو راه‌های متنوعی برای جلوگیری از فرستادن هرزنامه دارند و در این راه از گزارش‌های کاربران خود نیز بهره می‌برند. امروزه بهینه سازی سایت های اینترنت برای موتورهای جستجو یکی از مهم‌ترین روشهای جلب بازدید کننده به سایت است.
▪ عوامل خارج از صفحه
موتورهای جستجوی گردشی اکنون تجربه فراوانی در رابطه با وب‌دارهایی دارند که صفحات خود را برای کسب رتبه بهتر مرتباً بازنویسی می‌کنند. بعضی از وب‌دارها (وب‌مسترها)ی خبره حتی ممکن است به سمت روش‌هایی مانند مهندسی معکوس برای کشف چگونگی روش‌های مکان-تکرار بروند. به همین دلیل، تمامی موتورهای جستجوی معروف از روش‌های امتیازبندی «خارج از صفحه» استفاده می‌کنند. عوامل خارج از صفحه عواملی هستند که از تیررس وب‌دارها خارجند و آنها نمی‌توانند در آن دخالت کنند و مسأله مهم در آن تحلیل ارتباطات و پیوندهاست. به وسیله تجزیه صفحات، موتورهای جستجو پیوندها را بررسی کرده و از محبوبیت آنها می‌فهمند که آن صفحات مهم بوده و شایسته ترفیع رتبه هستند. به علاوه تکنیک‌های پیشرفته به گونه‌ای است که از ایجاد پیوندهای مصنوعی توسط وب‌دارها برای فریب موتورهای جستجو جلوگیری می‌نماید. علاوه بر آن موتورهای جستجو بررسی می‌کنند که کدام صفحه توسط یک کاربر که واژه‌ای را جستجو کرده انتخاب می‌شود و سپس با توجه به تعداد انتخاب‌ها، رتبه صفحه مورد نظر را تعیین کرده و مقام آن را در نتیجه جستجو جابه‌جا می‌نمایند.
http://pr-so.blogfa.com/

مطالب مرتبط

کلمات در حال جستجو
شبکه علم و فرهنگ , الجیاد , محمد پژمان , کلوزه , گروه خونی B , شانگهای , ترفندستان دریچه , قدومی , هفته دوازدهم , آقا بزرگ , پلنگ , السلحه , آغی , کابل ایمنی , شهرام فرزین فر , آزار اذیت , نرم افزار مترجم , گوارديولا , شهرام لاسمی , برادازی ,

برخی از مطالبی که کاربران هم اکنون در حال خواندن آن هستند
آبسه‌ها , قوانین امور گمرکی ترانزیت داخلی (۳) , وله ایضا , نقش تجویزشده و نقش کاربسته , آلفرد هیچکاک (۲) , مرگ اسکندر و پایان داستان , تولیدات نفتی , بقعه شیخ صفی‌الدین اردبیلی، اردبیل , فرم درخواست تعیین تعرفه از گمرک ایران , شانه‌های افتاده , تاریخ تمدن چین , گردنبند و کلاغ , بیماری‌های التهابی روده , کوچولوی چشم آبی , برش لاشه , نشانه‌ها و علائم , امشب ای یار قصد خواب مکن , خانواده , آثار عملیات چند ملیتی بر اقتصاد کشورهای میزبان(۲) , خرکم , منوچهر مطیعی تهرانی , مشخص‌کردن حدود فیستول , اختیارات نخست‌وزیر , لاواژ صفاقی , بخش‌های مختلف اقتصای , گفت کسی خواجه سنایی بمرد , گیاه کامل , ناهمواریها , تركیبات شیمیائی , در ستایش ابوبکر بن سعد ,

وبگردی
فرخنده زنده زنده سوزانده شد / تصاویر - گروهی از مردم افغانستان در کابل پایتخت این کشور یک زن را به شدت مورد ضرب و شتم قرار داده و کُشتند. مقامات امنیتی در کابل با تأیید این خبر اعلام کردند که مردان خشمگین در مرکز شهر، یک زن را که گفته شده قرآن را به آتش کشیده کشتند.
پاسخ فرزاد حسنی به افشاگری آزاده نامداری - بر فرض محال اگر این ادعاهای کذب صحت هم داشت، آیا این روش درستی برای بیان آنهاست؟ ریختن آبروی دیگران و حتی خانواده خود به چه قیمتی؟ به قیمت پخش تصویرمان از تلویزیون؟! انسان ها را از روشی که برای رسیدن به هدفشان انتخاب می کنند بشناسید...
ضرب و شتم آزاده نامداری و افشاگری بی‌سابقه - آزاده نامداری با به اشتراک گذاشتن عکسی تلخ و دردناک از آثار شدید ضرب و شتم روی صورت و چشم خود، از اتفاقاتی غیرقابل باور مربوط به زندگی گذشته اش . آقای حسنی چهل تا فایل صوتی دست من داری که مدت هاست حتی خودم گوشش ندادم.
شایعه رابطه احسان علیخانی و آزاده نامداری! / تصاویر اینستاگرام - توضیحات آزاده نامداری درباره یک شایعه - امروز آقای علیخانی چون صفحه‌ای دراینستاگرام ندارن ازمن خواستن توضیحی به هوادارانشون ودوستای خوب خودم بدم.
دختر گلفروش تجریش پدیده جدید شبکه‌های اجتماعی - دختر گلفروش میدان تجریش. این همه چیزی بود که از پدیده این روزهای شبکه‌های اجتماعی و رسانه‌ها می‌دانستیم و البته چند عکس که از او منتشر شده بود. دختری که با ظاهری خاص توجهات را به خود جلب کرده بود.
شبکه‌های اجتماعی با ما چه کرده‌اند / فیلم - شبکه‌های اجتماعی چگونه ما را منزوی کرده‌اند. آیا شما هم ساعت‌های زیادی را صرف شبکه‌های اجتماعی و دنیای مجازی میکنید حتما این ویدیو را نگاه کنید.
پربازدیدها
ترکیب تیم ملی ایران و شیلی اعلام شد - ترکیب تیم ملی فوتبال ایران برای دیدار با شیلی اعلام شد.
ترکیب تیم ملی ایران برای دیدار با شیلی مشخص شد - ترکیب تیم ملی ایران برای دیدار دوستانه با تیم ملی شیلی مشخص شد.
ترکیب تیم ملی فوتبال ایران برای دیدار برابر شیلی اعلام شد - ترکیب تیم ملی فوتبال ایران برای برگزاری نخستین دیدار این تیم در سال جدید اعلام شد. این بازی شامگاه پنجشنبه بین تیم های ملی فوتبال ایران و شیلی در اردوی اتریش برگزار خواهد شد.
نشست عمومی مذاکرات معاونان وزیران خارجه ایران و 1+5 در لوزان - معاونان وزیران خارجه ایران و 1+5 عصر روز پنجشنبه در اولین روز از مذاکرات هسته ای در لوزان سوییس دیدار کردند.
ارتش و نیروهای مردمی عراق در حال پیشروی در تکریت هستند - هواپیماهای آمریکا نیز اهدافی را در تکریت بمباران کردند.
ادعای موافقت آمریکا با ادامه فعالیت فردو - به گفته مقامات غربی که جزئیات این مساله در اختیار آسوشیتدپرس گذاشته‌اند، ایران اجازه خواهد داشت به فعالیت غنی‌سازی در فردو ادامه دهد البته به این شرط که این غنی‌سازی به توانایی ساخت سلاح هسته‌ای منجر نشود و تحت نظارت‌های بین‌المللی قرار داشته باشد. سانتریفیوژهای مستقر در فردو به جای غنی‌سازی اورانیوم، با موادی مانند روی، زنون و ژرمانیوم کار می‌کنند که جداسازی ایزوتوپ‌های آن در بخش‌های پزشکی، صنعتی و علمی کاربرد دارد.
حرم حضرت سکینه در حمله تروریست‌های سوریه تخریب شد + عکس - حرم حضرت سکینه علیها‌السلام در منطقه «داریا» در ریف دمشق سوریه، در حمله افراد مسلح به شکلی وسیع تخریب شد.
عبدالملک الحوثی: عربستان و آمریکا در رأس نیروهای شر قرار دارند - رهبر جنبش انصارالله یمن با محکوم کردن تجاوز عربستان سعودی به یمن، این اقدام را کاملا بی‌توجیه دانست که در راستای منافع آمریکا و اسرائیل است.
خبرهای جدید هسته ای به روایت عراقچی و صالحی/ احتمال موافقت با غنی سازی در فردو / ورود مستقیم روحانی به مذاکرات هسته ای - مثلث آنلاین:خبرگزاری آسوشیتدپرس مدعی شد که واشنگتن در حال بررسی موافقت با ادامه غنی‌سازی در سایت فردو است.




Copyright © 2008 - 2015 vista.ir. All Rights Reserved