دوشنبه, ۱۰ اردیبهشت, ۱۴۰۳ / 29 April, 2024
مجله ویستا

چشم اندازهایی بر وب‌سنجی


چشم اندازهایی بر وب‌سنجی
از اواسط دهه ۱۹۹۰ حوزه پژوهشی جدیدی به نام «وب‌سنجی» بر پایه روش‌های اطلاع‌سنجی جدید به وجود آمد كه كار آن، پژوهش درباره ماهیت و خصوصیات وب است. این مقاله سعی دارد حوزه‌های منتخبی از پژوهش وب سنجی را كه روند و فضای مناسبی برای توسعه دارند و همچنین برخی حوزه‌هایی را كه در حال حاضر كمتر دارای آینده‌ای روشن هستند معرفی كند. پژوهش‌های جدید درباره پوشش و عملكرد موتورهای كاوش، آنها را به عنوان قالب و چارچوبی برای تحلیل گزینشی كیفیت و محتوا، شناخته است.مشكلات مربوط به عوامل تأثیرگذار وب مورد بحث قرار گرفته است و در پایان مقاله راهنمایی‌های جدید وب‌سنجی برای اجرای كشف دانش و ردیابی موضوع روی وب-كه تا حدودی مبتنی بر روش كتابسنجی استفاده شده در پایگاههای اطلاعاتی استنادی و كتابشناختی است- به صورت كلی مطرح شده است. در این چارچوب راهبردهای نظریه نمودار یكپارچه، شامل: تحلیل مسیر، پیوندهای متقاطع (عرضی)، پیوندهای ضعیف و پدیده جهان كوچك مورد توجه قرار گرفته است.از اواسط دهه ۱۹۹۰ تلاش‌های روزافزونی برای بررسی ماهیت و خصوصیات وب جهان گستر كه در این مقاله «وب» نامیده می‌شود، با به كارگیری روش اطلاع‌سنجی جدید برای فضای محتویات آن، ساختار پیوندها۱ و موتورهای کاوش، صورت پذیرفت. مطالعه روی وب در سال ۱۹۹۷ را آلمایند و اینگورسن۲ وب‌سنجی نامیده و یا در مجله‌ای الکترونیکی با عنوان سایبرمتریك۳ در سال ۱۹۹۷ سایبرمتریك (مجازی سنجی) نامگذاری شد. این مقاله سعی دارد حوزه‌های منتخبی از پژوهش وب‌سنجی را که فضای مناسبی برای توسعه دارند، معرفی كند.این نوشته مقاله كاملی نیست، اما نسبتاً تخصصی است. وب‌سنجی شباهت‌های متعددی با مطالعات علم‌سنجی، اطلاع‌سنجی و كاربرد روش‌های کتابسنجی متداول دارد. برای مثال، محاسبات ساده و تحلیل محتوای صفحات وب، شبیه به تحلیل انتشارات سنتی هستند؛ محاسبه و تجزیه و تحلیل پیوندهای بیرون رونده از صفحات وب كه در اینجا پیوندهای بیرونی۴ و پیوندهایی كه به خود صفحات وب داده می‌شوند، پیوندهای درونی۵ نامیده می‌شوند به ترتیب به عنوان مرجع (مأخذ)۶ و تحلیل استنادی۷ در نظر گرفته می‌شوند. بنابراین، در مقالات علمی، پیوندهای بیرونی و درونی به ترتیب شبیه مراجع(مآخذ) و استنادها هستند. هرچند وب به علت ماهیت پویا و توزیعی، غالباً صفحاتش را كه به صورت همزمان به یكدیگر پیوند داده شده‌اند- حالتی كه در كتاب به شكل سنتی امكان ندارد- در فضایی كه بر پایه استناد گذارده شده نمایش می دهد. پوشش موتورهای کاوش در سراسر وب می‌تواند به همان شیوه‌ای كه پوشش حوزه۸ و پایگاه‌های اطلاعاتی استنادی در کل اسناد و مدارک و امكان همپوشانی‌های بین موتورهای شناسایی شده، مورد پژوهش قرار گیرد. از آن زمانی كه وب از مشاركت هر كسی كه دوست داشت در آن شركت كند برخوردار شد، در نتیجه فقدان بازبینی‌های دقیق، كیفیت اطلاعات یا ارزش دانش دچار ابهام گردید؛ اما تحلیل پیوندها ممكن است گروهی از سایت‌های تجدیدنظر و بازبینی شده را نشان دهد. الگوهای رفتارِ کاوش در وب۹ می‌تواند، مانند مطالعات اطلاع یابی سنتی، مورد پژوهش قرار گیرد.ردیابی موضوع در محیط وب تأمین شده و اقداماتی برای کشف دانش، شبیه به داده‌های رایج (مشترک۱۰) یا متن کاوی (استخراج متن۱۱) در پایگاه‌های اطلاعاتی متنی (کتابشناختی) یا اداری (اجرایی) انجام گرفته است. از زمانی كه وب فضای اطلاعاتی كاملاً متفاوتی از سایر پایگاه‌های اطلاعاتیِ علمی یا حرفه‌ای متداول، شده است، بعضی وقت‌ها شباهت‌های مذكور ممكن است به صورت كم عمق و سطحی ظاهر گردد. برای مثال، ما با اطمینان نمی دانیم كه چرا مردم در وب به سایر صفحات پیوند می دهند.
هیچ قراردادی برای استناد در محیط وب همانند آثار علمی چاپی وجود ندارد. علاوه بر این، زمان نقش متفاوتی بر روی وب ایفا می‌نماید. از سوی دیگر، به دلیل این كه وب مجموعه‌ای است بسیار پیچیده از کلیه انواع اطلاعاتی كه به وسیله انسان های متفاوت تولید می‌شود و همچنین توسط كاربران مختلف مورد جستجو قرار می‌گیرد، موضوع جالبی برای پژوهش است، و در واقع، اطلاع‌سنجی روش‌هایی را برای شروع پژوهش در وب ارائه می‌كند. هرچند یك نفر باید با درخواست پیوسته از پایگاه‌های اطلاعاتی استنادی كنترل شده توسط مؤسسه اطلاعات علمی۱۲ آگاه شود، برای مثال، از طریق زبان دستور۱۳ پایگاه اطلاعاتی دایالوگ. گردآوری داده‌ها در محیط وب، به ویژگی‌ها و خصوصیات بازیابی موتورهای کاوش مختلف و روبات‌های وب، بستگی دارد. پیش از ظهور دستور “set posting on” در پایگاه اطلاعاتی دایالوگ۱۴ در طی دهه ۱۹۹۰، محاسبه استنادها به صورت پیوسته امكان پذیر نبود. یك نفر باید تمام مدارك استناد شده را جهت تحلیل به صورت محلی، به منظور شمارش تعداد واقعی استنادها در فضای اطلاعاتی تعریف شده به وسیله موسسه اطلاعات علمی، بارگذاری (فروفرستی) می کرد. امروزه این حالتی است كه در اكثر موتورهای وب وجود دارد كه روسو در سال‌های ۱۹۹۷ و ۱۹۹۹ آن را اثبات كرد.
این موتورها كل وب را نمایه‌سازی نمی‌كنند، همپوشانی آنها قابل توجه نیست (لارنس و گیلز، ۱۹۹۹) و ویژگی‌های بازیابی آنها برای تحلیل‌های وب‌سنجی گسترده پیوسته۱۵ بسیار ساده است. بنابراین، نمونه‌گیری بسیار مهم و حساس است، ولی اجرای آن مشكل است و پالایش آن ضروری است، به همین جهت مهندسی مجدد و پاكسازی اطلاعات در تحلیل‌های وب‌سنجی عنصری مهم است.این مقاله به برخی از پژوهش‌های اخیر كه عملكرد و پوشش موتورهای وب را به عنوان چارچوبی برای تحلیل‌های گزینشی كیفیت و محتوا مورد توجه قرار داده اند، اشاره می‌نماید و سپس ما به دنبال تحلیل سایت‌ها (پیوندها) ۱۶ مانند تحلیل «پیوند-صفحه»۱۷ در اصطلاحات روسو (۱۹۹۷) و مطالعات عامل تأثیرگذار وب هستیم. تلاش‌هایی به منظور فراهم کردن مسیرهای جدید خروجی (برون رفت) وب‌سنجی از طریق اجرای كشف دانش و ردیابی موضوع، به عنوان مثال به وسیله ساختار پیوندهای متقاطع و پیوندهای ضعیف، در نتیجه‌گیری مقاله مورد بحث قرار گرفته اند.
● پژوهش‌های كیفی و پوششی موتورهای وب
لورنس و گیلز (۱۹۹۸) مقاله‌ای بنیادی نوشتند که در آن پوشش موتورهای کاوش تجاری در محیط وب را با معرفی محتوای ‍وب قابل نمایه‌سازی»۱۸، مدنظر قرار دادند. مفهوم وب قابل نمایه‌سازی بر بخشی از وب كه می‌تواند با موتورهای کاوش نمایه شود به استثنای اسناد و مدارک پایگاه‌های اطلاعاتی، مانند دایالوگ، دلالت دارد. آزمون گسترده‌ای كه در دسامبر ۱۹۹۷ بین ۶ موتور کاوش برتر تجاری اصلی یعنی: آلتاویستا، هات بات، نورثرن لایت، اینفوسیک، لیکوس و اکسایت انجام گرفت، سطح پایینی از قابلیت نمایه‌سازی وب در حدود ۳۲۰ میلیون صفحه را نشان داد. این پژوهش همچنین نشان داد كه پوشش هر یك از موتورها به صورت قابل ملاحظه‌ای، با نمایه‌سازی یك سوم «وب قابل نمایه‌سازی» محدود شده‌است.احتمالاً دلایل زیادی برای این نتیجه‌گیری وجود دارد. به عنوان مثال، عمق و جامعیت نمایه‌سازی در خدمت دهنده۱۹‌های محلی بازدید شده به وسیله موتورهای کاوش به چگونگی سازماندهی و ساختار یك سایت، كه ممكن است خروجی بازیابی را تحت تأثیر قرار دهد بستگی دارد، همان طور كه ممكن است روش نمایه‌سازی، واژه‌های پرسش (سؤال) را تحت تأثیر قرار دهد.
برای مثال، از طریق کوتاه‌سازی تحمیلی۲۰ مدارک وبی طولانی، تلاش‌های دیگری نیز برای ارزشیابی موتورهای وب انجام شده است، مثلاً مشاهده كیفیت فهرست‌های رتبه بندی شده مدارک وب كه به وسیله موتورهای اصلی بازیابی شده‌اند (كورتوا و بری، ۱۹۹۹). در کنار سایر یافته‌ها، این مقاله در مورد دانش كم و بیش در دسترس عموم و درباره ویژگی‌های مختلف نمایه‌سازی و بازیابی كه به وسیله هر یك از موتورها استفاده شده است، بحث می‌كند. روش ارزیابی موتورهای وب به وسیله کلارک و ویلت۲۱ (۱۹۹۷) که آلتاویستا، لیکوس و اکسایت را با هم مقایسه نمودند، مطرح شده است. علاوه براین، آن مقاله، ارزیابی انتقادی از پژوهش‌های پیشین را نشان داده و روشی واقع‌بینانه و معقول را که شامل اندازه‌گیری جامعیت نسبی است، فراهم می‌كند. همچنین آن مقاله نتیجه گرفت كه آلتاویستا به صورت قابل ملاحظه‌ای بهتر از لیکوس و اکسایت عمل کرده است. اُپنهایم۲۲ و دیگران (۲۰۰۰) پژوهشی مشروح و روزآمد درباره ارزیابی موتورهای کاوش وب، شامل بحثی در باب روش‌های آزمون، فراهم نمودند. در حالی كه بسیاری از مطالعات ارزیابی و پوششی به ربط و تعداد صفحات وب در یك زمان معین توجه می‌كنند، سایر تحلیل‌های انتقادی، بازیابی پیوند- صفحه را در بر می گیرند (سیندر و رزن‌باوم، ۱۹۹۹) و یا پژوهش‌های ساختاری یا پوششی وب مبتنی بر سری‌های زمانی۲۳ را پوشش می دهند. اسنایدر و روزنبوم نیز مانند اینگورسن(۱۹۹۸) ناهماهنگی‌ها و تفاوت‌های زیادی را به ویژه در رابطه با بازیابی پیوند-صفحه موتور آلتاویستا مشاهده كردند. بی نظمی‌های آن موتور را همچنین بار- ایلان (۱۹۹۹) در یك مطالعه طولی۲۴ و نیز روسو (۱۹۹۹) كسی كه دو موتور آلتاویستا و نورثرن لایت را طی ۲۱ هفته به صورت روزانه در طی سال ۱۹۹۹ مورد مقایسه قرار داده بود، گزارش كرده‌اند.مطالعه بعدی از سه واژه مفردِ عام یکسان به عنوان پرسش (واژه‌های جستجو) در طولِ مدت ارزیابی استفاده کرد. در حالی که نورثرن لایت، همان طور که پیش‌بینی شده بود، یک افزایش ثابت و منظم از موفقیت‌های همزمان با گسترش وب را نشان می داد، آلتاویستا در شکل(فرم) بسیار ثابت و جدیدی مجدداً آغاز به کار کرد و گوناگونی و تغییرات زیادی را در طول زمان تا یک تاریخ به خصوص (۲۵ اکتبر۱۹۹۹) نشان می داد. در آن تاریخ تعداد صفحات وب بازیابی شده به طور چشمگیری همراه با این تأثیر شبه نو اختر۲۵ مبتنی بر پرسش افزایش یافت(روسو، ۱۹۹۹، ص۵).بعدها تا حدودی احتمالاً به علت حذف پیوند-صفحه‌های غیرفعال و خاموش، این تعداد کاهش یافت.روسو هنوز استفاده از یک صافی میانه را برای كاهش تأثیر گوناگونی نتایج در آن موتور خاص پیشنهاد می‌كند. نتیجه دیگر آن مطالعه این است كه نتایج عوامل تأثیرگذار وب كه اینگورسن در سال ۱۹۹۸ منتشر كرد احتمالاً بسیار مشكوك و غیرقابل اطمینان هستند، چون که نتایج مجموعه داده‌های او، هم برای صفحات وب و هم برای صفحات پیوند درونی از نسخه بی ثبات و قدیمی آلتاویستا ناشی شده است. دلیل این که چرا کانون تمرکز روی آلتاویستا قرار دارد، این است كه موتور کاوش آلتاویستا به طور وسیعی وب را پوشش می دهد و بدین نحو شرایط جستجوی مناسبی را برای مطالعات اطلاع‌سنجی وب فراهم می‌كند. سری‌های(توالی) زمانی به نظر می رسد، به عنوان وسیله‌ای كه نمایشگر عملكرد موتور وب است بسیار مفید باشد.
● كیفیت و ویژگی‌های صفحه وب
مطابق نظر کرونین و مک کیم، وب در حال تغییر شکل روش‌هایی است که از طریق آنها محققان با یكدیگر ارتباط برقرار كنند. انواع جدیدی از انتشارات علمی و آثار دست اول (از قبیل تحقیقات در حال اجرا، آثار آماده چاپ و پیش نویس های قدیمی) پدیدار شده‌اند. امروزه آثار در حال اجرا، اعلامیه‌های دیواری، طرح های مقدماتی پیشین و مقاله‌های داوری شده تقریباًً بلافاصله قابل اشتراك هستند. پدیدآورندگان می‌توانند میان پخش محدود و پخش گسترده، انتخاب کنند و بررسی دقیق از حالت مخفی به سمت نشان دادن طیفی از قابلیت‌ها شکل گرفته است (كرونین و مك‌كیم، ۱۹۹۶، ص۱۷۰). این عقیده و تصور هم اکنون واقعیت است. بنابراین، تحلیل‌های وب‌سنجی ماهیت، ساختارها و ویژگی‌های محتوایی سایت‌ها و صفحات وب و همچنین ساختار پیوندها به منظور درك بزرگراه‌های مجازی و ارتباطات درونی آنها مهم هستند. لارسون (۱۹۹۶) یكی از اولین متخصصان اطلاع رسانی بود كه یک تحلیل مقدماتی درباره ساختار فکری و عقلانی فضای مجازی۲۶ اجرا نمود. چندی بعد، آلمایند و اینگورسن (۱۹۹۷) روش‌های متنوعی شبیه کتابسنجی را برای بخش‌های شمالی وب۲۷ به منظور مشاهده انواع اتصالات۲۸(پیوندهای) صفحه و تعریف نوع شناسی۲۹ صفحات وب كه عملاً در سطح کشورهای شمالی پیدا شده‌اند، به كار بردند. روش پژوهش، شامل نمونه‌گیری طبقه‌ای از صفحات وب و بارگذاری به منظور تحلیل محلی بود. در میان یافته‌های جالب توجه، این تحلیل‌ها نشان داده‌اند كه هر صفحه وب قادر به پیوند بیرونی، تقریباًً به طور متوسط ۹ پیوند بیرونی فراهم می کند. تناسبی که امروزه در رشد تصاعدی فضای وب حفظ می‌شود. این مقاله، همچنین تلاش كرده است مقایسه‌ای میان بخش صفحات وب علمی ارزیابی شده و پراكندگی یافته شده در نمایه‌های استنادی میان كشورهای شمالی را انجام دهد. مسلماً، دامنه دید روی وب از نمایش در پایگاه‌های اطلاعاتی استنادی كاملاً متفاوت است. برای مثال نروژ، در زمان انجام این تحلیل در سطح وب نسبت به دنیای چاپ بسیار مشهورتر بود. اهمیت ویژه صفحه‌های خانگی شخصی به وسیله بتس و لو۳۰ (۱۹۹۷) و نیز توسط واین و کتز۳۱ (۱۹۹۷) نشان داده شده است که عمدتاً روی صحنه فضای مجازی ایالات متحده آمریکا متمرکز شده است که بعدها برای مثال توسط دیلون و گوشروسکی۳۲ (۲۰۰۰) پیگیری و دنبال شده است.به طور آشکار این دستاورد و پیشرفت به هرکسی اجازه می دهد تا مسائل خود را عملاً و بدون نظارت مقامات صلاحیت دار بیان نماید و همچنین از طریق ایجاد پیوند به صفحاتی که یک شخص می خواهد متصل شود، به خاطر وجود پیوند به آن صفحات، اعتبار کسب کند و نیز موجب فراهم کردن امکان دسترسی به داده‌ها، اطلاعات، ارزش‌ها، و دانش در شکل‌ها و مقادیر متعددی شود و آزادی اطلاعات را حتی در مناطق و کشورهایی که زیرساخت ضعیفی دارند، ایجاد كند. روی دیگر سكه این است كه وب، بیش از پیش به محیطی نامطمئن و قابل شك برای استفاده كنندگانش تبدیل شده است؛ خط قرمز باریك موجود میان پیچیدگی، حقیقت تاریک و مبهم، اطلاعات غلط، عقاید، نظرات، تصورات یا تأملات و پایایی، كیفیت، روایی، ربط یا حقیقت، به طور روزافزونی کمتر شده است و این عین واقعیت است. باستان شناسی وب۳۳، در آینده دست در دست روش‌ها و تحلیل‌های وب‌سنجی پیش خواهد رفت.در حال حاضر ارزیابی و مشاهده كیفیت، بسیار مورد نیاز است؛ به ویژه حوزه‌های پزشكی و بهداشت، زمینه‌های مهمی به منظور پژوهش برای چنین موضوع هایی هستند. لی کوی۳۴ اخیراً استفاده از روش‌های تحلیل استنادی روی وب را برای مشخص كردن سایت‌های پیوند درونی شده پُربسامد و همپوشانی در زمینه اطلاعات پزشكی (۱۹۹۹) ابداع نموده است. آلن و دیگران نیز به اعتبار و ربط صفحات وب مرتبط به هم توجه كرده‌اند. در مقاله کوی، یک نفر به سایر مطالعات اخیر موضوعات هنر و بهداشت روی وب، ارجاع داده است به این دلیل که تحلیل استنادی وب به عنوان یکی از شاخص های اساسی كیفیت به كار برده شده است (اشن‌باخ، ۱۹۹۸).توزیع برادفورد از هزاران پیوند خاطر نشان شده از سوی ۲۵ دانشکده از بهترین دانشکده‌های پزشكی آمریکا به عنوان پیوندهای قوی، توسط کوی، به منظور نشان دادن سایت‌های هسته۳۵ مربوط به موضوع های خاص بهداشت به کار برده شده است. مقاله آلن و دیگران، یک پژوهش کارشناسانه درباره پایایی وب‌سایت‌های علمی است. همانند موردی كه برای مطالعه طولی روسو (۱۹۹۹) که در بالا ذكر شد، این پژوهش پیمایشی مبتنی است بر بازیابی سایت‌ها مطابق با سه سؤال نمونه درباره:
۱) ارزیابی
۲) نظام تعریف شده به شكل ژنتیكی
۳) گونه‌های در معرض خطر.
برای هر پرسش۳۶،۵۰۰ وب‌سایت، نخست به طور متوالی و پی در پی و مستقل توسط دو داور متخصص بررسی شدند. تقریباً ۶۰ سایت حاوی اطلاعات مربوط به موضوع بود. این روش شبیه روشی است که در آزمایش‌های جهانی اخیر ارزیابی «بازیابی اطلاعات در کنفرانس بازیابی متن»۳۷ استفاده شده است. این ۶۰ سایت موضوعی برای هر پژوهش پس از بررسی با عناوین ذیل امتیاز بندی شدند:
▪ نادرست۳۸: اگر آنها واقعاً حاوی اطلاعات اشتباه بودند.
▪ گمراه كننده۳۹: اگر آنها علم را غلط تعبییر نموده بودند یا به طور وقیحانه‌ای حقایقی را که یک موقعیت مخالف را تأیید می کرد، حذف کرده بودند.
▪ بی مأخذ۴۰: اگر آنها اطلاعات را بدون هیچ گونه مأخذ بررسی شده دقیق ارائه کرده بودند.
امتیاز آخر (یعنی بی مأخذ) کاملاً عینی و مشخص است. در مجموع، مقدار امتیازهای مورد توافق داوران به منظور امتیازبندی مقو له‌های نادرست و گمراه كننده به این شرح بودند: ۸/۸۷ درصد برای سایت‌های ارزیابی، ۸/۸۲ درصد برای سایت‌های نظام تعریف شده به شكل ژنتیكی و ۶/۷۳ درصد برای وب‌سایت‌های گونه‌های در معرض خطر بازیابی و ارزشیابی شدند. سایت‌های بی مأخذ برای هر سؤال، بیش از ۴۸ درصد محاسبه شدند.این نتایج علت شک و تردید در مورد قابلیت اعتمادِ اطلاعات را تصدیق می‌کنند. ورودیها و كتابخانه‌های کاملاً رقومی به راستی ممكن است -مانند پایگاه‌های اطلاعاتی علمی متنی سنتی- بازبینی اطلاعات دقیقاً بررسی شده معتبر را پیشنهاد نمایند و مانند زمینه‌ای برای تحلیل‌های وب‌سنجی عمل كنند.
● مطالعات عوامل تأثیرگذار وب
روسو (۱۹۹۷) در مقاله وب‌سنجی معروفش، درباره «پیوند به سایت‌ها»۴۱، یعنی پیوندهای درونی، الگوهای توزیع وب سایت‌ها و پیوندهای در حال آمدن۴۲ را مورد تحلیل قرار داد. روسو هم مانند اینگورسن (۱۹۹۸) از نسخه قدیمی آلتاویستا استفاده کرده‌است، مطالعه‌اش را با ۳۴۳ سایت بارگذاری شده (نقاط داده‌ای۴۳) كه از طریق یک کاوش درباره «اطلاع‌سنجی یا کتابسنجی یا علم‌سنجی» بازیابی شده بودند، انجام داد. بنابراین، این تحلیل از ویژگی‌های موتور وب مستقل تر و قوی‌تر است. مطالعه نشان می دهد كه توزیع حوزه‌های سطح بالا برای این سایت‌ها از توزیع لوتکا پیروی می‌نماید. به طور مشابه، روسو نشان داد كه توزیع استنادی آن ۳۴۳ سایت نیز از توزیع لوتکا۴۴ پیروی می‌كنند و نسبت خود-پیوندها۴۵ را ۳۰ درصد برآورد کرده است.تفاوت میان پیوندها و پیوند- صفحه‌ها به وسیله اینگورسن (۱۹۹۸) در اقدام او برای محاسبه عوامل تأثیرگذار وب برای حوزه‌های ملی۴۶ و سایت‌های شخصی نشان داده شده است. پیش از اینگورسن، رودریگوز گایرین (۱۹۹۷) مفهوم «تأثیر اطلاعات روی اینترنت» را در مجله اسپانیایی دکومانتاسیون، معرفی کرده است. عقیده و نظر اساسی این بود كه عوامل تأثیرگذار وب ممكن است درباره آگاهی یا شناخت از سایت‌های ملی (به طور میانگین) یا سایت‌های شخصی اطلاع دهند. این مطالعه به سه نتیجه جالب دست یافت:
۱) موتور کاوش آلتاویستا نمی‌تواند تعداد واقعی پیوندهای درونی به سایت‌های خاص را محاسبه نماید، بلکه فقط تعداد صفحاتی را که حداقل یک پیوند درونی (یا پیوند به سایت) در بر دارند، محاسبه می کند. در مجموع، «خود-پیوندها»۴۷ عوامل‌تأثیرگذار وب ‌را ‌تحت تأثیر قرار نخواهند داد. بنابراین، پیوندهای درونی‌خارجی۴۸ برای مشاهده دارای اهمیت خاصی هستند. میانگین نمره و امتیاز «خود- پیوند» در مطالعه اینگورسن تقریباً ۵/۰ و حوزه‌هایی با پسوند «com» ۵۹/۰ بوده است. به طور میانگین عوامل تأثیرگذار «پیوند- صفحه» خارجی ۳۹/۰ بود.
۲) عوامل تأثیرگذار وب برای وب‌سایت‌های شخصی، غیرواقعی‌تر از آن حوزه‌ها بود.
۳) در این محاسبات، واریانس ابزار ارزشیابی موتور وب بود.همچنین مسئله اخیر، واریانس، استفاده از روش‌های کاملاً پیچیده را برای محاسبه كردن عوامل تأثیرگذار و معرفی تنظیم پرسش مشروح پیشنهاد می کند. همان طور که قبلاً روسو (۱۹۹۹) نشان داد موتور کاوش آلتاویستا در زمان تحلیلِ عوامل تأثیرگذار وب در مقایسه با نسخه بعدی اكتبر ۱۹۹۹ واقعاً بی ثبات بود. بنابراین، محاسبات عوامل تأثیرگذار وب ممكن است به عنوان شاخص عملكرد موتور کاوش عمل نماید. در مجموع، دلیل استفاده کردن از موتور آلتاویستا، پوشش و توانایی‌های دستور بازیابی آن، برای جستجوی «صفحات حوزه» در روش‌های كنترل شده و نیز پیوند- صفحه‌ها بود. در رابطه با نتیجه دوم مطالعه اینگورسن درباره بی ثباتی و نوسان زیاد عوامل تأثیرگذارِ وب‌سایت‌های شخصی، اسمیت (۱۹۹۹) و همچنین ثلوال۴۹ (۲۰۰۰) در مورد این پدیده، بیشتر پژوهش کردند. متأسفانه هنوز (۱۹۹۹) نسخه بی ثبات آلتاویستا به كار می رود. با این وجود، دقیقاً به علت نوسانات مشاهده شده، آنها هر دو در مورد خصوصیات و ویژگی‌های بازیابی و پوششی موتورها مشکوک شده‌اند. با توجه به این که نتایج پایدار بوده‌اند و غیره، شاید خیلی ضروری نباشد كه روش شناسی فوراً مورد سؤال قرار گیرد.اسمیت (۱۹۹۹) برخی روش‌های گردآوری داده‌های قوی و دوره‌ای را بیان می کند و همچنین نشان می دهد كه چگونه نتایج به دلیل بازیابی صفحات نامربوط تحریف می‌شوند. برای مثال اندونزی (كد حوزه آن id) عوامل تأثیرگذار وب را به علت بازیابی عنصر جاینمای جهانی منبع۵۰ “id” در تعداد زیادی از سایت‌های غیراندونزیایی خیلی بالا نشان می دهد. وی همچنین نشان دادكه رشته‌های جاینمای جهانی منبع طولا نی‌تر به منظور نتیجه قابل اعتمادتر جستجو شده‌اند. بافت این رشته‌ها باید منحصربه فرد بودن آنها را تأیید كند. با وجود این، مطالعات منتشر نشده بعدی درباره پوشش واقعی موتورها -از جمله آلتاویستا- با توجه به صفحات و پیوندهای شناخته شده دانشکده کتابداری کوپنهاگ دانمارک روی خدمت دهنده محلی ( http://ix.db.dk) نشان می دهد كه آنها به تمام صفحات و پیوندها نفوذ نمی‌كنند. این نتیجه منفی را ثلوال (۲۰۰۰)-كه موتورهای کاوش‌هات بات، آلتاویستا و اینفوسیک را در تحلیل‌هایش به كار برده است- تأیید می‌كند. در چنین شیوه‌ای كه مخرج و صورت كسرِ عوامل تأثیرگذار وب به همان روش‌ها تحت تأثیر قرار داده شده است، این پوشش تصادفی نیست. به طور خلاصه در وضع حاضر، روش‌های بازیابی و پوشش موتور کاوش «مفهوم اخیر عوامل تأثیرگذار وب عملاً در ابزار نسبتاً ساده و ابتدائی ظاهر شده‌اند» (تل‌وال، ۲۰۰۰، ص۱۸۸). بدین ترتیب پیامدها و نتایج بسیار مشكل آفرین هستند و همان طور كه روسو (۱۹۹۹)، اسمیت (۱۹۹۹) و ثلوال (۲۰۰۰) بیان كرده‌اند، یك نفر باید روبات‌های اختصاصی وب را برای بارگذاری کردن نمونه‌ها به منظور تحلیل‌های محلی به كار برد.
● كشف دانش و ردیابی موضوع روی وب
طی دهه اخیر یک حوزه پژوهشی چند رشته‌ای به نام «كشف دانش در پایگاه‌های اطلاعاتی»۵۱ ظاهر شده است. این حوزه به گسترش روش‌ها برای بهره برداری کردن از مخزن در حال رشد به صورت تصاعدی محتواهای ثبت شده در پایگاه‌های اطلاعاتیِ تجارتی، اداری، علمی و سایر انواع داده‌ها مربوط می‌شود. فراولی و دیگران (۱۹۹۱) کشف دانش در پایگاه‌های اطلاعاتی را به عنوان «استخراج قابل ملاحظه اطلاعات ضمنی (مطلق۵۲) که قبلاً ناشناخته و بالقوه مفید از داده‌ها» تعریف نموده‌اند. به منظور شناسایی و استخراج الگوها و روابط جدید كه بتواند دانش جدیدی را به ثمر رساند، کشف دانش در پایگاه‌های اطلاعاتی روش‌های متنوع و گسترده‌ای را به کار می برد- مانند تركیب قدرت رایانه و تخصص و مهارت انسان. فنون کشف دانش در پایگاه‌های اطلاعاتی برای مثال، شامل بازیابی اطلاعات، آمار، آموزش ماشینی، شناسایی الگو، مقیاس بندی چندبعدی و تجسم است.اهداف و روش‌های کشف دانش در پایگاه‌های اطلاعاتی و کتابسنجی، در بسیاری نكات مشترك هستند. برای مثال، روش‌های دسته‌بندی (خوشه‌بندی) كردن کتابسنجی به عنوان یکی از کاربردهای کشف دانش در پایگاه‌های اطلاعاتی استنادی و کتابشناختی توانسته مورد توجه قرار گیرد. همچنین راهبردهایی در پژوهش کشف دانش در پایگاه‌های اطلاعاتی وجود دارد که جزو کتابسنجی است.برای مثال، در حوزه داده کاوی۵۳ (استخراج داده‌های) متنی (لویزویك، اوارد و كوستوف، ۲۰۰۰).مفهوم «داده‌کاوی» گاهی اوقات در ارتباط با کشف دانش در پایگاه‌های اطلاعاتی به طور مترادف به كار برده شده است. کشف دانش در پایگاه‌های اطلاعاتی دلالت دارد بر فرایند کلی کشف دانش مفید از داده‌ها، در حالی که داده کاوی، اقدام مهمی است که بر روی شناسایی الگوها متمرکز است (فیاد و دیگران، ۱۹۹۶). حوزه‌هایی که از کشف دانش در پایگاه‌های اطلاعاتی استفاده می کنند، شامل: رفتار مشتری، بررسی‌های مربوط به ستاره‌ها، تشخیص سرطان، شناسایی ساختار شیمیایی، تحلیل جمعیت، كنترل كیفیت و مدل سازی از تغییر اقلیمی جهان است (ویكری، ۱۹۹۷).وب محیطی است آشکار برای به كارگیری كشف دانش كه اتزیونی۵۴ در سال ۱۹۹۶ مورد بحث قرار داده بود. وب می‌تواند، به عنوان یک پایگاه اطلاعاتی توزیعی در حال رشد به طور تصاعدی حاوی بیش از یك بیلیون صفحات وب در بخش قابل نمایه‌سازی خود (شامل پایگاه‌های اطلاعاتی تولید شده درخواستی در قالب های سند نیست) و تقریباً ۱۰ بیلیون پیوند باشد. علاوه بر این، شامل داده‌های توزیعی روی میلیون ها خدمت دهنده است. وب دارای ابعاد دیگری نیز می باشد كه آن را از سایر پایگاه‌های اطلاعاتی معمولی متمایز می‌سازد، مهمترین آنها این است كه وب به صورت چند عاملی(چند واسطه‌ای۵۵) بنا گردیده است. میلیون ها حامی و کارگزار مختلف وب، از قبیل مردم عادی، محققان، سازمان ها و غیره، فعالانه صفحات و پیوندهای وب را خلق می‌كنند، تغییر می دهند و حذف می‌كنند. ماهیت توزیعی، پویا و متنوع وب- به‌همراه کمترین استفاده از اَبرداده۵۶ تركیب شده است- آن را محیطی مشکل و دشوار برای كشف دانش یا «وب‌کاوی»۵۷ می‌سازد و همان‌طور كه در بالا اشاره شد، آلن و همكارانش در مطالعاتشان (۱۹۹۹) خاطر نشان کردند كه اطلاعات وب ممكن است نادرست و غیرواقعی باشد. از سوی دیگر، ناهمگنی وب می‌تواند منبعِ مساعدی برای كشفیات ایجاد کند. همان طور که به وسیله دوجانگ و ریپ۵۸ (۱۹۹۷) بیان شد کشفیات اغلب از «ساختن ترکیب های پیش‌بینی نشده منابع ناهمگن» ناشی می‌شوند، که به طور ضمنی دلالت دارند بر این که ممکن نیست از قبل بتوان گفت که چه منابعی مورد نیاز است.سه راهنمای اصلی برای اجرای «كشف دانش» بر روی وب وجود دارد. آنها مربوط می‌شوند به بهره برداری از:
۱) محتویات صفحه وبی
۲) ساختار پیوندها
۳) رفتار اطلاع یابی کاربران (مانند جستجو و تورّق). در این بخش تمركز روی بهره‌برداری از ساختار پیوندها برای كشف دانش در وب است. این راهبرد تشابه زیادی با تحلیل‌های استنادی کتابسنجی دارد، اما نه صرفاً به وسیله پیوندهای قوی۵۹.پیوندها، مدارک وب را در یک پیکره و بستر فرامتن ساختارمند پیچیده، به هم می‌بافند. ساختار پیوندها، تفسیرهای تردیدناپذیر و مطلق انسان را نشان می دهند كه می‌تواند برای كشف دانش به كار گرفته شود، برای مثال شناختن اجتماعات‌ وب۶۰ (گیبسون و كلاین‌برگ و روگاوان، ۱۹۹۸)، شناسایی كردن صفحات وب معتبر و موثق (كلاین‌برگ، ۱۹۹۸)، تلخیص‌کردن موضوع۶۱ (بارات و هینسینگر، ۱۹۹۸)، یا بهبود بخشیدن الگوریتم‌های رتبه‌بندی موتور کاوش (برین و پاژه، ۱۹۹۸). تیم برنِرز-لی۶۲ مخترع وب در سرن۶۳ (سازمان پژوهش‌های هسته‌ای اروپا) در سال ۱۹۸۹-۱۹۹۰ این رشد و توسعه را پیش‌بینی کرده بود. یکی از مهمترین انگیزه‌های او برای توسعه وب، امکان آگاهی از «تارهای پیچیده روابط میان مردم، برنامه‌ها، ماشین ها و عقاید بوده است» (برنرس و لی، ۱۹۹۷). روش‌های نظریه نموداری ابزار بسیار مناسبی برای مطالعه ساختار پیوندها روی وب هستند. شکل‌شناسی ساختار پیوندها امكاناتِ عوامل انسانی و رقومی به منظور كاوش و عبور کردن از وب و كشف در آن را تحت تأثیر قرار می دهد.
● نظریه نمودار و وب
در نظریه نمودار (گراف)، نمودار عبارت است از بازنمود ریاضی از یك شبكه كه شامل رأس ها۶۴ یا گره‌هایی است كه یال‌ها(ضلع ها۶۵) به هم متصل شده‌اند. گره‌ها می‌توانند انسان (در شبكه‌های اجتماعی)، عوامل بوم شناختی (در یک شبكه غذایی)، خدمت دهنده‌های اینترنتی، مدارک (در یک شبكه استنادی)، مفاهیم (در یك شبكه معنایی یا یک اصطلاحنامه) و غیره باشند. در یك نمودار جهت دار، یال‌ها روابط جهتی میان گره‌ها را نشان می دهند. وب نمونه‌ای است از یک نمودار جهت دار که صفحات وب منطبق با گره‌ها، و فراپیوندها۶۶ منطبق با یال‌ها هستند. روش‌های نظریه نموداری می‌تواند برای تحلیل جنبه‌های ساختاری وب مورد استفاده قرار گیرد. برودر و دیگران (۲۰۰۰) یك مدل کمانی (پاپیون‌وار۶۷) از ساختار نموداری وب ارائه كردند. با استفاده از یك مجموعه وب۶۸ شامل تقریباً۲۰۰ میلیون صفحه وب و ۵/۱ بیلیون پیوند، می‌توان یک نمونه پایگاه اطلاعاتی از یک نمودار وب تشکیل داد. یک تیم پژوهشی نشان دادند كه وب شامل پنج حوزه مجزای مشخص شده به وسیله گره‌هایی است كه یا ۱. فقط پیوندهای بیرونی دارند ۲. فقط پیوندهای درونی دارند ۳. هر دو نوع پیوند، هم بیرونی و هم درونی، دارند ۴. یا هیچ پیوندی ندارند و یا ۵. گره‌هایی كه به گره پاپیون۶۹ متصل شده‌اند (شامل گره‌هایی با پیوندهای دورنی و بیرونی) یا متصل نشده‌اند. یک مدل پاپیون، مفهومی قابل توجه از ساختار تو در توی وب ارائه می‌نماید. این پیچیدگی، امکانات كشف دانش را وقتی كه عوامل انسانی یا ماشینی (رقومی) ساختار پیوند را بازدید و تحلیل می‌نمایند، تحت تأثیر قرار می دهد. در چارچوب نظریه نموداری، یک بُعد قابل توجه ساختار پیوندها با پدیده معروف به «جهان كوچك» و «شبكه‌های جهان كوچك» سروكار دارد. این پدیده، امكانات كشف دانش را افزایش می دهد.
● شبکه‌های جهان کوچک
در شبکه‌های جهان كوچك، گره‌ها به صورت خوشه‌ای هستند – مانند آنچه در نمودارهای منظم است- اما طول مسیر میان هر جفت گره کوتاه است، مانند آنچه در نمودارهای تصادفی۷۰ است. در یک شبكه جهان كوچك داشتن درصد بسیار کمی از پیوندها که به عنوان «میان‌بُرها» عمل می کنند و بخش‌های دوردست شبكه را به هم متصل می کنند، کافی است.واتس و استروگاتز۷۱ (۱۹۹۸) و واتس (۱۹۹۹) نشان دادند كه شكل شناسی جهان كوچك در قالب طول مسیرهای كوتاه در شبكه‌های زیست شناسی، فنّاوری و اجتماعی رخ می دهد. برای مثال، شبكه عصبی كرم خاکی۷۲، شبکه برق فشار قوی ایالات غربی آمریکا و نمودار همکاری بازیگران فیلم. نظریه جهان كوچك از اثری از میلگرام (۱۹۶۷) و کوچن۷۳ (۱۹۸۹) سرچشمه گرفته است كه آنها این نظریه را به واسطه پنداره ۶ جایگاه(نقطه) جداگانه که به «فواصل و مسیرهای كوتاه میان دو شخص دلخواه از طریق حلقه‌های رابط آشنایی» می‌پردازند، عمومیت یافته است.هنوز فقدان پژوهش در علوم كتابداری و اطلاع رسانی درباره پدیده جهان كوچك در خصوص فواصل كوتاه و نتایج آنها در شبكه‌های اطلاعاتی از قبیل وب جهانگستر، پایگاه‌های اطلاعاتی استنادی، شبكه‌های معناشناسی و اصطلاحنامه‌های همایند و غیره، وجود دارد. پدیده جهان کوچک امکان پذیر است، وقتی که گره‌ها در یک شبکه اطلاعاتی منطبق با مدارک، اصطلاحات، مؤلفان، مؤلفان استناد شده، مجلات، حوزه‌های علمی۷۴، سازمان ها، یا کشورها و غیره تعریف شوند، و پیوندهای کاهش فاصله و پیوندهای ایجاد جهان کوچک منطبق با مآخذ، اصطلاحات مرتبط، ظهور هم واژه‌ها (واژه مشترک۷۵)، توصیفگرها، مؤلفان همکار، مؤلفان با هم استناد شده، یا مجلات و غیره تعریف شوند.یکی از پیامدها و نتایج جهان كوچك می‌تواند افزایش و بهبود امكان كشف پیش‌بینی نشده اطلاعات مفید روی اینترنت باشد. در یک طرح جدید یكی از مؤلفان، در حال توسعه این راهبرد است که نظریه نمودار و کتابسنجی را درهم ادغام کند. مفهوم اصلی در این چارچوب به پیوندهای متقاطع معروف است (بجورن‌بُرن، ۲۰۰۰).● پیوندهای متقاطع (عرضی)
پیوندهای متقاطع به عنوان میانبرهای میان خوشه‌های ناهمگن وب۷۶ عمل می کنند. خوشه‌های وب از وب‌سایت‌ها و صفحات وبی بسیار به هم پیوسته تشکیل شده است كه گروه‌ها و جوامع مشترک المنافع و حوزه‌های موضوعی هم خانواده و مرتبط را منعكس می کنند. صفحات وب درون یك خوشه وب، بسته به ساختار پیوند درون خوشه‌ای می‌توانند كمتر یا بیشتر در مرکز یا در حاشیه مستقر شوند. مثالی برای یک خوشه وب می‌تواند صفحه وب محققانی باشد که پیوندهایی را از صفحات خانگی شخصی شان به سایر محققان، سازمان ها، طرح ها و مقالات در حوزه علمی خودشان می‌سازند.عوامل رقومی(ماشینی) یا انسانی، از طریق پیوندها از یك صفحه وب به صفحه وب دیگر که امکان حرکت از یک خوشه وب به سایر خوشه‌های دوردست را با استفاده از تنها یک پیوند متقاطع به عنوان «میان‌بُر» فراهم می‌سازند، به جستجو در وب می پردازند. در مثال بالا، یك محقق در حوزه علم اطلاع رسانی توانسته است كه پیوندی متقاطع روی یک صفحه وب با پیوندهای مورد علاقه‌اش به سایر حوزه‌های علمی‌ دلخواه خود مثلاً «تحریك خلاقیت»۷۷ ایجاد کند. بنابراین، ردّپایی (خط سیری۷۸) میان دو خوشه ناهمگن وب به وجود می آید. چنین خط سیرهای مختلف و دور از هم كه به صورت متقاطع در مسیرهای پر رفت و آمد و شلوغ روی وب جریان می یابند، می‌توانند امكانات كشف دانش به کمک رایانه و یا بازیابی اتفاقی توسط انسان را تحت تأثیر قرار دهند، در حالی که اطلاعات پیش‌بینی نشده اما احتمالاً مفید، شناسایی و استخراج شده است.امکان كشف دانش خلاق و سازنده با استفاده از ساختار پیوندها نقش مؤثری را در توسعه نظام های اطلاعاتی فرامتن از جمله وب، ایفا نموده است. در این روند تاریخی یک عامل شتاب دهنده مهم، دید سطحی وَنوار بوش۷۹ (۱۹۴۵) از ممکس- یک نظام اطلاعاتی- بوده است که پاراگراف های متنی متفاوت و مجزا (روی میکروفیلم) می‌توانند به وسیله خط سیرها (ردّپاها) به طور متقاطع به صورت سلسله مراتب رده بندی شوند و به منظور تحریک خلاقیت‌های محققان به هم متصل گردند. [ایده فرامتن از ممکس الهام گرفته است].جنبه پیوند تقاطعی۸۰ ممكس و پیوندهای متقاطع می‌تواند به قیاس‌ برای نشان دادن چگونگی انتشار ایده‌ها میان گروه‌های اجتماعی نامتجانس به طور جنبی از طریق افراد وابسته ضعیف كه اصطلاحاً گره‌های ضعیف نامیده می‌شوند، در نظر گرفته شود (گرانووتر، ۱۹۷۳). همچنین پیوندهای متقاطع ممكن است مورد توجه قرار گیرند برای این كه چرا نویسندگان آثار علمی اغلب به تعداد بسیار کمی از منابع خارج از حوزه علمی خودشان كه اصطلاحاً تقاطع های مرزی۸۱ نامیده می‌شود، استناد می كنند (كلاین، ۱۹۹۶ و پیرس، ۱۹۹۹).پیوندهای متقاطع، به عنوان گره‌های ضعیف و تقاطع های مرزی میان خوشه‌های ناهمگن وب عمل می‌كنند. البته، بسیاری از پیوندهای متقاطع دارای خصوصیات منحصربه فردی هستند، مانند سرگرمی‌های غیرعلمی شخصی. اما، سایر پیوندهای متقاطع روی صفحات وب دانشمندان توانسته‌اند پیش پژوهش‌های۸۲ آشكار شده در حوزه‌های علمی یا بین رشته‌ای۸۳دانشكده‌های نامرئی۸۴ را منعكس سازند. آشكار کردن چنین اتصالات مخفی به صورت شانسی(اتفاقی) توسط انسان یا کشف دانش با کمک رایانه توانسته است اطلاعات مفیدی را درباره ابعاد جدید در تکامل و شکل گیری ارتباط میان علوم و كشف كردن الگوها و روابط ارائه دهد. پیوندهای متقاطعِ مرزهای بین علمی۸۵ می‌توانند بینش خلاق و عمیقی را به وجود آوردند، بنابراین، مفهوم و درک جدیدی برای فهمِ شدت و میزان گره‌های ضعیف از طریق تحلیل شبکه اجتماعی ارائه می دهند (گرانووتر، ۱۹۷۳).
● ملاحظات روش شناسی
تلاش برای محلی کردن پیوندهای متقاطع روی وب، با کنترل داده‌های با بسامد پایین- شبیه توزیع احتمالی برادفورد از صفحاتِ وب مقصد برای پیوندهای بیرونی ایجاد شده در یك حوزه علمی یا مجموعه مورد علاقه - سرو كار دارد. این هنوز یك فرضیه است که در حال آزمون است، اما احتمالاً اغلب پیوندهای بیرونی برای صفحات وب معتبر و محبوب در حوزه‌های موضوعی مشابه مورد توجه قرار می گیرند (كویی، ۱۹۹۹).
همان طور که پیشتر بیان شد، مسئله روش شناسی در وب‌سنجی با گردآوری داده‌های بی غرض از وب سروكار دارد كه آن به عنوان اساس و پایه‌ای برای پژوهش‌های تجربی مورد توجه قرار می گیرد. همان گونه كه در بالا بیان شد، در داده‌های ثانوی گردآوری شده در موتورهای کاوش تجاریِ بزرگ به دلیل بی دقتی زیاد در مورد پوشش، فاصله روزآمدسازی، اصول نمایه‌سازی، اجرای محاسبات، الگوریتم های رتبه بندی و غیره، اعتبار وجود ندارد. همچنین برای استفاده از داده‌های اولیه بارگذاری شده به صورت مستقیم از وب، روش دیگری وجود دارد. روشی كه در مقوله بندی اخیر گردش تصادفی نامیده شده که در نظریه نمودار مورد استفاده قرار گرفته است. به منظور محلی کردن پیوندهای متقاطع روی نمودار وب، تعداد زیادی از گردش‌های تصادفی۸۶ طولانی، می‌توانند با پیوندهای متعاقب (پیرو) در یک روش تصادفی از یک صفحه وب به صفحه وب دیگر مورد استفاده قرار گیرند. اجرای تحلیل مسیر۸۷ از مسیر پیوندهای طولانی که بدین نحو ایجاد شده‌اند گاهی اوقات به بن بست ختم می‌شوند. پیوندهای متقاطع با استفاده از ملاک‌ها و معیارهای ناهمگنی میان حوزه‌های موضوعی منعكس‌شده در صفحات وب شناسایی می‌شوند. مفهوم ناهمگنی (همانند مفهوم معكوسِ مرتبط با “تشابه” در نظریه رده‌بندی) پیچیده نیست، و معیاری است برای تعریف عملیاتی با استفاده از مقیاس های تشابه واژه‌های هم رویداد (هم وقوع۸۸).نقاط شروع تصادفی برای گردش‌های تصادفی مسئله دیگری است که از ماهیت توزیعی وب که قبلاً ذکر شد، ناشی می‌شود. استفاده از شماره‌های معروف به شماره IP۸۹ (تفاهم نامه اینترنت) یا فهرست اسامی خدمت دهنده های نام حوزه، مثل حوزه”edu” روش‌های احتمالی برای نمونه‌گیری بدون سوگیری و غیرمغرضانه از نقاط شروع هستند. در تفاهم نامه اینترنت به هر میزبان وب یک شماره منحصربه فرد تخصیص یافته است. به عنوان مثال «۱۳۰.۲۲۶.۱۸۶.۶» شماره تفاهم نامه مدرسه سلطنتی علوم کتابداری و اطلاع رسانی دانمارک”www.db.dk“ است.
● تحلیل مسیر و دانش عمومی کشف نشده( ناشناخته۹۰)
با استفاده از تحلیل مسیر در پایگاه‌های اطلاعاتی استنادی، اسمال(۱۹۹۹) راه‌ها و مسیرهای۹۱ مرزهای بین رشته‌ای در علوم و خلاقیت بارور شده را که می‌توانستند در چنین گذرگاه‌ها و تقاطع های مرزی ظاهر شوند مورد پژوهش قرار داد. اسمال به بررسی “گره‌های قوی” در مقایسه با “گره‌های ضعیف” در حالت‌هم استنادی (اشتراک در متن۹۲) قوی و شدید برای ایجاد مسیرهای چندمرحله‌ای غیرمستقیم در آثار علمی پرداخته بود. مطابق نظر اسمال، حرکت کردن از یک موضوع یا حوزه، به موضوع یا حوزه دیگر در آثار علمی به دلیل بافت و ساختار مرتبط و درهم تنیده رشته‌های علمی امکان پذیر است. این مسئله با استفاده از مسیر خاصی كه از علم اقتصاد شروع و به اخترفیزیك ختم می‌شود، نشان داده شده است.کین و نورتون۹۳ (۱۹۹۹) درباره اسمال اظهارنظر کردند و پیش‌بینی نمودند كه «در نظام های آتی بازیابی اطلاعات، یك كاربر می‌تواند دو موضوع یا دو سند را انتخاب نماید و مسیر (خط سیر) اسناد یا موضوع هایی را كه به آن دو موضوع مرتبط می‌شوند پیدا کند كه آن می‌تواند برای كشف دانش و تولید فرضیه‌ها مورد استفاده قرار گیرد».این شیوه همچنین ممکن است برای محلی کردن پیوندهای متقاطع روی وب استفاده شود. در یك نمونه نمودار وب تولید شده به وسیله رایانه كه از روش‌های الگوریتمی استفاده می‌نماید، كوتاه ترین مسیرِ پیوند میان دو صفحه وب آغازین و پایانی انتخاب شده كه به حوزه‌های علمی ناهمگن تعلق دارند، می‌تواند شناسایی‌شود. بسته به این که همسایگان یک خوشه از صفحات وب انتخابی تا چه حد به هم مرتبط باشند، این روش طبق مدل «کمانی (پاپیون وار)» پیش گفته به علت بزرگی و گستردگی مناطق صفحات وب که فقط دارای پیوند درونی یا فقط پیوند بیرونی هستند و یا در کل هیچ پیوندی ندارند، شاید تا ۷۵ درصد موارد با شکست مواجه خواهد شد (برودر و دیگران، ۲۰۰۰). اما حداقل تقریباً در ۲۵ درصد از موارد، تعیین كوتاه‌ترین مسیر میان دو حوزه علمی ناهمگن منتخب امکان پذیر خواهد بود. بدین ترتیب پیوندهای متقاطع میان‌بُر را در طول مسیر نشان می‌دهند.عقیده اِسمال‌ (۱۹۹۹) مبنی بر ایجاد مسیرهای هم استنادی (اشتراک در متن) قوی و شدید چندمرحله‌ای، همچنین می‌تواند برای تحلیل هم پیوند پیوندهای بیرونی۹۴ هم رویداد، مثلاً روی صفحات وب دانشمندان، به كار برده شود. این راهبرد می‌تواند راهنمای مفید و مؤثری برای اجرای كشف دانش روی وب باشد. روش دیگر كشف دانش استفاده شده در پایگاه‌های اطلاعاتی کتابشناختی، قابل اجرا برای وب، پژوهش سوانسون (۱۹۸۶) روی دانش عمومی كشف نشده است كه در طول سال‌ها توسعه‌یافته است (وانسون و اسمال‌هایزر، ۱۹۹۷،۱۹۹۹). سوانسون (۱۹۸۶) بیان نمود كه «دانش می‌تواند عمومی باشد، ولی هنوز كشف نشده، و اگر اجزاء و قسمت‌های آن به طور مستقل خلق شده باشند، منطقاً به هم مرتبط هستند، اما آنها هرگز با هم بازیابی و تفسیر نمی‌شوند و باهم آورده نمی‌شوند». سوانسون از یک روش آزمون و خطای نظام مند برای یافتن روابط متعدی و ناپایدار۹۵ میان دو اثر استفاده کرد (دیویس، ۱۹۸۹). با توجه به مثال خود سوانسون (۱۹۸۶)، اگر اثر «الف» مربوط به «روغن ماهی» باشد و اثر «ج» تقریباً در مورد «بیماری ریناد»۹۶ باشد، آنگاه اثر «ب» روی «پلاکت خون»۹۷ می‌تواند یک رابطه متعدی کم داشته باشد. اگر “الف” مساوی (اشتراک) «ب» و «ب» مساوی «ج» باشد، در نتیجه، «الف» مساوی «ج» خواهد بود. این روش كشف دانش مبتنی بر اثر۹۸ برای یافتن “اطلاعات ضمنی (مطلق) جالب اما قبلاً ناشناخته « در میان آثار علمی به کار رفته است (سوانسون و اسمال‌هایزر، ۱۹۹۹) و همچنین برای آشکار کردن روابط میان عقاید و مفاهیمی كه قبلاً مورد توجه نبودند (گارفیلد، ۱۹۹۴).با استفاده از این روش روی وب، پیوندهای متقاطع توصیه‌های مفیدی را برای یافتن روابط متعدی و ناپایدار میان رشته‌های علمی ارائه می دهند.مفهوم «کشف شانسی نظام مند»۹۹ در زمینه كشف علم و كشف دانش با کمک رایانه مفید است. گارفیلد از ۱۹۶۶ چندین مرتبه از این مفهوم برای تشریح روند سازمان یافته کشف روابط علمی قبلاً ناشناخته كه در پایگاه‌های اطلاعاتی استنادی مورد استفاده قرار می گرفت، استفاده کرد. در حقیقت، «کشف شانسی نظام‌مند» توصیف نسبتاً دقیقی از ضرورت همكاری میان انسان- رایانه در اجرای كشف دانش‌هم در پایگاه‌های اطلاعاتی سنتی و هم روی وب است. اهمیت همكاری انسان- رایانه برای كشف دانش در حوزه علم توسط ولدِس- پرِز۱۰۰ (۱۹۹۹) مورد تأكید قرار گرفته است. آخرین راهبردهایی که در این بخش به استفاده روش‌های کتابسنجی در كشف دانش روی وب مربوط می‌شوند، عبارتند از مفهوم «مدیریت موضوعات»۱۰۱ که توسط لنکستر(۱۹۸۵) و مفهوم «ردیابی موضوع» که به وسیله ورمل ( ۲۰۰۰) خلق شدند.
● ردیابی موضوع
لنکستر (۱۹۸۵) در مطالعه موردی خود در مورد این که چگونه موضوع جدید در حال شکل گیری «باران اسیدی»۱۰۲ در جامعه، توسعه و اشاعه یافته است، مسئله را در چندین پایگاه اطلاعاتی مختلف ردگیری کرده بود که نشان دهد چگونه این مسئله تحقیقی در طول زمان به حوزه علوم کاربردی و بعداً به رسانه‌های گروهی و قانونگذاری کشیده شده است. لنکستر و ورمل(۲۰۰۰) روش‌های اطلاع‌سنجی را برای ردیابی الگوی مباحثه بین المللی درباره «وضعیت رفاهی» جدید در پایگاه‌های اطلاعاتی حوزه‌های مختلف به كار بردند؛ در نتیجه آنان نشان دادند كه چگونه یک مفهوم از میان یک مسیر به روش‌های مختلف نشر، حرکت می کند. ورمل نتیجه گرفت که فنّاوری‌های «داده‌کاوی» و «متن‌کاوی»، امكانات زیادی را برای تحلیل اطلاع‌سنجی به منظور استخراج دانش ناشناخته و بالقوه مفید از داده‌های کتابشناختی ارائه می کنند. گونه‌ای از ردیابی موضوع روی وب توسط بار-ایلان و پریتز۱۰۴ (۲۰۰۰) به كار گرفته شده بود. ایشان موضوع انتخاب شده «اطلاع‌سنجی» را برای یك دوره زمانی معین با استفاده از روش‌های کتابسنجی به منظور تحلیل داده‌ها بینِ شش موتور کاوش اصلی، مورد پژوهش قرار دادند. ماهیت پویای وب، از اسناد وب درباره موضوعاتی كه بیشتر اوقات ناپدید هستند، ناشی شده است، در حالی که اسناد جدید اضافه می‌شوند و برخی از آنها تغییر می یابند. به دنبالِ همان روش‌ها بار- ایلان (۲۰۰۰) موضوع مشابهی را به طور مفصل ردیابی کرد و الگوهای روی وب برای پایگاه‌های اطلاعاتی استنادی و کتابشناختی را مقایسه کرد.
● نتیجه‌گیری
این مقاله سعی دارد كه به حوزه‌های خاص و منتخبی از پژوهش وب‌سنجی كه روند و فضای جالبی برای توسعه دارند، اشاره کند و همچنین برخی حوزه‌های كمتر خوش آتیه را بیان می کند. همان طوری كه قبلاً ذكر شد، امکان استفاده از روش‌های کتابسنجی روی وب از ماهیت پویا، متنوع و توزیعی وب و نقائص موتورهای وب تأثیر پذیرفته است. تنوع و گوناگونی افرادی كه اسناد و مدارک وب و پیوندها را ایجاد می کنند البته از کیفیت و اعتبار این عناصر وب، تحت تأثیر قرار می گیرند. کمبود اَبرداده‌های به كارگرفته شده برای مدارک و پیوندهای وب و کمبود موتورهای کاوشی که اَبرداده‌ها را پشتیبانی کنند بر گزینه‌های پالایش تأثیر می گذارد، و در نتیجه گزینه‌های كشف دانش تحت تأثیر قرار می گیرند؛ در صورتی كه كدهای ناحیه‌ای۱۰۵ در پایگاه‌های اطلاعاتی سنتی، کشف دانش در پایگاه‌های اطلاعاتی را پشتیبانی می‌كنند. همان طور كه در بالا پیشنهاد شد، تنوع در وب می‌تواند امكانات كشف دانش را افزایش دهد. دولت ستیزی و هرج و مرج طلبی، رفتار محلی میلیون ها نفر از عاملان وب معمولاً بر روی عملكرد جهانی وب به عنوان یك نظام اطلاعاتی، نتایج و عواقب منفی به همراه داشته است. پیوندهای متقاطع مذكور، توانسته اند از تأثیر مثبتِ تاکنون فراموش شده این رفتار نامناسب در مسیرهای کوتاه وب نتیجه بگیرند و به این ترتیب موجب امکانات کاوش بهتر برای کارگزاران و واسطه‌های رقومی و انسانی می‌شوند و بدین وسیله موجب فراهم کردن امکانات بهتر برای كشف دانش با کمک رایانه و به صورت شانسی توسط انسان، برای مثال «کشف شانسی نظام مند» می‌گردند. استفاده از این راهبرد برای كشف مواد مفید به منظور اهداف و مقاصد علمی، البته نیازمند کنترل مسئله اعتبار و صحّت در وب می باشد. یك راه برای انجام این، می‌تواند روش پیش گفته یعنی «انتخاب کیفیت صفحات وب آغازین و پایانی از دو حوزه علمی ناهمگن» باشد و سپس پیوندهای متقاطع روی یک مسیر پیوند متصل به حوزه‌ها شناسائی شود. این روش می‌تواند احتمال برخورد با محتویات كیفی در صفحات وب میانی در طول مسیرِ پیوند را افزایش دهد. وب شامل ساختار پیوندهای واگرا (دور از هم) و همگرا (شبیه به هم) است كه خوشه‌های وب، با نوع پیشین و پیوندهای متقاطع با نوع بعدی منطبق هستند. این ساختارهای مختلفِ پیوند می‌تواند کاوش در وب هدایت شده در مسیرهای همگرا (یعنی منطقی، هدف مند) و واگرا (یعنی خلاق، شهودی) را پشتیبانی کند. استفاده از واژه‌های واگرا و همگرا از اثر فورد (۱۹۹۹) و از اثر باودن (۱۹۸۶) در مورد تحریك خلاقیت در نظام های اطلاعاتی، الهام گرفته است. درك و استنباط کامل واگرایی و همگرایی -هم در ساختار پیوند کشف شده موجود و هم در رفتار کارگزاران و واسطه‌های رقومی (ماشینی) یا انسانی- به منظور توسعه روش‌های خلاق و سازنده كشف دانش با کمک رایانه روی وب، و نیز در پایگاه‌های اطلاعاتی استنادی، کتابشناختی و سایر پایگاه‌های اطلاعاتی مهم است. چنین روش‌هایی همچنین می‌توانند استلزام‌هایی برای اصلاح برنامه‌های دروگر۱۰۶ روبات‌های وب، الگوریتم های رتبه بندی موتورهای کاوش و ویژگی‌های بصری/جهت‌یابی۱۰۷ مرورگرها، داشته باشند. وب‌سنجی حوزه پژوهشی جدیدی است که در حال گذر از یك مرحله آزمایشی و مقدماتی ضروری است. تازگی این حوزه، تعداد قابل توجه مقالات توصیفی وب‌سنجی فراهم شده درباره ابعاد مختلف وب در طی ۴-۵ سال اخیر را توجیه می کند. در سال‌های آینده، تجزیه و تحلیل و تركیب یافته‌های پژوهش‌ها و همچنین پیشبرد و توسعه روش‌ها و نظریه‌ها به منظور فراهم نمودن درك و فهم بهتر درباره ریخت شناسی (توپولوژی)، كاركردها و پتانسیل‌های امکانات پیچیده وب، چالشی برای پژوهشگران وب‌سنجی خواهد بود.
از پروفسور پیتر اینگورسن و دکتر لُنارت بجورن بُرن که طی نامه مورخه ۲۰ مه ۲۰۰۳ اجازه ترجمه مقاله حاضر را دادند و ما را راهنمائی فرمودند، بسیار سپاسگزاری می‌شود.پی نوشت‌ها
۱.Link structure
۲.Almind and Ingwersen
۳.Cybermetrics
۴.Outlinks
۵.Inlinks
۶.Reference
۷.Citation analysis
۸.Domain
۹.Web search behavior
۱۰.Common data
۱۱.Text mining
۱۲.ISI: Institute of Scientific Information
۱۳.Command language
۱۴.Dialog
۱۵.Online
۱۶.Sitation analysis
۱۷.Link-page
۱۸.Indexable web
۱۹.Servers
۲۰.Imposed truncation
۲۱.Clarke and Willett
۲۲.Oppenheim
۲۳.Time series
۲۴.Longitudinal study
۲۵.Nova-like
۲۶.Cyberspace
۲۷.Nordic portion of the web
۲۸.Connections
۲۹.Typology
۳۰.Bates and Lu
۳۱.Wynn and Katz
۳۲.Dillon and Gushrowski
۳۳.Web archaeology
۳۴.Lei Cui
۳۵.Central sites
۳۶.Query
۳۷.TREC IR: Text Retrieval Conference Information Retrieval
۳۸.Inaccurate
۳۹.Misleading
۴۰.Un-referenced
۴۱.Sitations
۴۲.Incoming links
۴۳.Data points
۴۴.Lotka distribution
۴۵.Self-sitations
۴۶.National domains
۴۷.Self-linking
۴۸.External inlinking
۴۹.Thelwall
۵۰.URL element
۵۱.Knowledge discovery in databases (KDD)
۵۲.Nontrivial extraction of implicit
۵۳.Textural data mining
۵۴.Etzioni
۵۵.Multi-agent
۵۶.Metadata
۵۷.Web mining
۵۸.De Jong and Rip
۵۹.Strong ties
۶۰.Web communities
۶۱.Topic distillation
۶۲.Time Berners-Lee
۶۳.Conseil Europeen Pour la Recherche Nucleaire (CERN)
۶۴.Vertices
۶۵.Edges
۶۶.Hyperlinks
۶۷.Bow tie
۶۸.Web crawl
۶۹.Bowtie knot
۷۰.Random graphs
۷۱.Watts and Strogats
۷۲.Nematod worm
۷۳.Kochen
۷۴.Scientific domains
۷۵.Co-term
۷۶.Heterogeneous web clusters
۷۷.Creativity simulation
۷۸.Trail
۷۹.Vannervar Bush
۸۰.Cross-linking
۸۱.Boundary crossings
۸۲.Research fronts
۸۳.Cross-disciplinary
۸۴.Invisible colleges
۸۵.Crossing scientific boundaries
۸۶.Random walk
۸۷.Path analysis
۸۸.Co-occurrence
۸۹.IP-numbers
۹۰.Undiscovered public knowledge
۹۱.Pathways
۹۲.Co-citation
۹۳.Qin and Norton
۹۴.Co-link analysis of outlinks co-occurring
۹۵.Transitive relations
۹۶.Raynaud’s disease
۹۷.Blood platelets
۹۸.literature-based knowledge discovery
۹۹.Systematic serendipity
۱۰۰. Valdes-Perez
۱۰۱.Issues management
۱۰۲.Wormell
۱۰۳.Acid rain
۱۰۴.Bar-Ilan and Peritz
۱۰۵.Field codes
۱۰۶.Harvesting
۱۰۷.Visualisation/Navigation features of browsersمنابع
E.S. Allen, J.M. Burke, M.E. Welch, L.H. Rieseberg (۱۹۹۹). How reliable is science information on the Web? Science, ۴۰۲: ۷۲۲.
T. Almind, P. Ingwersen (۱۹۹۷). Informetric analyses on the World Wide Web: Methodological approaches to “Webometrics”, Journal of Documentation, ۵۳: ۴۰۴-۴۲۶.
J. Bar-Ilan (۱۹۹۸). The mathematician, Paul Erdos (۱۹۱۳-۱۹۹۶) in the eyes of the Internet, Scientometrics, ۴۳: ۲۵۷-۲۶۷.
J. Bar-Ilan (۱۹۹۹). Search engine results over time: A case study on search engine stability, Cybermetrics, ۲/۳, paper ۱. ISSN: ۱۱۳۷-۵۰۱۹
( http://www.cindoc.csic.es/cybermetrics/articles/v۲i۱p۱.html ; visited ۰۸.۱۱.۲۰۰۰).
J. Bar-Ilan (۲۰۰۰). The Web as an information resource on informetrics? A content analysis, Journal of the American Society for Information Science, ۵۱: ۴۳۲-۴۴۳.
J. Bar-Ilan, B.C. Peritz (۱۹۹۹). The life span of a specific topic on the Web. The case of “informetrics”: A quantitative analysis, Scientometrics, ۴۶: ۳۷۱-۳۸۲.
M. Bates, S. Lu (۱۹۹۷). An exploratory profile of personal home pages: Content, design, metaphors, Online & CDROM Review, ۲۱: ۳۳۱-۳۴۰
D. Bawden(۱۹۸۶). Information systems and the stimulation of creativity, Journal of Information Science, ۱۲: ۲۰۳-۲۱۶.
T. Berners-Lee (۱۹۹۷). Realising the full potential of the Web. World Wide Web Consortium. ( http://www.w۳.org/۱۹۹۸/۰۲/Potential.html ; visited ۰۸.۱۱.۲۰۰۰).
K. Bharat, M. Henzinger (۱۹۹۸). Improved algorithms for topic distillation in a hyperlinked environment. In: Croft, W. B. et al.(Eds.). Proceedings of the ۲۱st annual International ACM SIGIR Conference on Research and Development in Information Retrieval. ACM Press, pp. ۱۰۴-۱۱۱.
L. Björneborn (۲۰۰۰). Verdensvævet som ‘small-world’-netværk og mulighedsrum : omridset af en forståelsesmodel for transversale links på World Wide Web. [‘Small-World’ Web and Possibility Space: outlining a conceptual framework for transversal links on the WWW]. Master’s Thesis. Royal School of Library and Information Science, Copenhagen.
S. Brin, L. Page (۱۹۹۸). The anatomy of a large-scale hypertextual Web search engine, WWW۷ Conference. ( http://www-db.stanford.edu/~backrub/google.html ; visited ۰۸.۱۱.۲۰۰۰).
A. Broder et al. (۲۰۰۰). Graph structure in the Web, WWW۹ Conference.
( http://www.almaden.ibm.com/cs/k۵۳/www۹.final ; visited ۰۸.۱۱.۲۰۰۰)
V. Bush (۱۹۴۵). As we may think, The Atlantic Monthly, ۱۷۶ (July) ۶۴۱-۶۴۹.
S.J. Clarke, P. Willett (۱۹۹۷). Estimating the recall performance of Web search engines, Aslib Proceedings, ۴۹: ۱۸۴-۱۸۹.
M.P. Courtois, M.W. Berry (۱۹۹۹). Results ranking in Web search engines, Online, (May/June) ۳۹-۴۶.
B. Cronin, G. McKim (۱۹۹۶). Science and scholarship on the World Wide Web: A North American perspective, Journal of Documentation, ۵۲: ۱۶۳-۱۷۲.
L. Cui (۱۹۹۹). Rating health Web sites using the principles of citation analysis: A bibliometric approach. Journal of Medical Internet Research, ۱(۱) e۴ (ISSN: ۱۴۳۸-۸۸۷۱) ( http://www.jmir.org/۱۹۹۹/۱/e۴/index.htm ; visited ۰۸.۱۱.۲۰۰۰).
R. Davies (۱۹۸۹). The creation of new knowledge by information retrieval and classification, Journal of Documentation, ۴۵: ۲۷۳-۳۰۱.
H. de Jong, A. Rip (۱۹۹۷). The computer revolution in science: steps towards the realization of computer-supported discovery environments, Artificial Intelligence, ۹۱: ۲۲۵-۲۵۶.
A. Dillon, B.A. Gushrowski (۲۰۰۰). Genres and the Web: Is the personal home page the first uniquely digital genre? Journal of the American Society for Information Science, ۵۱: ۲۰۲-۲۰۵.
O. Etzioni (۱۹۹۶). The World-Wide Web: quagmire or gold mine?, Communications of the ACM, ۳۹: ۶۵-۶۸.
G. Eysenbach (۱۹۹۸). Towards quality management of medical information on the Internet: Evaluation, labelling, and filtering of information, British Medical Journal, ۳۱۷: ۱۴۹۶-۱۵۰۲.
U. Fayyad, G. Piatetsky-Shapiro, P. Smyth (۱۹۹۶). The KDD process for extracting useful knowledge from volumes of data, Communications of the ACM, ۳۹ (Nov.) ۲۷-۳۴.
N. Ford (۱۹۹۹). Information retrieval and creativity : towards support for the original thinker, Journal of Documentation, ۵۵: ۵۲۸-۵۴۲.
W.J. Frawley, G. Piatetsky-Shapiro, C.J. Matheus (۱۹۹۱). Knowledge discovery in databases: an overview, In: G. Piatetsky-Shapiro,W.J. Frawley (Eds.). Knowledge discovery in databases. Menlo Park, Cal.: AAAI Press.
E. Garfield (۱۹۶۶). The who and why of ISI, Essays of an Information Scientist, ۱ (۱۹۶۲-۷۳) ۳۳-۳۷. Originally printed in Karger Gazette, March ۵, ۱۹۶۶.
E. Garfield (۱۹۹۴). Linking literatures: An intriguing use of the citation index, Current Contents, ۲۱ (May ۲۳) ۳-۵.
D. Gibson, J. Kleinberg, P. Raghavan (۱۹۹۸). Inferring web communities from link topology, Proceedings of the ۹th ACM Conference on Hypertext and Hypermedia. ( http://www.cs.cornell.edu/home/kleinber/ht۹۸.pdf ; visited ۰۸.۱۱.۲۰۰۰).
M.S. Granovetter (۱۹۷۳). The strength of weak ties, American Journal of Sociology, ۷۸: ۱۳۶۰-۱۳۸۰.
P. Ingwersen (۱۹۹۸). The calculation of Web Impact Factors, Journal of Documentation, ۵۴: ۲۳۶-۲۴۳.
J.T. Klein (۱۹۹۶). Crossing boundaries: knowledge, disciplinarities, and interdisciplinarities, Charlottesville, Virg.: University Press of Virginia.
J.M. Kleinberg (۱۹۹۸). Authoritative sources in a hyperlinked environment, Proceedings of the ۹th annual ACM-SIAM Symposium on Discrete Algorithms, pp. ۶۶۸-۶۷۷.
M. Kochen (Ed.)(۱۹۸۹). The small world. Norwood, N.J.: Ablex Publishing Corporation.
F.W. Lancaster, J.-L. Lee (۱۹۸۵). Bibliometric techniques applied to issues management: A case study, Journal of the American Society for Information Science, ۳۶: ۳۸۹-۳۹۷.
R. Larson (۱۹۹۶). Bibliometrics of the World Wide Web: An exploratory analysis of the intellectual structure of cyberspace. In: S. Hardin (Ed.) Proceedings of the ۵۹th Annual Meeting of the American Society for Information Science, ۳۳: ۷۱-۷۸.
S. Lawrence, C.L. Giles (۱۹۹۸). Searching the World Wide Web. Science, ۲۸۰: ۹۸-۱۰۰.
P. Losiewicz, D.W. Oard, R.N. Kostoff (۲۰۰۰). Textual data mining to support science and technology management, Journal of Intelligent Information Systems, ۱۵: ۹۹-۱۱۹.
S. Milgram (۱۹۶۷). The small-world problem, Psychology Today, ۱: ۶۰-۶۷.
C. Oppenheim, A. Morris, C. Mcknight (۲۰۰۰). The evaluation of WWW search engines. Journal of Documentation, ۵۶: ۱۹۰-۲۱۱.
S.J. Pierce (۱۹۹۹). Boundary crossing in research literatures as a means of interdisciplinary information transfer, Journal of the American Society for Information Science, ۵۰: ۲۷۱-۲۷۹.
J. Qin, M.J. Norton (Eds.)(۱۹۹۹). Introduction (In issue: Knowledge Discovery in Bibliographic Databases). Library Trends, ۴۸ (Summer) ۱-۸.
J.M. Rodriguez i Gairin (۱۹۹۷). Volorando el impacto de la informacion en Internet: Altavista, el “Citation Index” de la Red. Revista Espanola de Documentacion Scientifica ۲۰ (۲): ۱۷۵-۱۸۱.
R. Rousseau (۱۹۹۷). Sitations: An exploratory study. Cybermetrics, ۱, paper ۱. ISSN: ۱۱۳۷-۵۰۱۹. ( http://www.cindoc.csic.es/cybermetrics/articles/v۱i۱p۱.html ; visited ۰۸.۱۱.۲۰۰۰).
R. Rousseau (۱۹۹۹). Daily time series of common single word searches in AltaVista and NorthernLight. Cybermetrics, ۲/۳ paper ۲. ISSN: ۱۱۳۷-۵۰۱۹. ( http://www.cindoc.csic.es/cybermetrics/articles/v۲i۱p۲.html ; visited ۰۸.۱۱.۲۰۰۰).
H. Small (۱۹۹۹). A passage through science: Crossing disciplinary boundaries, Library Trends, ۴۸ (Summer) ۷۲-۱۰۸.
A.G. Smith (۱۹۹۹). A tale of two web spaces: Comparing sites using web impact factors. Journal of Documentation, ۵۵: ۵۷۷-۵۹۲.
H. Snyder, H. Rosenbaum (۱۹۹۹). Can search engines be used as tools for web-link analysis? A critical view, Journal of Documentation, ۵۵: ۳۷۵-۳۸۴.
D.R. Swanson (۱۹۸۶). Undiscovered public knowledge, Library Quarterly, ۵۶: ۱۰۳-۱۱۸.
D.R. Swanson, N.R. Smalheiser (۱۹۹۷). An interactive system for finding complementary literatures: A stimulus to scientific discovery, Artificial Intelligence, ۹۱: ۱۸۳-۲۰۳.
D.R. Swanson, N.R. Smalheiser (۱۹۹۹). Implicit text linkages between Medline records: using Arrowsmith as an aid to scientific discovery, Library Trends, ۴۸ (Summer) ۴۸-۵۹.
M. Thelwall (۲۰۰۰). Web impact factors and search engine coverage, Journal of Documentation, ۵۶: ۱۸۵-۱۸۹.
R.E. Valdés-Perez (۱۹۹۹). Principles of human-computer collaboration for knowledge discovery in science’, Artificial Intelligence, ۱۰۷: ۳۳۵-۳۴۶.
B. Vickery (۱۹۹۷). Knowledge discovery from databases: an introductory review, Journal of Documentation, ۵۳: ۱۰۷-۱۲۲.
D.J. Watts (۱۹۹۹). Small worlds: the dynamics of networks between order and randomness, Princeton University Press, Princeton, N.J.
D.J. Watts, S.H. Strogatz (۱۹۹۸). Collective dynamics of ‘small-world’ networks, Nature, ۳۹۳ (June ۴) ۴۴۰-۴۴۲.
I. Wormell (۲۰۰۰). Critical aspects of the Danish welfare state - as revealed by issue tracking, Scientometrics, ۴۸: ۲۳۷-۲۵۰.
E. Wynn, J.E. Katz (۱۹۹۷). Hyperbole over cyberspace: Self-presentation and social boundaries in Internet home pages and discourse, Information Society, ۱۳: ۲۹۷-۳۲
*Bjorneborn, Lennart & Ingwersen, Peter (۲۰۰۱). Perspectives of webometrics, Scientometrics, ۵۰(۱), p. ۶۵-۸۲.
نوشته: لُنارت بجورن بُرن و پیتر اینگورسن*
Bjorneborn, Lennart & Ingwersen, Peter
ترجمه: علیرضا نوروزی
زهرا بیگدلی
دانشجوی دكتری اطلاع‌رسانی كارشناس كتابداری و اطلاع‌رسانی
منبع : فصلنامه علوم اطلاع‌رسانی


همچنین مشاهده کنید