دوشنبه, ۱۰ اردیبهشت, ۱۴۰۳ / 29 April, 2024
مجله ویستا


نمایه‌سازی سلسله‌مراتبی مدارک ساخت‌یافته


نمایه‌سازی سلسله‌مراتبی مدارک ساخت‌یافته
هرروز بر تعداد مدارک ساخت‌یافته (مانند مدارک قابل نشانه‌گذاری) در اینترنت اضافه می‌شود. این نوع مدارک ساخت‌یافته، علاوه بر محتوای مدرک، قالب معنایی مدرک را نیز ذخیره می‌کنند؛ بنابراین مدرک به‌صورت یک درختواره ذخیره می‌گردد.
از طرفی با افزایش اطلاعات موجود در شبکه، تقاضا برای بازیابی اطلاعات، بیشتر و پیچیده‌تر شده است. امروزه کاربران پرسش‌هایی را مطرح می‌کنند که دارای ساختار درختی است. برای بازیابی اطلاعات مرتبط، روش‌های کلاسیک که صرفاً از عملگرهای منطقی برای تطبیق پرسش با مدارک استفاده می‌کنند، نمی‌توانند چنین پرسش‌هایی را با دقت مناسب بازیابی نمایند. هدف از این مقاله بررسی نمایه‌سازی سلسله‌مراتبی و تطبیق سلسله‌مراتبی مدارک است.
● مقدمه
نظام‌های سنتی بازیابی اطلاعات، با مدرک به عنوان کوچکترین واحد اطلاعاتی برخورد می‌کنند، در صورتی که غالب کاربران نیاز به جستجوی با دقت در اجزای مدرک دارند. به عنوان مثال درخواست جستجوی «هواپیمای جنگی که در جنگ جهانی دوم، از آن استفاده شده است» را درنظر بگیرید. در این مثال هر هواپیمای جنگی مورد قبول نیست، و هواپیمایی منظور است که در جنگ جهانی دوم از آن استفاده شده. اگر به دو عنصر پرسش به صورت مجزا نگاه کنیم، هریک فقط بخشی از پرسش را مدل می‌کنند. این مشکل از دیرباز در برنامه‌های جستجوی اطلاعات مانند جستجوگرهای وب وجود داشته است. به عنوان مثال دیگر، می‌توان پرسش مدل بْرداری در بازیابی اطلاعات متنی را درنظر گرفت. این پرسش، بخشی از یک کتاب یا مقاله را درخواست می‌کند، بنابراین کلیدواژه‌های مورد استفاده باید سلسله‌مراتبی در نظر گرفته شوند. به عبارت دیگر، باید بازیابی اطلاعات به عنوان موضوع اصلی، و متنی بودن و مدل بْرداری به عنوان موضوع فرعی درنظر گرفته شوند...
مسعود بهمن آبادی


همچنین مشاهده کنید