چهارشنبه, ۱۹ اردیبهشت, ۱۴۰۳ / 8 May, 2024
مجله ویستا


اصطلاحنامه در نظام ذخیره و بازیابی اطلاعات


نظام بازیابی اطلاعات, نظامی است كه هدفش تسهیل شناسایی مدارك یا داده هایی است كه متناسب با نیاز اطلاعاتی خاصی باشد و بازیابی این مدارك با داده ها با توجه به محدودیت موادی كه در مجموعه موجود است.بازیابی اطلاعات یك عمل ساده و مكانیكی نیست؛ كاری است پیچیده و فكری كه منظور آن ایجاد ارتباط میان كسانی است كه این اطلاعات را تولید می كنند (نویسندگان مطالب) و افرادی كه این اطلاعات را مصرف می‌كنند (محققان, متخصصان و سایر دانش پژوهان ). بنابراین، نقش عمده نظام برقرار كردن این ارتباط از طریق مطابقت اطلاعات موجود در مجموعه با نیاز اطلاعاتی استفاده كنندگان و نزدیك كردن هر چه بیشتر این دو به یكدیگر است.برای اینكه نظام قادر به انجام این عمل باشد. باید محتوای مجموعه كاملاً مشخص باشد, یعنی مدارك از لحاظ محتوا بدقت توصیف شده باشند. اما این به تنهایی كافی نیست, بلكه باید نیاز جستجو كننده اطلاعات هم بشكلی به نظام عرضه شود كه عمل انطباق بین مدارك ذخیره شده و پرسش مطرح شده را تسریع كند. معمولاً این كار بوسیله استفاده از نوعی زبان نمایه انجام میگیرد.زبان نمایه یكی از اجزای عمده نظام ذخیره و بازیابی اطلاعات محسوب می شود. هر نظام اطلاعاتی از نقطه نظر عملكرد, معمولاً شامل اجزای زیر است:
۱) انتخاب گردآوری: سیاست و خط مشی تعیین كننده محتوای مجموعه.
۲) مأخذ درون داد: ویژگیهایی از مدرك برای توصیف آن و برای انتخاب اصطلاحات نمایه بكار می رود.
۳) زبان نمایه: مجموعه اصطلاحات و قوانینی كه نحوه استفاده از اصطلاحات را تعیین می كند.
۴) نشانه گذاری: عرصه اصطلاحات نمایه به صورت علائم و نشانه ها.
۵) نظم مجموعه: ترتیب و نظم عناصر در درون مجموعه اطلاعات ذخیره شده.
۶) تجزیه و تحلیل پرسش: ترجمه مفاهیم پرسش به اصطلاحات موجود در زبان نمایه.
۷) شیوه جستجو: روشی كه برای جستجوی در مجموعه بكار می رود.
۸) شكل برون داد: عرضه مشخصات ظاهری مدرك و اطلاعات لازم دیگر كه بعنوان پاسخ به پرسش مطرح شده در اختیار جستجو كننده گذاشته می شود.[۱]هر یك از اجزای فوق در ایجاد نظام ذخیره و بازیابی اطلاعات و كارآیی آن نقش اساسی و مهمی دارد. در این میان، آنچه بسبب پیچیدگیش ذهن متخصصان اطلاع رسانی را بیشتر به خود مشغول داشته است نشان دادن محتوای مدارك است و به این جهت شاید بتوان گفت زبان نمایه كه برای بیان موضوع و محتوای مدارك بكار می‌رود. مساله ای است كه اهمیت بیشتری دارد.
زبانهای نمایه را بر اساس معیارهای متفاوت. به گونه های مختلف دسته بندی كرده اند ولی بطور كلی می‌توان گفت كه این زبانها عمدتاً بر دو نوعند:
۱)زبانهای مهار شده[۲]: این زبانها، حاوی اصطلاحاتی هستند كه برای نمایه سازی مدارك انتخاب و پذیرفته شده‌اند و از آن جمله اند: طرحهای رده بندی سنتی، فهرستهای قراردادی سر عنوانهای موضوعی و اصطلاحنامه ها.
۲) زبانهای آزاد[۳]: در این زبانها، محدودیتی از نظر نوع واژه وجود ندارد؛ هر واژه با اصطلاح مناسبی می‌تواند بدون قید و شرط از زبان طبیعی گرفته شود، یعنی عیناً از زبان مدرك نقل گردد و یا متناسب با موضوع مدرك تعیین شود.اینكه كدامیك از دو روش فوق در میزان بازیابی مدارك و كیفیت كار موثرتر است، نكته ای است كه هنوز بدرستی روشن نیست و اختلاف نظرهایی كه در میان اهل فن وجود دارد موید این مطلب است. اما آنچه در عمل مشاهده می شود این است كه اكثر نظامهای دایر و فعال اطلاع رسانی كه خدمات گسترده ای را عرضه می كنند، از زبان مهار شده برای آماده سازی مدارك خویش استفاده می كنند و ابزاری كه بدین منظور بكار می رود اصطلاحنامه است. بدین جهت، مطلب حاضر به بحث درباره این وسیله اختصاص یافته است.
●تعریف اصطلاحنامه
اصطلاحنامه، واژه ای است كه در فارسی معادل واژه انگلیسی Thesaurus بكار رفته است. واژه Thesaurus در اصل از یونانی و لاتین گرفته شده كه بمعنای گنجینه یا خزانه است و سالهاست كه بمعنای گنجینه لغات استفاده می گردد.بر اساس رهنمود نظام جهانی اطلاعات علمی (یونی سیست)[۴] اصطلاحنامه را می توان یا از نظر عملكردش تعریف كرد و یا از عملكردش تعریف كرد و یا از لحاظ ساختارش. از نظر عملكرد، اصطلاحنامه وسیله ای برای مهار كردن واژه ها است و در برگرداندن زبان طبیعی مدارك، نمایه سازان یا استفاده كنندگان به زبان مقید نظام استفاده می‌شود. از نظر ساختار، اصطلاحنامه مجموعه لغات مهار شده و پویای یك زمینه خاص از دانش بشری است كه از لحاظ معنا و نوع مرتبط اند.[۵]
●پیشینه تاریخی
اولین اثری كه تحت عنوان اصطلاحنامه شهرت یافت، اصطلاحنامه روژه بود[۶]. این اصطلاحنامه كه اولین ویرایش آن در ۱۸۵۲ بچاپ رسید و هنوز هم ویرایشهای جدید آن منبع معتبری برای نویسندگان و مترجمان است، یك فرهنگ ساده لغات نیست و با آن تفاوت بسیار دارد. زیرا معمولاً وقتی به یك فرهنگ مراجعه می‌كنیم كه واژه ای را می دانیم و به دنبال معنای آن می گردیم. اما از این اصطلاحنامه موقعی استفاده می‌شود كه فكر و عقیده ای را در سر داریم و در جستجوی كلمه یا عبارت دقیق و مناسب برای بیان آن هستیم. به این جهت برخلاف فرهنگها، تنظیم آن الفبایی نیست بلكه بر اساس افكار و ایده هاست كه در گروههای كلی نظیر زمان، مكان، ماده، حواس، اراده، عواطف. . . دسته بندی شده اند. هر گروه شامل تقسیمات فرعی تری است كه هر یك از آنها به نوبه خود چندین كلمه یا عبارت را در برمی گیرد. در زیر هر كلمه، تمام كلمات مترادف و عبارات وابسته به آن مفهوم و شكلهای مختلف دستوری آنها ذكر می شود و ارتباط بین كلمات با ارجاعهای لازم مشخص می گردد. به این ترتیب اصطلاحنامه روژه در واقع یك طرح رده‌بندی اصطلاحات است كه فهرستی الفبایی نیز بدنبال دارد و ارزش آن در نحوه ارتباط دادن مفاهیم بیكدیگر با توجه به معانی متفاوت آنهاست.البته قصد تهیه كننده این اصطلاحنامه، استفاده از آن در ذخیره و بازیابی اطلاعات نبود بلكه كمك به كسانی بود كه برای تصنیف متن یا متونی بدنبال اصطلاحات صحیح و مناسب برای بیان فكر و اندیشه خود بودند. ضمناً این نكته را هم باید اضافه كرد كه تنظیم واژگان براساس مفاهیم، فكر تازه ای نبود كه از روژه سرچشمه گرفته باشد قبل از این تاریخ هم، چنین اندیشه ای بشكلها و مضمونهای مختلف و برای هدفهای متفاوت تجلی كرده بود و به جرات می توان گفت كه بحثهای كنونی در مورد ماهیت اصطلاحنامه و اصطلاحنامه‌سازی ریشه تاریخی دارد. اما اهمیت اصطلاحنامه روژه در این است كه ساخت ویژه آن چارچوب مطلوبی را برای طرحریزی اصطلاحنامه امروزی، در اختیار متخصصان اطلاع رسانی گذاشته است.نیاز به اصطلاحنامه در ذخیره و بازیابی اطلاعات از زمانی احساس شد كه نظامهای اطلاع رسانی با مشكلات مهمی در مرحله، جستجو و بازیابی اطلاعات مواجه گردیدند. زیرا اولاً رشد مداركی كه منتشر می شد سیر صعودی داشت و این امر موجب افزایش سریع حجم اطلاعات كتابشناختی می شد و از این رو لازم بود بنحوه ذخیره آنها از نظر محتوا توجه بیشتری شود. ثانیاً در روشهای متداول نمایه سازی اكثراً از زبان طبیعی بویژه نظام تك واژه[۷] استفاده می شد. نظام تك واژه كه در سال ۱۹۵۱ بوسیله مورتیمر تاوبه[۸] معرفی گردید بعلت اینكه روشی ساده و ارزان در مرحله درون داد بود، ابتدا سخت مورد استقبال قرار گرفت اما مشكلات اساسی آن در مرحله جستجو خیلی زود آشكار شد، یكی از مشكلات عمده، ناشی از فقدان كنترل واژگانی بود. چون مدارك هم موضوع و مربوط بهم بعلت نمایه سازی با تك واژه های استخراج شده از متن، غالباً از هم جدا می‌افتادند و بهنگام بازیابی نظام هیچ كمكی برای كنار هم آوردن این كلمات نمی كرد و چنانچه جستجو در زیر همه كلمات پیش بینی شده انجام می گرفت. جستجو كننده باز هم نمی توانست مطمئن باشد كه جستجوی كاملی صورت گرفته است. مشكل دیگر جستجو در مجموعه ای بود كه مرتباً بر حجم آن افزوده می شد و بهمان نسبت جستجوهای جامع. مشكلتر می شد. به لحاظ این مسایل. بتدریج نمایه سازی با تك واژه حاوی خود را به نمایه سازی با تك مفهوم گزیده شده. داد و به این ترتیب پایه و اساس ایجاد اصطلاحنامه بازیابی اطلاعات گذاشته شد.اولین كسی كه در این راه قدم برداشت هانس بیترلون بود. او تحت تاثیر روش اصطلاحنامه روزه. در صدد برآمد كلمات مجاز همراه با ارجاعهای لازم جهت استفاده در نمایه سازی موضوعی فراهم آورد .اولین اصطلاحنامه ای كه عملاً بدین منظور تهیه شد. برای نمایه سازی مدارك شیمی و مهندسی شیمی بوسیله كپمانی Dupont بود. در همان اوان. كاربر روی اصطلاحنامه دیگری در آژانس اطلاعات فنی خدمات نظامی در حال پیشرفت بود كه بالاخره در سال ۱۹۶۰ منجر به تهیه اصطلاحنامه ای شد كه حاوی توصیفگرهای خاص این زمینه بود. این دو منبع كه سرچشمه توسعه سایر اصطلاحنامه ها شدند. موقعیت اصطلاحنامه را بعنوان ابزار اساسی كنترل واژگانی در نظامهای ذخیره و بازیابی امروزی مستحكم كردند. اصطلاحنامه كمپانی Dupont پایه گذار اصطلاحنامه مهندسی شیمی شد كه توسط موسسه آمریكایی مهندسان شیمی در سال ۱۹۶۱ منتشر گردید و این نمونه خود. مبنای توسعه اصطلاحنامه واژه های مهندسی شد كه در سال ۱۹۶۴ بوسیله شورای مشترك مهندسان انتشار یافت. توسعه صنایع. سبب پیدایش اصطلاحنامه های دیگری شد و تجاربی كه از گسترش این اصطلاحنامه ها حاصل گردید منجر به تدوین راهنماها و استانداردهای ملی گردید. بهرحال. تعداد اصطلاحنامه هایی كه از سال ۱۹۶۰ به بعد تهیه شده. قابل توجه است. این اصطلاحنامه ها. اكثراً در رشته های علوم و فنون و به زبان انگلیسی می باشند.
●هدف اصطلاحنامه
اصطلاحنامه بعنوان زبان نمایه سازی برای استفاده در ذخیره و بازیابی اطلاعات دارای هدفهای اساسی و عمده زیر است:
۱) ساخت زمینه معینی از دانش را چنان تصویر نماید كه هم نمایه ساز و هم جستجوگر بتوانند از پوشش زمینه و ارتباط میان مفاهیم آن یا اندیشه های مربوط به این مفاهیم بخوبی آگاه شوند.
۲) با عرضه واژگان استاندارد برای یك زمینه خاص. امكان یكدستی مدخلها را بهنگام نمایه سازی فراهم كند.۳) بكمك نظام ارجاعات. دقیقاً مشخص كند كه اولاً از میان مجموعه اصطلاحات برابر. فقط یك اصطلاح برای نمایه سازی یك مفهوم بكار می رود و ثانیاً كدامیك از اصطلاحات بیكدیگر وابسته هستند.
۴) با استفاده از رده بندی اصطلاحات در قالب سلسله مراتب. امكان دهد بهنگام بازیابی دامه جستجو بصورت نظام یافته. قابل تجدید یا گسترش باشد.همانطور كه ملاحظه می شود. هدفهای اصطلاحنامه بیشتر متوجه كار جستجو گرو استفاده كننده است و این یكی از خصوصیات بارز اصطلاحنامه است.
●ویژگیهای مهم ا صطلاحنامه
با توجه به هدفهای فوق. اصطلاحنامه باید دارای ویژگیهای زیر باشد:
۱) متكی بر نوشته ها و نیازهای اطلاعاتی استفاده كنندگانه بالفعل و بالقوه نظام باشد.بعبارت دیگر مبتنی بر دو اصل ًضمانت ادبی ً و ً ضمانت استفاده ً باشد . ًضمانت ادبیً بدین معنی است كه در تعیین موضوعها و ارتباط میان آنها همانگونه عمل شود كه در مدارك مكتوب و مواد اطلاعاتی منعكس گردیده است. بنابر این. اساس كار باید مداركی باشد كه بعنوان درون داد به نظام وارد می شوند نه ملاحظات نظری محض و تقسیم بندیهای شناخته شده دانش. این امر موجب می شود كه نظام پویایی خود را هم حفظ كند. زیرا مفاهیم جدید بمحض ظاهر شدن در نوشته ها. وارد نظام می گردند و بالطبع موجب تغییرات لازم در ساخت مفهومی زبان نظام می شوند. ً ضمانت استفاده ً مربوط به برون داد نظام است. از آنجا كه هدف نظام. فراهم كردن امكان استفاده از اطلاعات است. لذا باید دید كه استفاده كنندگان نظام چه كسانی هستند. بودن داد مورد نیازشان چیست. چه زبانی علمی مورد استفاده آنهاست و این زبان تا چه حد تخصصی است. سپس با توجه به این موارد. موضوعها و نحوه تقسیم بندی آنها را در نظر گرفت.بنابر این یك اصطلاح در صورتی پذیرفته شده است كه اولاً نوشته های كافی در آن زمینه وجود داشته باشد و ثانیاً مراجعان و استفاده كنندگان نظام در آن سطح از تخصص. بقدر كافی درخواست اطلاعات بكنند. در تهیه اصطلاحنامه ًضمانت استفاده ً حتی مهمتر از ًضمانت ادبی ً است. زیرا ممكن است در یك نظام. نام مثلاً انواع ماهیها. بر اساس محتوای مدارك. ضبط شده باشد كه در این صورت ًضمانت ادبی ً رعایت شده است. اما اگر استفاده كنندگان این نظام. هرگز به واژه ای ریزتر از ًماهیً احتیاج نداشته باشد. گسترش واژگان با چنین دامنه ای در این حد از تخصص . دلیل منطقی و با ارزشی نخواهد داشت.
۲) سطح شكستگی و خاص شدن اصطلاحات در حد كافی و مورد نیاز باشد. اصطلاحات اخص در واژگان عامل مهم و موثری در دقت بازیابی هستند. برای مثال اگر جستجو كننده ای بدنبال مطلب درباره ًخودوسرً باشد ممكن است بعلت نبودن چنین اصطلاحی در نظام. مداركی را بازیابی كند كه با استفاده از اصطلاح عامتری چون ًغلات ً نمایه سازی شده اند. در این صورت بسیاری از مدارك بازیابی شده به موضوع مورد نظر مربوط نمی شوند.
۳) پیش همآرایی غلط و ارتباط نادرست اصطلاحات در هنگام بازیابی جلوگیری شود. این مشكلات بخصوص در نظامهای تك واژه ای بیشتر بروز می كند و به نسبتی كه بر پیش همآرایی اصطلاحات افزوده می گردد. مشكلات مزبور كاهش می یابد.
۴) با اعمال كنترل واژگانی . یعنی مهار كردن مترادفها. شبه مترادفها و نظایر آن . تعیین اصطلاحات مجاز و نیز مشخص كردن حدود ثغور اصطلاحاتی كه معنا و محدودشان روشن نیست موجب دقت و یكدستی در نمایه‌سازی و جستجو گردد و نمایه ساز و جستجو گر را در انتخاب مناسب ترین اصطلاح برای بیان موضوع خاصی كمك نماید.البته ویژگیهای اصطلاحنامه به این موارد محدود نمی شود. اما در تهیه و توسعه یك اصطلاحنامه خوب و كارآ. توجه به این ویژگیها از اهمیت خاصی برخوردار است.
[۱] - William Goffman and Vaun A. Newill. "A Methodology for Test and Evaluation of Information Retrieval systems", Information Storage and Retrieval ۳ (August ۱۹۶۶): ۲۱.
[۲]- Controlled Languages
[۳] - Free Languages
[۴] - World Science Information System of Unesco (UNISIST)
[۵] - Unesco. UNISIST Guidelines for the Establishment and Development of Monolingual Thesauri, Paris, Unesco, ۱۹۷۳. P. ۶.
[۶] - Peter Mark Roget. Thesaurus of English Worlds and Phrases.
[۷] - Uniterm System
[۸] - Mortimer Taube
نوشته: مهرانگیز حریری
منبع : فصلنامه علوم اطلاع رسانی