سه شنبه, ۱۸ اردیبهشت, ۱۴۰۳ / 7 May, 2024
مجله ویستا


تجزیه و تحلیل مدارک و نظریه زبان‌شناسی


تجزیه و تحلیل مدارک و نظریه زبان‌شناسی
در این مقاله از یكی از جنبه های دانش اطلاع رسانی یعنی تجزیه و تحلیل مدارك و رابطه آن با نظریه زبان شناسی سخن میرود [۱]منظور از "تجزیه و تحلیل مدارك"[۲]در این مورد بخصوص استخراج مفاهیم از مدارك نوشته شده است. البته مدارك نوشته شده را نباید منحصر به "مدارك علمی نمود، بلكه سایر مدارك مانند متون ـ مدارك تاریخی ـ اساطیر ـ فرهنگ عامه ـ نوشته های مذهبی و مانند اینها نیز در این رده مورد توجه هستند. منظور از ارائه این مقاله در درجه اول بحث درباره مدارك علمی است و در درجه دوم اشاره به گروههای مختلف متون تا آنجا كه در حدود معین به روش تحلیل مدارك مربوط می شوند.در مورد استخراج مفاهیم از مدارك، كه قبلا" ذكر شد، هر كس مجاز است كه برای چنین منظوری نظری را كه خود با روش موجود مناسب میداند بپذیرد، كه خود سبب بی نظمی میگردد. این بی نظمی بعلت ان است كه بیشتر روشهای مشروحه تحت عنوان وسیع آماده سازی مدارك یا ارائه مدارك، در دانش اطلاع رسانی، مانند زمینه های دیگر، بصورت یك وسیله جستجوی مفهوم در نظر گرفته می شود. بعنوان مثال این موضوع در روشهای آماری نیز صدق می كند، روشی كه در آن حالت های مختلف (مانند تعداد دفعات، فاصله آماری و غیره) بمنظور آشكارساختن مفاهیم چند كلمه معنی دار یا چند جمله از یك مجموعه بكار می آید. این روشها قبل از اینكه در سالهای ۶۰ در دانش اطلاع رسانی متداول شود در روان شناسی، ادبیات، جامعه شناسی و غیره مورد استفاده قرار می گرفت. البته روشهای مذكور را اكنون می توان به اعتباری بعنوان قسمتی از وسایل تحلیلی زبان شناسی تلقی كرد، چنانكه امروز "زبان شناسی آماری" یكی از كاملترین رشته های علوم زبان شناسی بشمار می آید. در این جا از اشاره به "معنا شناختی آماری" بخاطر پرهیز ا زمشكلات و نقایصی كه برای منظور ما پیش خواهند آورد چشم پوشی می شود.باری موضوع مورد بحث نویسنده را می توان بنحو صریحتر چنین بیان نمود: بررسی همكاری دانش زبان شناسی با كیفیت روشهائی كه در آماده سازی مدارك در دانش اطلاع رسانی از آنها استفاده می شود. برای سهولت كار می توان این روشها را به دو گروه وسیع قسمت كرد:
الف) روش های طبقه بندی، كه در آن حاصل تحلیل مدارك، فهرستی است از واحدهای زبان شناختی كه ا زمتون زبان طبیعی استخراج و به روشهای مختلف مرتب شده اند (مانند نمایه ها و هماهنگ سازها).
ب) روشهای تبدیلی، كه در آن متون زبان طبیعی (مدارك یا پرسشها) موضوع عملیات پیچیده تری هستند مانند نمایه سازی ـ تجزیه و تحلیل معنایی و تركیبی ـ ارائه آنها در زبان اطلاع رسانی و غیره. مفهوم این دودستگی برای متخصصان دانش اطلاع رسانی آشنا است و احتیاج به تفسیر ندارد، همینطور احتیاجی نیست كه تاكید شود كه روشهای تركیبی كه متشكل از روشهای طبقه بندی و تبدیلی است، معمول ترین روشها هستند.
۱) نمایه ها و هماهنگ سازها
ابتدا می پردازیم به بیان ساده ترین روشهای نمایه سازی: عناصر (غالبا" كلمات) در زبان طبیعی از مجموعه موجود انتخاب و بنحو مشخصی مرتب می گردند، بعد به واحدهای قرینه (از یك نوع یا انواع مختلف) تقسیم می شوند (مانند عبارات، جمله ها و غیره) و سرانجام بصورت طبقه بندی شده كه غالبا" در بردارنده یك دستگاه ارجاعی برای واحدهای گشوده تری در مجموعه است تظاهر میكند (مدارك، صفحات، پاراگرافها و غیره). روش و نتیجه كار هر دو مشخص هستند و بعنوان نمونه می توان نمایه های گردان[۳] را جزو این گروه ذكر كرد. در اینجا مساله قابل توجهی كه مطرح میشود اینست كه آیا زبان شناسی در توسعه قواعد اطلاع رسانی مثمرثمر بوده است یا نه؟
با مطالعه مراحل ذكر شده در بالا، بشرح كوتاهی در زمینه مساله انتخاب می پردازیم. باید گفت راه حل هائی كه در دانش اطلاع رسانی مورد استفاده قرار می گیرد بستگی خیلی كمی با زبان شناسی دارد. قبل از هر چیز باید واحدهای دارای معنی و واحدهای فاقد معنی را از هم تشخیص دهیم. بعد ببینیم در زبان طبیعی كدام بیان رساننده مقصود شناخته می شود یعنی كدام مدخلها در یك نمایه موجود ضرور و كدام غیر ضرور است. جواب این سئوال به میزان رسابودن نمایه، مقصود نمایه ساز و همچنین به خود مجموعه بستگی دارد. در این زمینه، در زبانشناسی، روش خاصی موجود نیست، مگر آنكه استفاده از فهرست كلمات غیرمجاز[۴]را بعنوان یك روش زبانشناسی تلقی كنیم. كه در این صورت زبانشناسان هر زبان، فهرستی استاندارد شده از لغاتی كه نباید بعنوان مدخلهای نمایه بكار رود تهیه می نمایند. به چنین فهرستی نه تنها باید حروف ربط، قیود، حرف اضافه و نظایر آنرا اضافه كرد، بلكه تعداد زیادی از اصطلاحات كه در عبارات علم معانی وجود دارد و برای استفاده كنندگان از فهرست در درجه اهمیت كمتری قرار دارند، بآنها اضافه شود. طبیعی است كه فهرست كلمات غیر مجاز تهیه شده توسط دانشمندان دانش اطلاع رسانی یك فهرست تجربی و دور از نظریه های زبان شناسی است.
با توجه به مرحله دیگری از انتخاب، نظریه مشابهی می توان اظهار نمود: بعضی كلمات بهتر است به تنهائی بكار برده شوند، ولی در موارد دیگر لازم است كه یك یا چند واژه بصورت تركیبی بكار روند تا گویای مفهوم معینی باشند. طبیعی است كه در حالت اخیر جابجائی واژه هائی كه در تركیب بكار رفته اند موجب تغییر مفهوم و پیدایش مفاهیم جدید خواهند شد. یك چنین زمینه ای اساس كار واژه سازی است. درباره لغت نامه ـ اصطلاحات ـ اختصارات و غیره مطالب زیادی نوشته شده است كه در مسائل علمی وابسته به نمایه سازی در دانش اطلاع رسانی می تواند مفید باشد. ولی به هر حال نمی توان باین امر اكتفا كرد. از آنجا كه نمایه های مربوط به مدارك منحصرا" نمایه هائی هستند سوگرفته و مشخص در یك زمینه خاص، تصمیم گیری درچنین مواردی باز بر اساس ملاحضات تجربی و جدا از روشهای پیشرفته فرهنگ نویسی خواهد بود.سومین مرحله انتخاب، گزینش است.
در این مرحله انتخاب واژه ها بشكل طبیعی آن بعنوان مدخلهای نمایه انجام می شود. نمونه هائی از آنرا می توان در دانش اطلاع رسانی یافت. در گام اول، روش تبدیل از اشكال به پایه ها بطور وضوح با تجزیه و تحلیل ریخت شناختی[۵]، همانطور كه در زبان شناسی نظری بكار برده شده است، مرتبط است. معهذا لازم به یادآوری است كه با وجود اینكه متخصصان تجزیه و تحلیل ریخت شناسی در سده شانزدهم برای هر زبا ن علمی مانند زبانهای انگلیسی ـ روسی ـ آلمانی ـ فرانسه ـ و به مقاصد مختلف (مانند ترجمه ماشینی، لغت نویسی، تجزیه و تحلیل تركیبی و غیره) قواعدی به دست داده اند، باز بنظر نمی رسد كه این قواعد بتوانند بعنوان قواعد استاندارد شده جهت نمایه سازی در دكومانتاسیون در هر یك از زبانهای فوق بحساب آیند.
بعد از انتخاب مدخل نمایه ها، مساله طرز قرار گرفتن آنها بصورتی كه كار تحقیق را آسانتر نماید مطرح می شود. آسانترین راه، روش الفبائی كردن آنهاست. این روش تا حدی در زبان شناسی یك روش ابتدائی است. بعضی نمایه ها از الگوی دیگری كه بر پایه روابط معنایی استوار است متابعت می نمایند. رده بندی مدخلها از روی تركیب معانی صورت میگیرد، مانند واژه نامه مفهومی[۶] كه شناخته شده است، و یا واژه نامه های زبان طبیعی[۸].پایه های نظری واژه نامه های زبان طبیعی هنوز كاملا" ساخته نشده اند و نمی توان ادعا كرد كه ترتیبات معنایی اصطلاحات زبان طبیعی مستخرج از مدارك علمی از لحاظ زبان شناسی دارای ارزش خاصی است. البته روشهائی پیشنهاد شده است كه هدف اساسی چنین گروه ها و طبقه بندیهائی را در بر می گیرد. این روشها از سوئی به نظرات و تحقیقاتی كه زمانی بوسیله هریس[۹] متداول شده بود و تا اندازه ای خارج از بحث زبان شناسی است متكی است، و از سوئی دیگر به مقیاسهای آماری مانند آنچه در طبقه بندی خودكار مورد استفاده قرار میگیرد. البته طبقه بندی خودكار رابطه ای غیر زبان شناختی با سمانتیك دارد.
بعد از انتخاب و طبقه بندی مدخلهای نمایه، مساله رده بندی مفاهیم و طریقه ارائه آنها جهت استفاده كنندگان مطرح میشود. در این مرحله نمایه ساز از میان اصطلاحات بیشماری كه مربوط به متن می باشد نسبت به تقدم و تاخر آنها تصمیم میگیرد. در این صورت است كه دو مساله پیش میآید:
۱) كدام اصطلاح با توجه به ضرورت دانش اطلاع رسانی بهترین است؟
۲) و آیا از روشهای زبان شناسی می توان برای رده بندی مفاهیم زبان طبیعی از چنین اصطلاحاتی استفاده كرد؟ جواب سئوال (۱) از طرفی به ذوق و سلیقه و از طرفی دیگر به تشخیص عملی بودن آن بستگی دارد. در قسمت (۲) بویژه مواقعی كه برای اصطلاحات اختیار شده محدودیت قائل باشند امكان انتخاب كم میشود و این بدین جهت است كه گر چه زبان شناسان هنوز از مفاهیم: جمله، عبارت، بند و غیره استفاده می كنند معهذا در مورد وجود چنین اختلافات آشنائی كمتری دارند و بطور یقین این بیانی است از این حقیقت كه:
۱) متخصصان دانش اطلاع رسانی اصطلاحات صریح را بیشتر ترجیح میدهند، نظیر عناوین مدارك و جملات چكیده های تلگرافی.
۲) نكته دیگر اینكه بعلت عدم روابط مشخص مجبورند بر اساس روابط تجربی تصمیم گیری نمایند.
در هیچ یك از سه بحث فوق بنظر نمی آید كه زبان شناسی بتواند كمك زیادی به دكومانتالیست ها بنماید. قواعد پیشرفته تجزیه و تحلیل متون در زبان شناسی بطور كلی بمنظور آمادگی قدرت درك یك شخص در تكلم و فهم زبان مشخص است. در صورتیكه هدف نمایه سازها در دانش اطلاع رسانی بیشتر سودمند نمودن نتیجه سخن رانی ها و نطق ها در جهان مباحث است تا كیفیات دیگر آنها. دستورالعملها و یا قواعدی كه بر حسب روابط تجربی بوجود آمده اند نه تنها در این مورد پذیرفته هستند بلكه بدلیل صرفه جوئی در وقت توصیه هم می شوند. در این مورد اصول نطری مبنی بر متابعت دستورالعملها از قواعد دستوری زبان طبیعی وجود ندارد.۲) تجزیه و تحلیل محتوی
در موارد مختلف این بحث پیش آمده كه دانش اطلاع رسانی جز آنكه فعالیت خود را محدود به نمایه سازی و هماهنگ كردن آنها نماید، به تنهایی نمی تواند در زبان طبیعی عمل نماید . یكی از فعالیتهای اساسی دانش اطلاع رسانی ایجاد ارتباط بین مدرك و پرسش است. این امر مستلزم این است كه هر دو قسمت (مدرك و پرسش) با در نظر داشتن مناسبات معنایی و صور مختلف آن در زبان طبیعی دوره نوشته شوند. براحتی میتوان نشان داد كه جهت انجام فعالیتهای مربوط به مدارك اطلاع رسانی در زبان طبیعی (مدارك) و همچنین جهت برآورده ساختن نیازهای اطلاعاتی زبان طبیعی (پرسشها)، داشتن دانشی مشابه آنچه در بالا ذكر شد لازم است. از جمله قواعد شناخته شده ای كه دكومانتالیست ها مورد استفاده قرار میدهند، طبقه بندی – اصطلاح نامه ها – واژه نامه و غیره. سئوالی كه مطرح می شود این است كه آیا زبان شناسی نقش مهمی د رتوسعه این قواعد داشته است یا نه؟
▪ قواعد معنایی
قبل از هر چیز به معنای وسیعی كه عنوان بالا دارد اشاره می كنیم. در كنار "قواعد معنایی" لغاتی كم و بیش اختصاصی نظیر: هم معنایی، چند معنایی و غیره را می توان نام برد. این قواعد مدت زیادی متداول ترین قواعد طبقه بندیها به توسعه دانش، به گسترش شبكه ارتباطات جهانی و تا اندازه ای نیز به خود واژه ها (سرعنوان ها و غیره) بستگی دارد. با اختصاصی شدن نوع طبقه بندیها، اصطلاحاتی كه برای در برگرفتن طبقه بندیها و فهرست كردن مورد استفاده قرار گرفت و مفهوم وسیع "زبان اطلاع رسانی" برای در برگرفتن طبقه بندیها و فهرست اصطلاحات و توصیف گرها بوجود آمد. بعدها مساله ارتباط زبان طبیعی با زبان اطلاع رسانی پیش آمد كه واژه نامه[۱۰] جواب پیشنهادی این مساله بود كه با ارتباط های ارجاعی مشخص می نمود كدام شاخه فرعی از لغات طبیعی باید در زبان اطلاع رسانی بكار برده شوند. رده ها و زیر رده ها در روشهای سیستماتیك و توصیف گرها در اصطلاح نامه ها بعنوان نشانه هائی هستند كه مفاهیم زبان طبیعی را به اشكال مختلف نمایان می سازند.روابط معنایی در دانش اطلاع رسانی ایجاد دو مساله می نماید:
۱) مسائلی كه مربوط به انتخاب مفاهیم لغوی است و باید در فرهنگ معنایی گنجانده شود
۲) طرز برقراری ارتباط بین مفاهیم ذكر شده در قسمت (۱). سئوالی كه پیش میـآید این است كه آیا زبان شناسی نظری برای متخصصان دانش اطلاع رسانی كه با دو مساله فوق مواجه هستند مفید بوده است؟مسائلی كه در مورد نمایه سازی و هماهنگ نمودن آنها پیش میآید نظیر مسائل و مشكلات ذكر شده در بالا است. انتخاب مدخلهای فرهنگ لغات بیشتر بر اساس غیر استدلالی است تا از روی روابط قراردادی. در قسمت دوم این مساله روشهائی جهت استخراج روابط معنایی از اصطلاحات زبان طبیعی از طریق مطالعه وضع این اصطلاحات در یك مجموعه موجود می باشد. نقائصی كه بر این روشها وارد میشود عبارتست از: بی ثباتی تمام روشهای توزیع (اعم از نظری و عملی) در زبان شناسی. دستور العملهائی كه برای تالیف واژه نامه در دانش اطلاع رسانی تهیه شده چندان از قواعد نظری زبان شناسی پیروی نمی نمایند.
۲-۲ ) قواعد دستوری
متخصصان تجزیه و تحلیل روشهای گوناگونی جهت نشان دادن وجود یا طبیعت روابط نحوی كه بین همه و یا پاره ای از اصطلاحات وجود دارد، بكار برده اند. با وجود اهمیتی كه دانش اطلاع رسانی در این زمینه دارد، عده ای از نویسندگان در تمیز بین محتوی و شكل موفق نبوده اند. در اینجا لازم است كه به دو نكته كه هر كدام پرسشی را طرح می كنند، اشاره كنیم:
۱) با توسل به اصطلاحات و رعایت روابط تركیبی بین آنها می توان درك مفاهیم اصلی یك مدرك را كه گاه ممكن است نارسا باشد تكمیل نمود.
۲) توجه به قواعد مربوط به تجزیه و تحلیل مفاهیم از دیدگاه زبان شناسی به آماده سازی مدارك كمك نسبی می نماید.هر دو فرضیه هنوز كاملا" برای كسانیكه دست اندر كار تجزیه و تحلیل مدرك هستند روشن نشده است. ارتباط نامحدود كلمات كلید و توصیف گرها تنها راه پرداختن به تحلیل مدارك نیست. از سوی دیگر، همانطور كه از این مقاله می توان پی برد، قواعد و دستورهای گمراه كننده ای در زبان طبیعی هست كه خیلی بندرت بطور علمی در تجزیه و تحلیل مدارك از آنها استفاده میشود. این اظهار نظر یا ادعا بدون شك بتا مخالفت بسیاری از نویسندگان دستور زبان و قواعد مواجه خواهد شد. در زیر بطور اختصار به چند شاهد اساسی در این زمینه می پردازیم.اگر چه روش های اطلاع رسانی به اطلاعات تركیبی اهمیت میدهند لیكن قواعد زبان طبیعی، حتی قدیمی ترین آنها، نمی تواند چهار چوب مناسبی برای این منظور باشد. تنها دانستن این مطلب كه بسیاری از روش های اطلاع رسانی جدید برای قواعد نظری اخیر مفید نمی باشند كافی نیست، بلكه دانستن این مطلب نیز مهم است كه هیچ كدام از روش های قرار دادی تجزیه و تحلیل مدارك كه در صد سال اخیر بكار رفته است، در استفاده از قواعد دستوری موجود در زبان طبیعی زمان خود جهت روابط تركیبی مناسب نبوده اند.این موضوع را صرفا" نمی توان یك پیشامد دانست و كوتاهی در تجزیه و تحلیل مدارك و استفاده اندك از آن را مورد انتقاد قرار داد. نمونه های متعدد و متناقض از ساختمان های ارتباطی وجود دارد كه استفاده از آنها به همان اندازه كه برای علمای دستور غیر منتظره است در كار تهیه متن نیز نامناسب می باشند.در واقع قواعد دستوری تجزیه و تحلیل مدارك رابطه نزدیك تری با مفاهیم منطقی دارند تا با زبان شناسی محض معمول ترین این قواعد عبارت از نشانه هائی هستند كه در تجزیه و تحلیل مدارك خصوصا" با بكار گرفتن اصطلاح نامه ها از آنها استفاده می شوند مانند نشانه هائی كه برای تعیین نوع ارتباط چند توصیف گر و یا جنبه های مختلف آنهاست. این نشانه ها مسلما" دور از قواعد تجزیه و تحلیل نمی باشند ولی متمم صریحی نیز چه در گذشته و چه در زمان حال برای قواعد زبان شناسی بحساب نمی آیند. بعبارت دیگر هنوز قواعد دستوری در هیچ زبانی، فهرست كامل و قابل توجهی در زمینه های مختلف مثلا": یك رابطه نسبی بین "مقدمه" x و "نتیجه" Y بوجود نیاورده است و نظریه پردازان سبك های نحوی و تركیبی را كه در ساختن قواعد زبان شناسی دارای اهمیت بسیار و در تجزیه و تحلیل مدارك دارای اهمیت كمتری است آشكار نمی سازند.
۳) روش و نحوه تجزیه و تحلیل مدارك
غرض از این مبحث تعریف تجزیه و تحلیل مدارك كه بمعنی استخراج مفاهیم از متن است، مستلزم مرجعی است كه از متن گرفته می شود و بوسیله نمادهائی[۱۰] كه حتما" لازم نیست در متن وجود داشته باشد معین و معرفی میگردند یعنی مفاهیم و مناسبات مشترك آنها، بوسیله نمادهای غیر مشخصی (مانند توصیف گرها، نشانه های ارتباط و غیره) معین میگردند. باین نمادها كه برای بیان محتوی بكار میروند در اصطلاح Metalanguage[۱۱] گفته می شود. گر چه اختیار نمودن واژه ای كه خود دارای معنی مشخص و خاصی است خالی از اشكال نیست، لیكن بیان مناسب دیگری كه معرفی كننده این دسته از نمادها باشد وجود ندارد كه هم خارج از زبان مدرك مورد تجزیه و تحلیل باشد و هم رساننده مفهوم مدرك در جهات مختلف و به مقاصد متفاوت نیز باشد، بعنوان مثال: بازیابی اطلاعات ـ طبقه بندی و غیره در دانش اطلاع رسانی، مطالعات مربوط به فرهنگ عامه و تفسیرها).
[۱] برای بررسی و تحقیق وسیع تری در زمینه "زبان شناسی و دانش اطلاع رسانی" می توان به منابع زیر رجوع كرد: مقاله ای تحت همین عنوان و بوسیله C. Montgomery (۱۹۷۲) – همچنین مقاله هایی كه توسط M. Kay و K. Sparch jones (۱۹۷۱) نوشته شده است و نیز گزارشی كه بوسیله همین نویسنده برای F.I.D چاپ شده است. مقاله دیگری نیز بزبان فرانسه و در همین زمینه توسط M.Coyaud (۱۹۷۲) نوشته شده است.
[۲] تجزیه و تحلیل مدارك در زبان فرانسه "Anyalyse documentaire " است كه در اینجا سعی شده است در قالب همان معنی بكار برده شود. این نام از اسم گروهی كه از پانزده سال پیش شروع بكار نموده اند یعنی گروهentre d`analyze documentaire pour l`archeologie اخذ شده است.
[۳] KWIC
[۴] Stop-list (فهرستی است از كلماتی كه بعلت فقدان ارزش اطلاعاتی در نمایه بكار نمی روند).
[۵] Morphological
[۶] Conceptual dictionaries
[۷] رجوع شود به: (Roget for English, watburg and halling for French, etc.)
[۸] Harris
[۹] Thesaurus
[۱۰] Symbols
[۱۱] رجوع شود به: (Gardin, ۱۹۶۹)

نوشته: ژان كلودگاردن
ترجمه: آنوش هارطونیان
منبع : فصلنامه علوم اطلاع رسانی