پنجشنبه, ۱۳ اردیبهشت, ۱۴۰۳ / 2 May, 2024
مجله ویستا

سیستم مترجم صوتی


سیستم مترجم صوتی
مردم دنیا با استفاده از وسایل ارتباطی جمعی روز به روز به یکدیگر نزدیک تر می شوند. وجود اینترنت و ماهواره مرز بین کشورها و بعد جغرافیایی بین آنها را از بین برده است. امروزه تفاوت بین مردم در زبان و فرهنگ آنهاست. درآینده ای نزدیک با بوجود آمدن پل های ارتباطی برقراری ارتباط هر چه بیشتر بین اهالی دهکده جهانی آسان تر می شود. سیستم مترجم صوتی یکی از پل های ارتباطی است که نقش مهمی در برقراری ارتباط بین افراد ایفا خواهد کرد. با استفاده ازمترجم صوتی افراد با زبان های مختلف سخن یکدیگر را درک می کنند و و قادربه پاسخگویی خواهند بود.
در واقع افراد با زبان های متفاوت، توانایی برقراری ارتباطی صحیح را پیدا می کنند، چرا که ارتباط عبارت است از فراگرد انتقال پیام از سوی فرستنده به گیرنده با این شرط که درگیرنده پیام، مشابهت معنی با نظر فرستنده وجود داشته باشد. MT (machine Translation) ترجمه اتوماتیکی متن از یک زبان به زبان دیگر است. مؤسسه راکفلر در نیویورک اولین تحقیقات در رابطه با MT یا ماشین ترجمه را در سال ۱۹۴۶ آغاز کرد و تاکنون دستاوردهای مهمی داشته است. از سه سال پیش، در دانشگاهی در جنوب کالیفرنیا یک تیم از محققین روی سیستمی کار می کنند که می تواند با دریافت صدای افراد زبان گویشی آنها را به زبان شنیداری برای فرد دیگر ترجمه کند. این سیستم به گونه ای تعبیه شده است که سخن افراد را دریافت می کند و سپس آن را به زبان دیگری ترجمه کرده و کلام ترجمه شده را پخش می نماید.
در واقع این سیستم صدای افراد را به زبان خودشان دریافت می کند و سپس آن را ترجمه می نماید و در نهایت به فرد مقابل منتقل می کند. شبیه سازی اولیه این سیستم گفت وگویی است که بین پزشک و بیمار صورت می گیرد.
دو زبانی که در مرحله اولیه برای گفت وگوی بین پزشک و بیمار در نظر گرفته شده، زبان فارسی و زبان انگلیسی است. این سیستم روی laptap پرسرعت نصب می شود و سیستم عامل آن unix می باشد. پزشک و بیمار هر دو از هدفونی استفاده می کنند که میکروفونی به آن متصل است و نیز کلیدی در آن تعبیه شده است که بین بیمار و پزشک تغییر وضعیت می دهد. ویژگی مهم این سیستم بعنوان رابط بین پزشک و بیمار در database آن است که تاکنون ۳۰۰ مکالمه پزشک انگلیسی زبان با بیمار فارسی زبان درآن ایجاد کرده اند. به عبارتی پزشک به زبان انگلیسی از بیمار سئوالاتی می کند و بیمار با استفاده از این سیستم صحبت های پزشک را به زبان فارسی می شنود و در نهایت بیمار پاسخ هایی را به زبان فارسی به پزشک می دهد و پزشک نیز به زبان انگلیسی آن را دریافت می کند. در واقع این سیستم سئوالات انگلیسی پزشک را با نرم افزار تشخیص صدا ذخیره می کند و با database موجود مقایسه می نماید، سپس سئوال مربوطه را به فارسی ترجمه می کند و بیمار در گوشی خود سئوال پزشک را می شنود.
در مرحله بعدی پاسخ به زبان فارسی بیمار ترجمه شده و به پزشک منتقل می شود. این سیستم مانند پلی بین پزشک و بیمار و در مراحل گسترده تر وسیله ارتباطی مناسبی بین دو فرد با دو زبان متفاوت می باشد. در طراحی و پیاده سازی این سیستم تیمی از محققین کار می کنند که در رشته های متفاوتی صاحب نظر هستند. پروفسور Narayanan سرپرست تیم پروژه مترجم صوتی می باشد. وی مهندس الکترونیک و کامپیوتر است و نیز سمت استادی در زمینه زبانشناسی دارد.
در بین اعضای این گروه چند تن از پزشکان ایرانی مقیم لس آنجلس فعالیت مستمر دارند و همچنین خانم دکتر شادی گنجوی که دارنده مدرک دکتری در رشته زبانشناسی است، یکی از اعضای مهم این تیم می باشند. به گفته سرپرست تیم؛ پروفسور Narayanan؛ خانم گنجوی بدلیل آشنایی با ساختار زبان فارسی و انگلیسی نقش مهمی در این پروژه ایفا می کنند. محققین مؤسسه viterbi که یکی از مهمترین مؤسسه های تحقیقاتی در این زمینه است- امیدوارند که ظرف دو سال آینده یا حتی نزدیک تر این پروژه را به مرحله نهایی برسانند و نیز اعتقاد دارند که این سیستم نه فقط از کارایی بسیار بالایی برخوردار است بلکه در شرایط گوناگون بخصوص در مواقع اضطراری و اورژانسی بسیار کاربرد خواهد داشت. مهندسین و اساتید در لابراتوارهای این مؤسسه به تجزیه و تحلیل جملات و تفسیر آنها می پردازند. آنها روی تبدیل ساختار زبان ها و همچنین خطاهای موجود و ایراداتی که امکان وجود آنها زیاد است تحقیق می کنند، تا ترجمه جملات بطور صحیح و کامل انجام شود و منظور گوینده بطور دقیق به شنونده منتقل گردد. به همین منظور برای انجام این پروژه مبلغ ۸/۳ میلیون دلار سرمایه گذاری شده است تا تحقیقی کامل و جامع در زمینه مترجم صوتی انجام گیرد. از ویژگی های بسیار مهم مترجم صوتی، سرعت بالا و نیز مبرا بودن از خطا می باشد.
● پروفسور Narayanan سرپرست تیم پروژه مترجم صوتی
این سیستم دارای بخش هایی اعم از سخت افزار و نرم افزار است. سخت افزار آن میکروفون، برای دریافت صدا و بلندگو، برای انتقال صدا می باشد. نرم افزار آن نیز از چندین قسمت تشکیل شده است، ابتدا کلام ورودی به متن تبدیل شده، سپس به زبانی دیگر برگردان می شود و در مرحله نهایی به صوت تبدیل می گردد. نرم افزارهایی در این زمینه وجود دارد که هر یک از این مراحل را به صورت تکی انجام می دهد و تاکنون سیستمی که بتواند در کثری از ثانیه و درسطحی وسیع این عملیات را انجام دهد، طراحی نشده بود.
به عنوان نمونه، نرم افزارهایی وجود دارد که صدای افراد را دریافت کرده و کلام آنها را تشخیص داده، سپس بصورت متن آن را نمایش می دهد که البته چنین نرم افزارهایی در زبان مختلف موجود است که از کارایی بالایی برخوردار می باشد. ساختار کلی این نرم افزارها به گونه ای است که بعد از گرفتن مشخصات کلی از کاربر یک profile اختصاصی برای فرد ایجاد می کنند. زیرا این نرم افزار بایستی با چگونگی بیان و سخن گفتن فرد آشنا شود. سخن گفتن شاخصه ای است که از فرد تا فرد متفاوت می باشد، افرادی تند سخن می گویند، افرادی به آرامی و با طمانینه صحبت می کنند، صدای بعضی بلند است و برخی دیگر صدایشان ضعیف است و اقسام دیگر که می بایست این نرم افزار با آن آشنا شود. بعد از ایجاد هر profile، چندین متن از پیش تعیین شده روی صفحه نمایش ظاهر می شود و این نرم افزار از کاربر درخواست می کند تا در مدت تعیین شده صفحات را شمرده و آرام با صدایی یکنواخت بخواند تا چگونگی گویش کاربر را ذخیره نماید و با هر بار سخن گفتن فرد کلام او را تشخیص دهد و قادر باشد حروف آن را کنار هم بگذارد و در نهایت متن تایپ شده را نمایش دهد. نرم افزارهای نیز برای ترجمه زبان های مختلف به یکدیگر وجود دارد. بیشتر زبان های دنیا مانند انگلیسی، آلمانی، فرانسه، ژاپنی، چینی و... دارای ساختار زبانی مشخصی هستند که توسط زبانشناسان به صورت مکتوب در آمده است.
پیاده سازی نرم افزارهای برگردان هر یک از این زبان ها از زبان مبدا به زبان مقصد که ساختار زبانی آن نیز در دسترس است، توسط افراد متخصص صورت گرفته که طبق آمار بدست آمده از کارایی بسیار بالایی برخوردار بوده، به گونه ای که درصد خطا در آنها بسیار پایین است. متأسفانه با وجود تلاش های بسیار توسط استادان ادبیات فارسی، هنوز ساختار زبان فارسی به درستی مشخص نشده است، در نتیجه نرم افزارهایی که به منظور برگردان زبان فارسی به زبانی دیگر و یا از زبانی دیگر به زبان فارسی موجود است از خطا مبرا نیستند. یکی از مشکلاتی که درسیستم مترجم صوتی وجود دارد ذخیره سازی ۹۰۰۰ لغت فارسی و۲۳۰۰۰ لغت انگلیسی است که این ارقام تناسبی با هم ندارد و دلیل آن را به ساختار زبان فارسی مربوط می کنند. نرم افزار تبدیل متن به صوت از سال ها پیش در زبان های مختلف وجود داشته است و از کارایی بسیار بالایی نیز برخوردار است، زیرا برای هر یک از حروف در هر زبان، صوتی وجود دارد و همانگونه که با کنار هم قرار دادن حروف، کلمات ساخته می شود، با قرار گرفتن صدای هر حرف کنار هم، آوای آن سخن ایجاد می گردد. پروفسور Narayanan معتقد است برای انجام چنین پروژه ای می بایست سه اصل کلی را درنظر گرفت:
۱) ترجمه متن
ترجمه عبارت است از انتقال پیام از زبان مبدا به شکل زبان مقصد. ترجمه یعنی برگردان یک واژه، مطلب، متن، مفهوم و یا اندیشه از زبانی به شکل زبان دیگر، به گونه ای که حداکثر اصالت محتوای آن موضوع رعایت شود و در عین حال برای خواننده ای که به زبان او برگردانده شده، به بهترین شکل ممکن قابل درک و بهره برداری باشد. نرم افزار مترجم صوتی در مراحل مختلفی این عملیات را انجام می دهد. ابتدا زبان مبدا را به زبان مقصد تبدیل می کند. دراولین قدم این سیستم متن را به لغات و سپس به جملات تقسیم می کند و نقش دستوری یا گرامری کلمات را در جمله بررسی می نماید. این سیستم به دلیل داشتن ساختار زبان مبدا و ساختار زبان مقصد به مقایسه و شناسایی شباهت ها و تفاوت های بین دو زبان و طبقه بندی لغاتی از قبیل ماه ها، مکان ها، جهت ها و... و نیز بررسی نقش معنایی آنها در جملات می پردازد.شناخت این موارد موجب بوجود آمدن برگردانی صحیح از جملات می شود که در این سیستم به خوبی اجرا شده است. مترجم صوتی بجای ترجمه لغت به لغت از مفهوم جملات برای برگردان آن به زبانی دیگر استفاده می کند.
زیرا با ترجمه کلمه به کلمه معنی درستی از گفتار شنیده شده حاصل نمی شود. واضح است که واژه ها بیانگر معانی و مقاصد گوناگونی می باشند. هر واژه ممکن است یک یا چند معنی حقیقی یا مجازی داشته باشد و که در زبان های مختلف از تنوع بسیاری برخوردار است. تشخیص معنی موردنظر گوینده و نیز برگردان صحیح آن از اهمیت بسزایی برخوردار است. پروفسور Narayanan می گوید: در مکالمه نبایستی به ترجمه کلمه به کلمه و کدهای کامپیوتری متکی بود. هدف اصلی در این سیستم برداشت مفهومی از گفت وشنود است تا دو طرف مکالمه از نظرات هم بطور کامل آگاهی یابند، زیرا در هر زبان یک معنی، منظور، مقصود و یا مفهوم را می توان به اشکال گوناگون بیان کرد. توانایی تمیز دادن واژه های هم لف۱ هم آوا، هم نویسه و چند معنایی در مترجم صوتی لحاظ شده است. نام دارو در این سیستم، ترجمه نمی شود زیرا نام تجاری داروها و حتی بعضی از اصطلاحات در پزشکی درهمه زبان ها در دو طرف مکالمه به یک صورت واحد بیان می شود.
۲) زبان گفتاری
زبان گفتاری با زبان نوشتاری متفاوت است. تنوع گوناگون گویش ها و لهجه ها یکی از مسائلی است که می بایست به آن توجه ویژه شود. نوع ادبیات در انواع مختلف مکالمه ها، ملاقات ها، دادگاه ها، گزارش ها، گفت وگوهای پزشکی و از این قبیل موارد، هر یک سبک و سیاق خاص خود را دارد. شرایط خاصی که در مواقع اضطراری بوجود می آید سیستمی را می طلبد که با سرعت زیاد کلام را تشخیص دهد، ترجمه کند و منتقل نماید. تشخیص جملات و کلمات غیررسمی یا به عبارتی خودمانی در طراحی این سیستم لحاظ شده است . حتی در رابطه با مکالمه های تلفنی اورژانسی هم پیش بینی هایی صورت گرفته است. زیرا می بایست در چنین شرایطی پزشک و فرد سخن یکدیگر را بدرستی دریابند تا فرد شرایط بیمار را برای پزشک توصیف کند و پزشک با تشخصی صحیح فرد را به درستی راهنمایی نماید.
۳) ارتباط غیرکلامی
پیام های غیرکلامی سهم خاصی در دامنه ارتباطات انسانی دارند. سخن گفتن آمیخته با عناصر غیرکلامی است، حرکات بدن یکی از وسیله های اصلی برای انتقال پیام در ارتباطات می باشد زیرا انسان ها فقط با سخن گفتن قادر به بیان حالات خود نیستند. ارتباط غیرکلامی هم شنیداری و هم دیداری و نیز شامل حرکات و اشارات ارادی و غیرارادی می باشد. حرکات چهره، تن صدا، سکوت های بین جملات، سرعت بیان جملات و و بطور کلی حالت و آهنگ صدا از موارد ارتباطات غیرکلامی است که دامنه وسیعی در انتقال پیام از فرستنده به گیرنده دارد. این مسائل خود یکی از مشکلات ترجمه ماشینی است. در این مرکز پژوهشی، محققین تحقیقات وسیعی در رابطه با تجزیه و تحلیل و تفسیر جملات انجام می دهند و در صدد پیاده سازی سیستمی هستند که حالات مختلف انسانی در ارتباطات غیرکلامی را کشف کنند. پروفسور Narayanan معتقد است که سیستم ما می بایست سخن بیمار و پزشک را تحلیل و تفسیر نماید.شناسایی سیلاب های مهمل مانند um،uh، ah، er و یا جملات ساده ای که قابل حذف می باشد مانند you know، like wow! hey در پیاده سازی مترجم صوتی از اهمیت به سزای برخوردار است که خود از مشکلات این پروژه است. واضح است که سرعت تصمیم گیری ماشین در این موارد بسیار مهم می باشد. برای این سیستم دفترچه راهنمای فارسی و انگلیسی تعبیه شده است که خواندن آن را به کاربران توصیه می کنند. با وجود پیشرفت های صورت گرفته در زمینه پزشکی هنوز سئوالات بی پاسخ فراوانی در رابطه با چگونگی عملکرد مغز انسان وجود دارد. قدرت فکر و اندیشه در تشخیص جنبه معنایی کلمات و سرعت عمل مغز انسان در پاسخگویی به آن از موارد مهم پژوهشی است که در مراکز تحقیقاتی و دانشگاهی معتبر دنیا با جدیت کار می شود. در آینده شاهد خواهیم بود که فکر و اندیشه به کدهای کامپیوتری تبدیل می شود و تحولی عظیم در علوم مختلف ایجادمی کند. سیستم مترجم صوتی نیز با درک صحیح از اندیشه انسان، کلام را به درستی ترجمه خواهد نمود.
worldit.com
منبع : روزنامه ابرار اقتصادی