چهارشنبه, ۵ اردیبهشت, ۱۴۰۳ / 24 April, 2024

مجله ویستا

استفاده ار فناوری تشخیص گفتار متداول می‌شود

با بانک خود تماس می‌گیرید. صدای یک نوار را می‌شنوید: « برای اطلاع از میزان پول در حساب کلید ۱، برای تغییر رمز کلید ۲ و ...» شما هم از این که می‌توانید از فناوری روز استفاده کنید خوشحال می‌شوید و اطلاعات مورد نظر را کسب می‌کنید؛ اما آیا می‌دانید که در بعضی کشورهای دیگر برای ارتباطات این چنینی از فشردن دکمه‌های تلفن استفاده نمی‌کنند؟
در این کشورها افراد حتی زحمت چنین کاری را به خود نمی‌دهند بلکه به راحتی منظور خود را می‌گویند و سیستم کار را انجام می‌دهند. در واقع با استفاده از سیستم تشخیص گفتار یا Speech Recognition این اتفاق روی می‌دهد. لابد می‌گویید این موضوع تازه‌ای نیست و مدت‌هاست که این حرف‌ها زده می‌شود. حق با شماست. بیش از یک دهه است که محققان سعی می‌کنند تا صوت را به عنوان یک ورودی رایانه تعریف کنند. حالا به نظر می‌رسد این تحقیقات به نتایج خوبی رسیده‌اند.
طی این سال‌ها تلاش زیادی روی تشخیص گفتار صوت صورت گرفت. اما با توجه به عوامل زیادی که در این الگوریتم موثر هستند، همواره عملیات تشخیص با خطا روبه رو بوده است. تارهای صوتی انسان خصوصیاتی غیر خطی دارند و از طرف دیگر عملیات آنها کاملا در اختیار نیست، بلکه عوامل مختلفی از جنسیت تا حالت عاطفی فرد در آن تاثیرگذار است. در نتیجه تلفظ صوتی می‌تواند به لهجه، طرز تلفظ، طرز گفتار و میزان شمرده بودن آن، درشتی صدا، تودماغی حرف زدن، زیر و بمی صدا، درجه صدا (بلندی) و سرعت ادای کلمات بستگی داشته باشد. علاوه بر اینها از آنجا که معمولا افراد در محیطی صحبت می‌کنند که صداهای محیطی نیز وجود دارد، این مسئله پیچیده‌تر می‌شود به شکلی که تشخیص گفتار حتی از تولید گفتار سخت تر و پیچیده‌تر می‌شود.
دقت یک سیستم تشخیص گفتار بستگی به شرایط تست دارد. در شرایط محیطی و گفتاری خاص یک سیستم بسیار خوب عمل می‌کند اما در شرایط عمومی این دقت کاهش می‌یابد. این شرایط ابعاد گوناگونی دارند که می‌توان به اختصار به بعضی از آنها اشاره کرد.
حجم فرهنگ لغت: به عنوان یک قانون عمومی تشخیص یک کلمه ازمیان یک مجموعه کوچک بسیار ساده است اما وقتی حجم فرهنگ لغت بالا می‌رود میزان خطا افزایش می‌یابد؛ مثلا اگر شما تنها کلمات صفر تا ۹ را ادا کنید و بخواهید یکی از همین ۱۰ کلمه را تشخیص دهید، این کار با دقت خوبی انجام می‌پذیرد اما اگر تعداد کلمات به ۲۰۰، ۵۰۰۰ یا ۱۰۰هزار برسد، میزان خطا افزایش بسیار زیادی خواهد داشت.
مستقل یا وابسته به گوینده: یک سیستم وابسته به گوینده تنها برای یک فرد خاص طراحی شده است اما در یک سیستم مستقل، هر فردی می‌تواند گویندگی را به عهده بگیرد و سیستم باید بتواند تشخیص دهد. مشخص است که یک سیستم مستقل از گوینده بسیار مشکل‌تر است و طبعا میزان خطای آن نیز بیشتر است و بین ۳ تا ۵ برابر میزان خطای سیستم وابسته به گوینده است.
▪ گفتار مجزا، مقطع یا پیوسته: منظور از گفتار مجزا بیان تک کلمه است. گفتار مقطع گفتاری است که جملات کامل اما با سکوت‌های مصنوعی در میان ادای هر دو کلمه بیان می‌شوند. گفتار پیوسته همان شیوه معمولی بیان کلمات است. تشخیص گفتار مجزا و مقطع بسیار ساده‌تر میسر می‌شود چون کلمات بهتر و راحت‌تر تشخیص داده می‌شوند؛ اما در گفتار پیوسته بعضی اصوات حذف می‌شوند یا تغییر پیدا می‌کنند. بنابراین تشخیص این نوع بسیار مشکل‌تر است.
▪ گفتار آماده یا اتفاقی: در صورتی که فرد جملات خود را مطابق متنی از پیش آماده بخواند عملیات تشخیص بسیار ساده‌تر از زمانی است که فرد جملات را فی‌البداهه ادا می‌کند، چون در حالت دوم فرد ممکن است مکث کند، بعضی اصوات نامفهوم را ادا کند و یا حتی بخندد یا سرفه کند.
متوجه شده‌اید که عوامل بسیار متفاوتی در کار تاثیر گذار هستند و لذا الگوریتم‌های پیچیده‌ای هستند. این الگوریتم‌ها را می‌توان در گروه‌های زیر دسته بندی کرد:
▪ مبنی بر الگو: در این گروه از الگوریتم‌ها، گفتار ورودی با الگوهای از پیش ضبط شده مقایسه می‌شوند تا بهترین تطبیق یافت شود. دقت این گروه در ارتباط با الگوهای موجود خوب است، اما به هر حال تعداد الگوها ثابت است و اگر بخواهیم با توجه به شرایط گفته شده برای هر کلمه الگوهای متفاوتی را قرار دهیم، به طور عملی غیر ممکن است.
▪ مبتنی بر دانش و آگاهی: در این الگوریتم‌ها سعی می‌شود مهارت انسان در تشخیص گفتار شبیه سازی شود و در سیستم تعبیه شود. این شیوه اگرچه به نظر بسیار خوب به نظر می‌رسد، اما به دست آوردن این مهارت‌ها و استفاده از آنها در سیستم تشخیص گفتار به راحتی میسر نیست و در واقع این روش غیرعملیاتی به حساب می‌آید.
▪ مبتنی بر آمار: در این روش‌ها، تغییرات در گفتار به صورت آماری مدل می‌شوند و این تغییرات آماری کمک می‌کند تا سیستم تشخیص گفتار امکان یادگیری تدریجی داشته باشد. اما در سیستم‌های جدید تشخیص گفتار با استفاده از شبکه‌های گسترده عصبی و روش‌های مبتنی بر آمار نتایج بسیار دقیق‌تر و بهتری گرفته‌اند. در حال حاضر بسیاری از شرکت‌های مهم مانند IBM و مایکروسافت روی این سیستم‌ها سرمایه گذاری کرده‌اند و به نتایج بسیار خوبی رسیده‌اند. یکی از این سرویس دهندگان تلفن همراه در کشورفرانسه یک پورتال صوتی راه اندازی کرده است و اخبار و نتایج مسابقه‌های ورزشی را از این طریق در اختیار مشترکان خود قرارمی‌دهد. شرکت ماشین سازی هوندا نیز یک سیستم راه نوردی با کمک صوت راه‌اندازی کرده است تا رانندگان بهتر بتوانند خودرو را هدایت کنند. با این پیشرفت‌ها به نظر می‌رسد که در آینده‌ای نه چندان دور فناوری تشخیص گفتار بخشی از زندگی و کار هر روزه ما خواهد شد

چهارشنبه, ۵ اردیبهشت, ۱۴۰۳ / 24 April, 2024

استفاده ار فناوری تشخیص گفتار متداول می‌شود

دریافت دیپلم رسمی آموزش و پرورش به آسانی(حضوری،غیرحضوری)

قیمت صندلی سینمایی تاشو رض کو مدل R-1600C

مرکز واردات و پخش قطعات گیربکس جیلی و لیفان

نمایندگی رسمی فروش کلیه محصولات شرکت صنعتی الکتریک خراسان با …

لباس‌ ۸۴ به‌ تن‌ ICT ایرانی‌ نمی‌رود

در باشگاه میلیاردرهای سرزمین دیجیتال

دو دهه پایانی قرن بیستم میلادی را باید سرآغاز تاریخ دنیای دیجیتال نامید.

روبوبریل

انتقال داده ها بدون استفاده از کابل

نیمه تاریک؛ وجه تیره حرکت به سوی جامعه اطلاعاتی

“ژاک ایلول” فیلسوف فرانسوی (۱۹۶۴) می گوید: “فن آوری ،انسان- خالق خود- را تا حد چرخ دنده ای در خدمت کلان ماشین های جهانی پایین آورده است”.

سقوط با طیب خاطر

بررسی جایگاه ایران در رتبه بندی های جهانی

سازمانهای آینده یا آینده سازمانها

عصر اطلاعات که در پیش رویمان قرار دارد همچون بادهائی هستند که در حال وزیدن می باشند. برخی در برابر آن دیوار می سازند و برخی با آن همسو و هم جهت می شوند

با خبرخوان مفهوم آر اس اس RSS و چگونگی کاربرد آن در وبگردی آشنا شویم

SCAM چیست؟

رویای شیرین الکامپ

پارک فناوری چیست؟

واکنش‌های زنجیره‌ای در شبکه‌های کامپیوتری

آن که گفت آری، آن که گفت نه

تلفنت را روشن می‌کنی و موقعیت خود را روی نقشه می‌بینی...

OCW

حساب بانکی خود را به همراه داشته باشید

درایت در فناوری اطلاعات

به دنیای بلوتوث خوش آمدید

بلوتوث یک رشته خصوصیت بی سیم است که ارتباطات کوتاه برد بین وسایل مجهز به تراشه های کوچک و اختصاصی بلوتوث را تعریف می کند.

فناوری اطلا‌عات ،کلید موفقیت الجزیره

حقوق مساوی در دنیای سایبر

نبینید و نشنوید!

پارازیت‌ها در جریان تبادل اخبار و اطلاعات در رسانه‌ها به‌طور عام و مطبوعات به‌طور خاص، ایجاد معضل می‌کنند.

پر مشغله و کم درآمد

بررسی وضعیت دفاتر خدمات ارتباطی ....

حضور پررنگ در دهکده جهانی به مدد دیپلماسی سایبر

رازهای فوتبال و فناوری

در جست‌وجوی زمان از دست رفته

صنعت کامپیوتر قصد دارد زمان بوت را کاهش دهد

فناوری اطلاعات: توسعۀ سایتهاو نظامهای ارتباطی

ابزارهای رقابت

هم‌سنجی صنعت فناوری اطلاعات از نظر رقابت‌پذیری گزارشی از واحد اطلاعات اکونومیست، جولای ۲۰۰۷

این طرح ناتمام

نگاهی به وضعیت فعلی امضای دیجیتالی در کشور

بیانیه اصول و برنامه عمل رگولاتوری،در دوران گذار

طرح اولیه اصلاح ساختاری فرابخش فاوا ...

فناوری‌های امنیت اطلاعات: با یک دیدگاه طبقه‌بندی

مهم‌ترین مزیت و رسالت شبکه‌های رایانه‌ای، اشتراک منابع سخت‌افزاری و نرم‌افزاری و دستیابی سریع و آسان به اطلاعات است

روش‌های پیش‌ بینی فناوری

چاپ کارت pvc،چاپ کارت پی وی سی،چاپ افست کارت …

نمایندگی کابل سیمند(سیمند کابل)

نمایندگی رسمی فروش کلیه محصولات شرکت صنعتی …

فیلتر تصفیه آب

فرودگاه جدید استانبول کجاست و چه امکاناتی دارد؟

یک ساعت پس از پایان تجمع حامیان حجاب | پایگاه خبری تحلیلی انصاف نیوز

خدا نکند گرانی به یک عادت تبدیل شود

مالیات بر عایدی سرمایه؛ هزینه ناکارآمدی دولت بر دوش مردم

تشویق؛ نه تنبیه/ زنان باحجاب هم دچار استرس و اضطراب شده‌اند

روایت دختران و زنانی که در «طرح نور» بازداشت شدند؛ حرف‌هایشان همانند …

استانداردهای زندگی در مسیر کاهش مستمر/ گزارش اکونومیست | خبرگزاری …

۴٩ درصد از جمعیت ایران بر روی فرونشست و مجاور آن سکونت دارد

ترمز تشدید نارضایتی عمومی که مانند باروت است را بکِشید؛ فردا نگویید …

طرح ترافیک زوج و فرد در پایتخت حذف شد+جزئیات

پاس کروزها را گل کنید

از عجایب دولت رئیسی؛ دیروز وزیر امروز استاندار!

از «گردانِ آزار» و ضد زن رژیم اسرائیل چه می‌دانیم؟

عصبانیت «ایران» از افتادن مسئولیت گشت‌های ارشاد به گردن دولت

حکومت چند بار دست در حفره حجاب کرده و گزید شده اما باز هم تکرار می‌‌کند!

معرفی پرفروش ترین داروها در ایران + اسامی و میزان فروش

اتفاقی عجیب در سیستم قضایی؛ ممنوعیت ارسال اظهارنامه برای مقامات دولتی …

آیا وعده‌های خودرویی وزارت صمت قابلیت اجرایی دارند؟

چرا پروژه بارورسازی ابرها در ایران به بن‌بست‌ خورد؟/ ۸۰۰ هزار مهاجرت …

تورم ضعیف‌ها را نابود می‌کند

پشت پرده جت‌های خصوصی؛ از خرید تا اجاره و هزینه نگهداری/ اجاره یک …

عامل خروج اقتصاد ایران از ریل چه کسی بود؟

صنعت خودرو یک‌ دهه درجا زده است!

مسیرهایی که ایران را دور می‌زنند

فاصله بین محمود احمدی نژاد و صادق محصولی به روایت عباس زاده مشکینی …

دلالی مدرن زیر پوست شهر

برنامه اردوغان برای وابسته‌سازی عراق به ترکیه/ پروژه‌ای که به نفع …