یکشنبه, ۹ اردیبهشت, ۱۴۰۳ / 28 April, 2024
مجله ویستا

هرچه را که بنویسی می‌فهمم


هرچه را که بنویسی می‌فهمم
از تایپ کردن خسته شده‌اید؟ نمی‌توانید مدت زمان زیادی را به نوشتن و دوباره تایپ کردن یک متن طولانی دانشگاهی یا گزارش خبری‌تان اختصاص دهید؟ آیا می‌خواهید صفحات یک کتاب را اسکن کنید تا بتوانید قسمت‌های مورد نیازش را حذف و برخی قسمت‌های دیگر را برای ویرایش و تغییر انتخاب کنید اما وقت ندارید؟ نامه‌ای طولانی نوشته‌اید اما آنقدر بدخط است که فقط خودتان می‌توانید بخوانیدش و مجبورید دوباره تایپ کنید؟ پیشنهاد ما این است که از فناوری نوین و جالب OCR استفاده کنید.
فناوری تشخیص یا ادراک نوری حروف که از آن به عنوان Optical Character Recognition یا اختصاراً OCR نام می‌برند، یکی از انواع نرم‌افزارهای کامپیوتری است که برای ترجمه تصاویر حاوی دست‌نوشته‌ها و یا تایپ‌نوشته‌های غالباً ثبت‌شده توسط اسکنر، به متن و حروف قابل درک و فهم برای کامپیوتر استفاده می‌شود.
این فناوری از تشخیص قالب و الگو، هوش مصنوعی و چشم ماشینی استفاده می‌کند تا متن‌هایی را که به‌صورت پرینت‌شده یا دست‌نوشته بر روی کاغذهای معمولی در اختیار داریم به متن‌های قابل ویرایش توسط نرم‌افزارهای ادیتور متن با کامپیوتر بدل کند.
معمولاً از OCR در مواقعی استفاده می‌شود که فرصت زیادی برای تایپ کردن متون وجود ندارد و شما می‌خواهید به سرعت متنی را که به شکل دست‌نوشته با قلم یا خودکارهای معمولی روی کاغذ نوشته‌اید، اسکن کنید تا بتوانید آن را به شکل‌های مختلف، ویرایش متنی کنید.
یکی دیگر از کاربردهای فناوری تشخیص بصری حروف در زمانی است که شما می‌خواهید متن مقالات، کتاب‌ها یا نوشته‌های از قبل پرینت‌شده‌ای را اسکن و مجدداً ویرایش و ارسال کنید که حجم زیادی دارند و ذخیره‌سازی آنها در قالب فایل‌های تصویری مثل JPEG یا GIF امکانپذیر نیست.
نرم‌افزارهای جدید OCR که غالباً از آنها در گوشی‌های تلفن‌همراه یا کامپیوترهای قابل حمل مجهز به صفحه‌های لمسی و Padهای نوشتار با قلم نوری استفاده می‌شود، امکانی برای تمرین کردن دارند، به این معنی که هر کاربر جدید، در مدت زمانی خاص متونی مشخص‌شده را با دست‌خط خود می‌نویسد و از طریق اسکنر یا Touch Pad به نرم‌افزار ارسال می‌کند تا سنسورهای مصنوعی و نرم‌افزاری بصری، با این دستخط آشنا شوند و بتوانند همواره آن را درک کنند.
مطمئنا ماشین یا کامپیوتر به عنوان یک دستگاه صرف، دارای هوش و ادراک انسانی نیست و نمی‌تواند متن‌هایی را که به‌صورت دست‌خط به او داده می‌شود درک کند؛ ضمن اینکه کامپیوتر، تمامی تصاویر ذخیره‌شده با فرمت‌های تصویری مثل Gif را تنها به عنوان یک تصویر می‌شناسد و هیچ گاه محتویات آن را برای ویرایش درک نمی‌کند. به همین رو نیاز است تا در صورتی که از آن برای تشخیص دستخط انسانی استفاده می‌شود، به مدتی خاص تحت تمرین قرار بگیرد.
نمونه این تمرین برای افزایش هوش مصنوعی کامپیوتر را در مجموعه تازه ارایه‌شده Office ۲۰۰۳ می‌توانیم بیابیم، جایی که در نرم‌افزارهایی مثل Word شما می‌توانید فرمانهای صوتی را برای اجرای دستورها و توابع مختلف به نرم‌افزار بدهید. برای این کار و افزایش بازدهی عملگر فرمان صوتی که بتواند دقیق‌تر و با درصد خطای کمتری کلام شما را متوجه شود، بخشی با عنوان Speech Training وجود دارد که در آن شما متن‌های مشخصی را با صدای خودتان برای نرم‌افزار می‌خوانید و حافظه مجازی نرم‌افزار نیز فرکانس‌ها و بسامد‌های صدای شما را ذخیره می‌کند و هر لغت جدیدی را که شما ادا کنید، بدون مشکل تشخیص می‌دهد.
با این تفاسیر می‌توانیم به طور خلاصه این گونه جمع‌بندی کنیم که OCR برای تبدیل تصاویر محو و مبهم به متن‌های قابل درک و ویرایش مورد استفاده قرار می‌گیرد و اشکال گرافیکی را به کدهای ASCII و Unicode تبدیل می‌کند، به شکلی که فونت، اندازه، استیل، صفحه‌آرایی و تمام مختصات پاراگرافی آنها قابل ویرایش باشد.
● تاریخچه
در سال ۱۹۲۹ برای نخستین بار، گوستاو توشچک از آلمان، امتیازی برای اختراع خود با نام OCR دریافت کرد و از همان زمان، کار طراحی نرم‌افزارهای هوشمند درک متن را آغاز کرد.
اختراع او، یک دستگاه اسکنر نوری بود که یک سری الگوهای متنی آماده را در خود ذخیره می‌کرد و متن‌هایی که دریافت می‌کرد در صورت تطابق کامل و تشابه، بدون کم و کاست با الگوی ابتدایی ذخیره‌شده، درک می‌کرد و به کامپیوتر می‌داد.
ایراد اختراع او این بود که یک نمونه از پیش تهیه‌شده شامل شکل کوچک و بزرگ حروف الفبا در اختیار داشت و در صورتی که متن ارایه‌شده به دستگاه، کوچک‌ترین تفاوتی با الگو و نمونه آماده داشت، قادر به تشخیص نبود. با این حال، این کار سرآغاز ارایه اختراعاتی شد که بعدها به تولید نرم‌افزارهای هوشمند تشخیص متن انجامید. در حال حاضر، این نرم‌افزارها برای درک متون تصویری به زبان‌های مختلف طراحی شده‌اند و نمونه‌های جدید آنها بر روی بسیاری از گوشی‌های تلفن‌همراه نصب شده است.
اساس و پایه کار قلم‌های نوری یا Light penهایی که همراه با برخی گوشی‌های تلفن‌همراه ارایه می‌شوند نیز همین فناوری است. زمانی که شما برای تایپ کردن متن یک پیام کوتاه یا شماره‌گیری کردن، بدون در اختیار داشتن هیچ کیبوردی، تنها به نوشتن معمولی اعداد و حروف با دستخط خاص خودتان مبادرت می‌کنید، یعنی در حال استفاده از ثمرات OCR هستید، آن هم به شکلی که یک صفحه کریستال مایع هوشمند به کمک قلم نوری، امکان درک و ردیابی خطوط به ظاهر بی‌معنی و ترسیم‌شده توسط شما را فراهم می‌کند.
در سال ۱۹۵۰ دومین نمونه نرم‌افزار تشخیص خط بصری کاراکترها توسط دیوید شپارد از سرویس جاسوسی سازمان نیروهای مسلح ایالات متحده طراحی شد. شپارد که متخصص رمزشکنی و باز کردن قفل‌های مخفی اطلاعاتی و متنی بود، با همکاری یک پروفسور ژاپنی، نمونه‌ای از نرم‌افزار نوین OCR را طر احی کرد که نیازی به الگوی ثابت از پیش‌تعیین‌شده نداشت و به راحتی می‌توانست دست‌خط‌‌های افراد مختلف را درک کند.
ویژگی این نرم‌افزار، فهمیدن و درک راحت متن‌هایی بود که بسیار کم‌رنگ و یا توسط مداد نوشته شده بودند و یا بر اثر گذشت زمان، از وضوحشان کاسته شده بود. در آن زمان، به دلیل وجود نداشتن نرم‌افزارهایی مثل Adobe Photoshop که بتوانند وضوح و contrast تصاویر را تنظیم کنند، بالا بردن کیفیت و ترمیم تصاویر قدیمی، تار و محوشده بسیار سخت بود و به آسانی انجام نمی‌گرفت.
همچنین سرویس پستی ایالات متحده، از سال ۱۹۵۶ شروع به استفاده از OCR کرده تا بتواند امور مربوط به ارسال و دریافت نامه‌های خود در سراسر دنیا را ساماندهی کند. با استفاده از فناوری تشخیص بصری متن، ادارات پست سراسر آمریکا به جای وارد کردن دستی یا تایپ اطلاعات مربوط به هر نامه، پاکت‌ها و بسته‌های پستی را اسکن می‌کنند و اطلاعات مورد نیاز نیز به شکل خودکار توسط کامپیوتر فهمیده و ذخیره می‌شود. یاکوب رینبو، نخستین کسی بود که این سیستم را وارد ادارات پست و بانک‌های آمریکایی کرد.
در حال حاضر هرچند نرم‌افزار رسمی و معتبری برای درک متون به زبان‌های آسیای غربی و برخی زبان‌های غیرلاتین‌دیگر وجود ندارد، اما جدیدترین حوزه تحقیق و گسترش نرم‌افزارهای OCR برای تشخیص حروف چسبان و شکسته لاتین به کار گرفته می‌شود.
در حال حاضر برای اکثر زبان‌هایی مانند فرانسوی، ایتالیایی، انگلیسی و آلمانی که از الفبای لاتین استفاده می‌کنند، نرم‌افزار تشخیص بصری کاراکترها وجود دارد و اشکالات رایج در آنها به دلیل وجود تفاوت در املای برخی از کلمات یا تفاوت الفبا نیز حل شده است.
به همین دلیل کارشناسان، به این حوزه روی آورده‌اند که نرم‌افزارها را قادر سازند حروف چسبان، شکسته و خوشنویسی را درک کنند.
گفته می‌شود برخی از شرکت‌های نرم‌افزاری در کشور ما نیز مشغول طراحی نرم‌افزار OCR فارسی هستند با این حال به نظر می‌رسد به دلیل پیچیدگی‌های خاص موجود در نوشتار و الفبای فارسی و تعدد سبک‌های نوشتاری فارسی برای اشخاص مختلف که حروف گوناگون را به اشکال متنوع تحریر می‌کنند، این کار تا مدت‌های زیاد نیاز به تحقیق و مطالعه داشته باشد.
گزارش:سید ایمان ضیابری
منبع : روزنامه فناوران


همچنین مشاهده کنید