نسیم دریا

وبلاگ هنری و خبری

نسیم دریا

وبلاگ هنری و خبری

OCR چیست؟

 برای فارسی ما و مشکلات آن
          فرض کنید که ما متنی را روی کاغذ داریم و می ‌خواهیم آن را وارد رایانه کنیم. اولین روشی که به ذهن می ‌رسد این است که متن را به تایپیست بدهیم تا با کامپیوتر تایپ کند. امّا آیا می ‌شود عین همان متن را وارد رایانه بکنیم تا نیازی به تایپ نباشد؟ البته دستگاه « اسکنر » می ‌تواند تصویری از آن متن را وارد رایانه کند، تا اینجا بخشی از مشکل ما حل شده است. امّا رایانه که نه عقلی دارد و نه « زبان » می ‌فهمد، نمی ‌تواند حروف و کلمات را از هم تشخیص دهد. مثلا ً اگر از کامپیوتر بخواهیم به ما بگوید که در متن اسکن ‌شده کلمۀ « علی » چند بار آمده است، بی‌ آنکه شرمنده شود، می ‌گوید نمی ‌توانم تشخیص بدهم! در واقع این « تصویر دیجیتال ‌شده » باید به « تصویر قابل پردازش » تبدیل شود. موضوع اصلی OCR همین است. OCR سرنام اصطلاحی است که صورت کامل آن در واژه ‌نامه ‌های انگلیسی به دو صورت آمده است:
-    Optical Character Recognition
-    Optical Character Reader ادامه مطلب ...