سیستم هوشمند فرم خوان فارسی(OCR)

 ۱۳۹۰/۱۰/۳
 تعداد بازدید: ۳۰۹۰

سامانه هوشمند فرم خوان فارسی سیستمی است که قادر به تشخیص ارقام دست نویس با دقت بالاتر از 95% می باشد.

معرفی

همگام با پیشرفت و مکانیزه شده امور مختلف و کنارگذاشتن کاغذ و تبدیل آنها به فایل‌های دیجیتالی نیاز به نرم‌افزارهای هوشمندی که بتواند روند ورود اطلاعات به رایانه را بدون دخالت انسان انجام دهد ضروری به نظر می‌رسد. این سیستم‌ها بر اساس روش‌های هوش مصنوعی عمل می‌کنند. سامانه تولید شده قادر به تشخیص انواع فرم‌های دست نویس که در سیستم قابل تعریف می‌باشند و نیز استخراج اطلاعات عددی از آنها می‌باشد.

این سیستم تصاویر اسکن شده را به عنوان ورودی دریافت نموده و پس از پردازش آن با سرعت بالا، اطلاعات عددی و همچنین گزینه‌های انتخابی موجود بر روی فرم را تشخیص داده و وارد بانک اطلاعاتی می‌نماید نام علمی این عمل را اصطلاحا (Optical Character Recognition-OCR) گویند که از الگوریتم های هوشمند در جهت تبدیل تصویر به متن استفاده می شود. در این سیستم امکان تعریف فرم‌های متعدد از طریق یک سیستم فرم ساز وجود دارد که در آن بر روی تصویر فرم خام اسکن شده محل‌های اعداد و نوع آنها از قبیل روز، ماه، سال، کد ملی و عدد ساده و همچنین محل آیتم‌های انتخابی مانند گزینه‌ها قابل تعریف می‌باشد.

تفاوت قابل ملاحظه‌ی این سامانه با سامانه‌های مشابه از این قرار است که در سامانه‌های موجود محدودیت‌های متعددی برقرار است. از جمله اینکه فرم‌ها بایستی حتما با خودکار یا مدادی با رنگ مشخص پر شود و همچنین بخش‌های مختلف فرم‌ها بایستی با رنگ خاصی مانند قرمز طراحی شود تا ارقام داخل آن قابل تشخیص باشد. علاوه بر این بسیاری از سامانه‌های مشابه نسبت به چرخش یا تغییر اندازه‌ی فرم‌ها حساس می‌باشند حال اینکه در سامانه‌ی معرفی شده این محدودیت‌ها وجود ندارد.

سرعت پردازش در این بسیار بالا است به شکلی که می‌توان فرم‌های بسیار زایدی را با استفاده از دستگاه‌های اسکنر با سرعت بالا وارد سیستم نموده و به سرعت پردازش نماید. این سیستم قابلیت اتصال به بانک‌های اطلاعاتی متعدد از قبیل SQL Server را به منظور ورود اطلاعات خوانده شده به بانک‌اطلاعاتی دارد. ارتباط اجزای فرم با بخش‌های مختلف بانک اطلاعاتی به صورت پویا و انعطاف پذیر در بخش فرم ساز سامانه قابل تعریف می‌باشد.

   مزایا و قابلیت‌های سیستم

 

 

 

1)      تشخیص ارقام دست نویس فارسی با دقت بالای 95 درصد

2)      سرعت پردازش لحظه‌ای (Real-Time)

3)      عدم وابستگی به سایز، ابعاد و شیوه نوشتن

4)      تشخیص و خواندن چک‌مارک‌ها، اشکال و علائم مانند پاسخنامه‌ها و فرم‌های اطلاعات شخصی

5)      امکان تعریف الگوی فرم‌ها با انعطاف‌پذیری بالا

6)      خواندن فرم‌های پر شده با مداد یا خودکار

7)      ذخیره‌سازی بخشی از تصویر فرم به صورت تصویر واقعی به منظور بررسی صحت اطلاعات استخراج شده

8)      سازگاری با انواع اسکنرها

9)      طبقه‌بندی فرم‌های تشخیص داده شده در جدول‌های اطلاعاتی مختلف

10)  امکان تعریف اجزای مرتبط با هم در یک فرم به منظور تایید صحت اطلاعات ثبت شده در فرم

11)  امکان اصلاح دستی اطلاعات استخراج شده از فرم توس کاربر

12)  افزایش قدرت تصمیم و یادگیری سیستم در مرور زمان

13)  امکان تعریف دست خط‌های خاص به مظور افزایش دقت سیستم

14)  عدم حساسیت سیستم به چرخش کاغذ

15)  آستانه‌ی تحمل بالا نسبت به نویزهای ایجاد شده در فرم بالاخص در زمان اسکن تصویر

شركت هوش كاوان فراپرداز توس