ویژگیهای نویسه خوان آراکس
نویسه خوان آراکس به عنوان کاملترین و قویترین سیستم OCR فارسی دارای ویژگیهای منحصر بفردی است که برخی از آنها در قالب دسته بندی زیر آورده شده است:
|
تحلیل محتوای اسناد و دقت تشخیص تحلیل خودکار محتوای اسناد و دقت بی نظیر نویسه خوان آراکس در استخراج متون تایپ شده فارسی و انگلیسی، آن را به یک محصول برتر تبدیل کرده است. برخی از ویژگیهای این بخش عبارتند از: |
|
حذف خودکار پرخش و لبه های زاید تصویر: نویسه خوان آراکس به صورت خودکار لبه های سیاه تصاویر ورودی و نیز چرخش ناخواسته تصاویر را که معمولاً در فرآیند اسکن کردن پیش می آید، برطرف می کند. آین عمل باعث افزایش دقت تشخیص می گردد. |
|
امکان ویرایش تصاویر: به علت پایین بودن کیفیت اسناد و یا کثیف بودن آنها و نیر تنظیمات نامناسب در فرآیند اسکن، ممکن است تصاویر بدست آمده دارای کیفیت مناسب جهت OCR نباشند. نویسه خوان آراکس به شما امکان می دهد تا اینگونه تصاویر را به صورت دستی ویرایش کنید تا در نتیجه دقت تشخیصOCR افزایش یابد. |
|
دقت تشخیض بالا: در تولید نویسه خوان آراکس از روشهای ابداعی شرکت هدی سیستم که مختص زبان کهن فارسی است، استفاده شده است. این امر باعث شده است دقت تشخیص متون فارسی به طرز شگفت انگیزی افزایش یابد. در عین حال نویسه خوان آراکس قادر است متون تایپ شده انگلیسی را با دقت بسیار زیاد (حدود 100%) بخواند. به عبارت دیگر با داشتن نویسه خوان آراکس، شما از خرید یک سیستم OCR لاتین نیز بی نیاز خواهید شد. جهت مشاهده نمونه اسناد خوانده شده توسط آراکس از پیوند ارزیابی دقت آراکس دیدن نمایید. |
|
تشخیص اتوماتیک زبان: نویسه خوان آراکس قادر است کلمات و عبارات انگلیسی را به صورت خودکار در یک متن قارسی تشخیص داده و آنها را بخواند. از اینرو شما می توانید با خیالی آسوده از نویسه خوان آراکس برای خواندن متون علمی جدید که معمولاً دارای عبارات انگلیسی زیادی هسنتد استفاده کنید. |
|
بده بستان سرعت و دقت: برای اسنادی که از کیفیت مناسب برخوردار بوده و به خوبی اسکن شده اند، می توانید گزینه بیشترین سرعت را انتخاب کنید تا بدون کاهش دقت تشخیص، در زمان کوتاهتری کار خود را به انجام برسانید. |
|
امکان تشخیص متون در تصاویر: در صورتی که متن های مشخصی در درون عکس منظره ها یا عکس اشیا و جود دارد و می خواهید آنها را بخوانید، نویسه خوان آراکس به شما امکان می دهد تا با ایجاد نواحی متنی به صورت دستی این کار را انجام دهید. |
|
امکان ناحیه بندی دستی تصاویر: در صورتیکه به هر دلیلی (مثلاً کثیف بودن بیش از اندازه تصویر سند) ناحیه بندی خودکار به درستی عمل نکند و یا شما مایل به تعییر آن باشید (مثلاً نمی خواهید بخش هایی از تصویر را بخوانید)، می توانید نواحی را به صورت دستی تغییر دهید. |
|
امکان ویرایش متن خوانده شده و تولید خروجی با استاندارد WYSIWYG نویسه خوان آراکس یک ویرایشگر متن مناسب در اختیار شما می گذارد تا بتوانید متون استخراج شده را در صورت نیاز اصلاح کنید. با این امکان نیازی به باز کردن سایر ادیتورها مانند MS-Word ندارید، در عین حال که متن خوانده شده و تصویر آن را باهم می بینید. برخی از ویژگیهای این بخش عبارتند از: |
|
تشخیص فونت متون فارسی: یکی از مهمترین ویژگیهای نویسه خوان آراکس، قدرت آن در تشخیص فونت متون فارسی از روی تصاویر است. هم اکنون نویسه خوان آراکس قادر است 10 فونت مشهور فارسی را شناسایی کند. |
|
تشخیص جداول در متون: نویسه خوان آراکس قادر است جداول را در متون فارسی شناسایی کرده و تک تک سلولهای جدول را بخواند. |
|
تولید ساختار متن خروجی مطابق سند ورودی: نویسه خوان آراکس با استفاده از دو ویژگی فوق و سایر امکانات خود، قادر است ساختار متن خروجی را دقیقاً مانند تصویر ورودی تنظیم نماید. بدیهی است این امکان باعث صرفه جویی زمان شما می شود چرا که نیازی به آرایش خروجی تولید شده توسط آراکس در سایر ادیتورها مانند MS-Word ندارید. |
|
نمایش تصویر عبارت انتخاب شده در ویرایشگر: نویسه خوان آراکس تصویر متنی را که شما هم اکنون مشغول ویرایش آن هستید، به سه طریق (که می توانید از طریق تنظیمات مشخص کنید) برایتان های لایت می کند. لازم نیست بگوییم این امر تا چه اندازه موجب تسریع عملیات ویرایش خواهد شد. |
|
غلط یاب فارسی: در صورتی که کلمه ای در مجموعه لغات پیدا نشود و یا دارای درجه اطمینان پایین باشد، نویسه خوان آراکس آن را به شما نشان می دهد و یک لیست از کلمات برای جایگزینی آن، پیشنهاد می کند. شما می توانید از چندین واژه نامه انگلیسی و فارسی در یک لحظه استفاده کنید. |
|
امکان یافتن و جایگذاری عبارات در ویرایشگر: با استفاده از این امکان می توانید به سرعت تعداد زیادی ویرایش را انجام دهید. |
|
رابط کاربر ما تلاش کرده ایم تا به ساده ترین شکل ممکن، امکانات OCR را در اختیار شما قرار دهیم. بدین ترتیب حتی کاربران مبتدی نیز قادر خواهند بود فرآیند OCR را با دقت و سرعت انجام دهند. برخی از ویژگیهای این بخش عبارتند از: |
|
سادگی و در نتیجه کارایی: برای انجام هر کاری از طریق ماوس و نوار ابزار تنها به یک کلیک نیاز دارید. حتی برای تمام اعمال، کلید های میانبر ساده و استاندارد تعریف شده است تا بدون نیاز به ماوس و با سرعت کار خود را انجام دهید. |
|
مدیریت دسته ای اسناد: نویسه خوان آراکس به شما امکان می دهد عملیات مورد نظر خود را روی یکی، چندتا و یا همه تصاویر انجام دهید. می توانید کارهای انجام شده روی یک دسته را ذخیره کنید و در جلسات بعدی کار روی آن دسته را ادامه دهید. |
|
نمایش وضعیت سند: چنانچه بخواهید بدانید وضعیت سند مورد نظر شما از لحاظ فرآیند OCR چگونه است، کافیست فرمان نمایش وضعیت سند را اجرا کنید. در این صورت علاوه بر مراحل OCR، می توانید پراکندگی درجه تشخیص کلمات را نیز مشاهده نمایید. |
|
پشتیبانی از محیط شبکه (فقط در نگارش سازمانی) در صورتیکه نگارش سازمانی را برای استفاده در اداره، شرکت و یا سازمان خود انتخاب کرده اید، علاوه بر صرفه جویی اقتصادی از امکانات ویژه این نگارش نیز برخوردار خواهید شد که برخی از آنها عبارتند از: |
|
امکان توزیع پردازش ها روی شبکه: هر یک از کامپیوترهای شبکه (client) وظیفه خاصی را در فرآیند OCR برعهده می گیرند و موجب افزایش کلی سرعت پردازش ها می شوند. |
|
امکان گسترش آسان: چنانچه حجم اسناد شما برای OCR زیاد است فقط کافی است کامپیوترهای بیشتری را به شبکه سازمان خود متصل کنید و یکی از مراحل OCR را بر عهده آنها بگذارید. |
|
امکان مدیریت مرکزی بر فرآیند OCR و کنترل کاربران: در نگارش سازمانی شما می توانید بر فرآیند OCR به صورت متمرکز مدیریت کرده و استانداردهای مورد نظر خود را اعمال نمایید. علاوه بر این می توانید بر کاربران سیستم نظارت داشته و نحوه کار آنها را به صورت on-line بررسی نمایید. |
|
راه حل مقرون به صرفه برای سازمانها: چنانچه می خواهید امکانات OCR رار در اختیار افراد زیادی از سازمان خود قرار دهید، ما نگارش سازمانی را با تخفیف مناسب (وابسته به تعداد کاربران همزمان) در اختیار شما می گذاریم. |
با احترام شركت نیما رایانه با ما تماس بگیرید: ۰۹۱۲۲۴۰۷۴۵۵ سعیدی
د یدن دموی برنامه ادامه مطلب را ببینید
ادامه مطلب ocr farsi
او.سی.آر (OCR) یا نویسهخوان نرمافزاری است که به کمک آن میتوان از روی تصویر متن (نسخههای اسکن شده، عکسبرداری شده و مانند آن) به فایل متنی قابل ویرایش یا جستجو (فایل ورد، پی.دی.اف) رسید.
سالهاست که فارسیزبانان انتظار عرضهی یک او.سی.آر سازگار با زبان فارسی را میکشند. بخش دولتی در طول سالهای اخیر تلاش کرد با حمایتهای مالی از شرکتهای فعال در حوزهی فناوری اطلاعات، زمینه را برای عملی کردن این خواسته فراهم آورد، که از این رهگذر جز خبرهای مثبت خبرگزاریها مبنی بر به نتیجه رسیدن این پروژهها چیزی عاید کاربران نهایی نشد و محصولات این پروژهها هیچگاه آمادهی عرضه به بازار نشدند. تنها محصول ایرانی تولید شده در این راستا با نام «خودنگار» که توسط «پژوهشکدهی هوشمند علائم» عرضه شد به لحاظ محدودیتهای فرمت تصاویر ورودی و عدم ارائهی حداقل امکانات مورد نیاز برای یک نرمافزار او.سی.آر نتوانست پاسخگوی نیاز کاربران باشد. برخی از شرکتهای خارجی همانند IRIS و صخر محصولات او.سی.آر فارسی عرضه کردند که کیفیت پایین بازشناسی آنها اغلب، کاربر را وادار به آن میکرد که به اندازهی زمانی که برای تایپ متن باید صرف کند، برای تصحیح خروجی بازشناسی وقت بگذارد.
در این میان، شرکت نيمارايانه با عرضهی محصولات جديد خود مدعی است رؤیای عرضهی یک او.سی.آر تمام عیار برای زبان فارسی را تحقق بخشیده است. «نویسهخوان آراکس» یک او.سی.آر فارسی/انگلیسی است که نگارش حرفهای آن توانایی تشخیص متون فارسی تایپ شده با ده قلم پرکاربرد و متون انگلیسی با پنج قلم مشهور را با دقت بالای ۹۷ درصد داراست (دقت به دست آمده برای اسناد نمونه در سطح کلمه ۹۷ درصد و در سطح نویسه ۹۹ درصد بوده است). قابلیتهای این محصول کاملاً ایرانی -که یک پروسهی زمانی دو ساله صرف تولید آن شده- قابل مقایسه و رقابت با قابلیتهای معروفترین و پرسابقهترین او.سی.آر های جهانی است. این فهرست را برای نمونه از نظر بگذرانید:
- دریافت و بازشناسی متن تصاویر با فرمتهای مختلف (JPG، TIFF، PNG و …)، به صورت تک قاب یا چند قاب، بدون محدودیت در رنگبندی با رزلوشن حداقل ۱۵۰ دی.پی.آی (نسخهی سازمانی این محصول که جهت استفادهی سازمانهای بزرگ طراحی شده از ورودی PDF نیز پشتیبانی میکند)
- مدیریت و بازشناسی دستههای تصویری بزرگ (مثلاً دو یا سه هزار تصویر در هر بار) بدون برخورد به مشکل حافظه، با امکان مرتبسازی دستی یا خودکار و ذخیره و بازیابی این دستهها در حداقل زمان ممکن
- توانایی تشخیص خودکار فونت
- تقیسمبندی خودکار تصویر سند به ناحیههای متنی، تصویری و جدولی (انواع جدولها بدون ادغام یا با ادغامهای پیچیده) با امکان ناحیهبندی دستی
- ارائهی تمامی اطلاعات فنی لازم جهت بررسی دقت نتایج به کمک رابطهای ویژوال کاربرپسند
- ویرایشگر متن با امکانات لازم جهت تطبیق اصل تصویر با متن بازشناسی شده
- غلطیاب املایی فارسی و انگلیسی که امکان غلطیابی املایی و جایگزینی با نزدیکترین پیشنهاد را با فشردن یک دکمه در اختیار میگذارد
- سازگاری کامل با استاندارد یونیکد با ارائهی امکانات لازم جهت تولید خروجیهای سازگار با نرمافزارهای غیریونیکد
- تولید خروجی RTF (با چینش مطابق اصل تصویر بدون استفاده از جعبههای متنی) قابل ویرایش توسط مایکروسافت ورد
- تولید خروجی PDF به صورت «اصل تصویر + متن» که ضمن حفظ اصل تصویر ورودی، آن را قابل جستجو میکند
- ویرایشگر تصویر قوی جهت رفع مشکلات گرافیکی تصاویر ورودی
- راهنمای کامل روش استفاده و پیکربندی نرمافزار
- …
نمای کلی نویسهخوان آراکس
امکانات بصری آراکس امکان سنجش کیفیت بازشناسی را به آسانی در اختیارتان میگذارند
آرایش مدیریت دسته در نویسهخوان آراکس
آرایش ویرایش متن به همراه تصویر کمکی در نویسهخوان آراکس
پیمانهی بهبود تصویر آراکس (تصویر از راهنمای نرمافزار)
نمونه خروجی آراکس برای ورد