|
بازشناسی |
|
مقدمه |
|
فرآیند خودکار استخراج متن از تصویر سند را بازشناسی یا خواندن مینامیم. قسمتی از یک نرمافزار نویسهخوان که وظیفهی تحلیل بلوکهای متنی و بازشناسی متن آنها را به عهده دارد موتور بازشناسی نامیده میشود. هر نویسه خوان، بسته به نوع طراحی ممکن است چندین موتور بازشناسی داشته باشد. در این فصل فرآیند بازشناسی آراکس را مرور میکنیم و تنظیمات قابل تغییر توسط کاربر را که بر کیفیت خروجی این فرآیند تأثیردارند، مورد بررسی قرار میدهیم. |
|
فرمان های خواندن |
|
برای «خواندن» سند جاری کافی است فرمان «بازشناسی -› بازشناسی تصویر جاری» را از منوی اصلی اجرا کنید یا بر روی دکمهی «خواندن» از نوار ابزار اصلی (دکمهی بازشوی سوم از سمت راست) کلیک کنید. |
شکل 86- دکمهی بازشوی خواندن |
|
در صورتی که سند قبلاً ناحیهبندی نشده باشد به صورت خودکار ناحیهبندی میشود. در صورتی که سند قبلاً بازشناسی شده باشد وضعیت آن به حالت بازشناسی نشده برگشت داده میشود و سپس فرآیند بازشناسی آغاز میشود. در حین فرآیند بازشناسی بسیاری از فرمانهای آراکس غیرفعال شده، از دسترس کاربر خارج می شوند و دکمهی «توقف» بر روی نوار ابزار اصلی در دسترس قرار میگیرد تا هر زمان که بخواهید بتوانید با کلیک بر روی این دکمه، فرآیند بازشناسی را متوقف کنید. آراکس پیشرفت فرآیند بازشناسی را به صورتهای مختلف به اطلاع کاربر میرساند. نوار پیشرفت فرآیند بازشناسی بر روی نوار وضعیت آراکس ظاهر میشود. هر خطی از متن که خوانده میشود متمایز میشود (نحوهی تمایز خطوط بازشناسی از طریق «تنظیمات -› رابط کاربر -› رنگبندی و نوع ناحیهها» قابل بدلخواهسازی است، برای این کار از جعبهی بازشوی «نوع ناحیه» عنوان «خطوط متن بازشناسی شده» را انتخاب نموده، نحوهی نمایش را مطابق میل خود بدلخواه کنید). |
شکل 87- آراکس در حین خواندن |
|
با خوانده شدن هر ناحیه شکلک نمایانگر وضعیت آن بروز میشود. در صورتی که بازشناسی آن ناحیه بدون خطا تکمیل شده باشد شکلک «بازشناسی شده» بر روی آن ظاهر میشود. در موارد نادر، مثلا اسناد با درجهتفکیک بسیار کم و نویز زیاد، ممکن است آراکس در خواندن سند دچار مشکل شود که این مسئله با ایجاد شکلک «دارای خطا» روی نمایهی سند، به اطلاع کاربر رسانده میشود. پس از آن که سند بدون خطا بازشناسی شد در نوار وضعیت نمایهی سند، شکلک «خوانده شده» ظاهر میشود. |
شکل 88- نشانگرهای وضعیت خوانده شدن ناحیهها (متنی و جدولی) |
شکل 89- نشانگرهای وضعیت بازشناسی بر روی نوار وضعیت نمایهی سند در مرورگر دسته |
|
در طول فرآیند بازشناسی ممکن است آراکس برخی از ناحیههای متنی را به صورت خودکار به ناحیهی تصویری تبدیل کند. علت این امر آن است که موتور بازشناسی آراکس در این ناحیهها ساختار متنی نیافته و آن را تصویر تشخیص داده است.در صورتی که پس از بازشناسی وضعیت ناحیهها را دستکاری کنید (آنها را جابجا کنید یا خصوصیات آنها را تغییر دهید) شکلک «تغییر کرده» بر روی نمایهی سند در مرورگر دسته ظاهر میشود تا بدانید متن خوانده شده مربوط به وضعیت جاری سند نیست و برای اعمال تغییرات جدید لازم است سند را دوباره «بخوانید». |
شکل 90- نشانگر وضعیت «تغییر کرده» بر روی نوار وضعیت نمایهی سند در مرورگر دسته |
|
معمولاً پس از بازشناسی ممکن است بخواهید ویژگیهای زبان یا قلم برخی از ناحیهها را تغییر دهید و آنها را دوباره بخوانید. در این حالت میتوانید به جای بازشناسی دوبارهی کل سند، فقط ناحیههای تغییر کرده را بازشناسی کنید. برای این کار ناحیههای مورد نظر را انتخاب کنید و از منوی کلیک راست تصویر اصلی، فرمان «خواندن ناحیه» را اجرا کنید. برای بازشناسی دستهای از اسناد، فرمان «بازشناسی -› بازشناسی همه» را از منوی اصلی اجرا کنید یا بر روی دکمهی «خواندن همه» از نوار ابزار اصلی کلیک کنید (دکمهی بازشوی سوم از سمت راست). با اجرای این فرمان، آراکس به طور پیشفرض پنجرهی «انتخابهای خواندن دستهای» را نمایش میدهد. شما با استفاده از این پنجره میتوانید «دستهی بازشناسی» را مطابق میل خود تعیین کنید. در صورتی که گزینهی نمایش این پنجره را غیرفعال کنید آراکس پس از اجرای فرمان «خواندن همه» به طور پیشفرض همهی اسناد موجود در دسته را بدون توجه به وضعیت جاری آنها بازشناسی میکند. برای فعالسازی دوبارهی این پنجره «تنظیمات» را بازکنید، در برگهی «خواندن»، گروه «فرآیند ناحیهبندی خودکار و بازشناسی» آن را دوباره فعال کنید. |
شکل 91 - انتخابهای خواندن دستهای |
|
فرآیند «خواندن همه» یک «پردازش دستهای» است و در حین اجرای آن آراکس به صورت خودکار سند جاری را تغییر میدهد و به کلیکهای کاربر بر روی مرورگر دسته پاسخ نمیدهد. پس از پایان یا توقف فرآیند بازشناسی به صورت دستی، میتوانید وضعیت اسناد را از روی نمایههای آنها در مرورگر دسته بازبینی کنید و تغییرات لازم را اعمال نمایید. |
|
بهینهسازی فرآیند بازشناسی |
|
اسناد مختلف شرایط مختلفی دارند، کیفیت روبش، کیفیت چاپ و کاغذ اسناد، نوع قلم، وضعیت زمینهی متن، میزان پیچیدگی چینش سند و بسیاری پارامترهای گوناگون دیگر باعث میشوند پارامترهای بازشناسیای که برای یک دسته از اسناد نزدیک به ایدهآل عمل کردهاند برای دستهی دیگری از اسناد عملکرد قابل قبولی نداشته باشند. شما میتوانید با تنظیم مناسب پارامترهای بازشناسی روی اسناد مختلف کیفیت بازشناسی را بهبود ببخشید. |
|
دقت بازشناسی |
|
دقت یا اطمینان بازشناسی هر کلمه در آراکس عددی است بین 1 تا 1000 که نشانگر میزان اطمینان محاسبه شده توسط آراکس از تطابق نویسهی استخراج شده با تصویر آن است. هر چه این عدد بالاتر باشد نشانگر دقت بالاتری است. پس از پایان بازشناسی با کلیک بر روی هر کلمه در ویرایشگر متنی آراکس میتوانید عدد دقت آن را در نوار وضعیت آراکس مشاهده کنید. |
شکل 92- دقت بازشناسی کلمهی جاری در ویرایشگر متنی (نوار وضعیت) |
|
همانگونه که در فصل چهارم اشاره شد، آراکس میتواند اسنادی را که دقت بازشناسی متوسط آنها پایینتر از یک آستانهی از پیش تعیین شده است با یک لایهی رنگ قرمز بر روی نمایهی آنها در مرورگر دسته از بقیه متمایز کند.مشاهدهی نمودار پراکندگی دقت یک سند نیز میتواند شما را در تنظیم پارامترهای بازشناسی یاری کند. برای مشاهدهی نمودار پراکندگی دقت بازشناسی یک سند کافی است در مرورگر دسته روی نمایهی آن کلیک راست کرده، فرمان «اطلاعات سند» را اجرا کنید (یا روی شکلک اطلاعات سند بر روی نمایهی سند کلیک کنید). |
شکل 93- نمودار پراکندگی دقت بازشناسی (پنجرهی اطلاعات سند) |
|
محور افقی این نمودار نشانگر دقت کلمات از 0 تا 1000 است و محور قائم آن تعداد کلمات را نشان میدهد. هر نقطه روی نمودار با مختصات x روی محور افقی وy روی محور عمودی بیانگر این معناست که تعداد y کلمهی بازشناسی شده دارای دقت بازشناسی x هستند.نمودار پراکندگی دقت در راستای محور افقی دارای دو نیمه است: نیمهی اول تعداد کلمات حائز دقت بازشناسی از 1 تا 900 و نیمهی دوم تعداد کلمات حائز دقت بازشناسی از 900 تا 1000را پوشش میدهند. علت این تقسیمبندی آن است که برای اسناد عادی فارسی تراکم دقت بازشناسی در فاصلهی 900 تا 1000 بسیار بیشتر از فاصلهی 1 تا 900 است و به همین لحاظ این تقسیمبندی نمودار خواناتری را در اختیار کاربر میگذارد. |
شکل 94- نمودار بازشناسی بالا نشان میدهد تنظیمات سند (زبان، قلم یا ...) اشتباه است. این نمودار نشان دهندهی یک بازشناسی غیرقابل قبول است. |
|
در صورت تمایل میتوانید آراکس را طوری تنظیم کنید که عدد دقت بازشناسی متوسط سند را روی نمودار پراکندگی دقت آن بنویسد. |
شکل 95- دقت بازشناسی متوسط سند در گوشهی بالا، سمت چپ نمودار پراکندگی دقت آن نوشته شده است. |
| این قابلیت را از طریق «تنظیمات -› رابط کاربر -› سایر موارد» فعال کنید. |
شکل 96- فعالسازی نمایش عدد دقت بازشناسی متوسط روی نمودار پراکندگی دقت |
|
نکته 1: غلطیاب املایی آراکس میتواند کلمههایی را که با دقت پایین شناسایی شدهاند دستچین کند تا بتوانید راحتتر آنها را بازبینی کنید. توضیحات کافی در فصل بعد آمده است.نکته 2: دقت کلماتی که توسط ویرایشگر متنی در متن «درج» میشوند (به صورتی که جزء کلمات بازشناسی شده به حساب نیایند) 1000 در نظر گرفته میشود. ویرایش کلمات بازشناسی شده تا زمانی که جزئی تلقی شود یا باعث ادغام آنها در کلمات دیگر نشود تغییری در دقت آنها به وجود نمیآورد. |
|
موازنهی سرعت و دقت |
|
آراکس همچون بسیاری از نرمافزارهایی که هزینهی پردازشی بالا دارند امکاناتی برای تنظیم موازنهی سرعت و دقت در فرآیند بازشناسی دارد. شما امکان انتخاب یکی از گزینههای «بیشترین سرعت»، «موازنهی سرعت و دقت» و «بیشترین دقت» را دارید. گاهی اوقات، بازشناسی یک نمونه سند در حالت «بیشترین سرعت» به شما این اطمینان را میدهد که دستیابی به سرعت بالاتر، کیفیت بازشناسی را چندان پایین نمیآورد و شما میتوانید حجم بالایی از اسناد مشابه را در زمان کمتری بازشناسی کنید. برای تنظیم موازنهی سرعت و دقت پنجرهی «تنظیمات» را باز کنید و در برگهی «کارایی»، گروه بازشناسی، «اولویت کارایی در فرآیند بازشناسی» را مطابق میل خود تنظیم کنید. توجه داشته باشید که رابطهی بین سرعت و دقت در این موازنه معکوس است و برای دستیابی به سرعت بالاتر ناگزیرید از دقت بالا صرف نظر کنید و بالعکس. |
شکل 97- تعیین اولویت کارایی در فرآیند بازشناسی (پنجرهی تنظیمات) |
|
غیر از این پارامتر، شما میتوانید بدون از دست دادن دقت با تعیین قلمهای موجود در اسناد زمان بازشناسی را کاهش دهید. در صورتی که میدانید در اسناد ورودی قلمهای خاصی وجود ندارند میتوانید از طریق «تنظیمات»، برگهی «خواندن»، گروه «قلمهای موجود در اسناد» آنها را غیرفعال کنید تا ضمن حفظ دقت، سرعت بازشناسی را افزایش دهید. همچنان که از این توضیح بر میآید این پارامتر تنها زمانی مؤثر است که نوع قلم ناحیههای سند ورودی «تشخیص خودکار» باشد. |
شکل 98- کاهش بازهی قلمهای موجود در اسناد برای افزایش سرعت خواندن |
|
علاوه بر این میتوانید آراکس را به گونهای تنظیم کنید که ناحیههای جدولی را بازشناسی نکند تا آنها به صورت تصویر در سند نهایی ظاهر شوند. این قابلیت در مواردی که متن جداول اسناد ورودی برایتان اهمیت زیادی ندارند میتواند سرعت فرآیند بازشناسی را افزایش دهد («تنظیمات -› کارایی -› فرآیند ناحیهبندی خودکار و بازشناسی»). |
شکل 99- صرف نظر از بازشناسی جدولها (پنجرهی تنظیمات) |
|
خطوط گرافیکی |
|
حضور خطوط گرافیکی در اسنادی که نوشتههای آنها دارای زیرخط است یا آرایش جدولی دارند و یا با خطوط گرافیکی دیگری از هم جدا شدهاند، در کل باعث کاهش دقت بازشناسی میشود. به عنوان مثال ممکن است بخشی از خطوط عمودی سازندهی جدول به صورت حرف «ا» یا رقم «1» بازشناسی شود. شما میتوانید از طریق پنجرهی «تنظیمات»، برگهی «کارایی»، گروه بازشناسی آراکس را به گونهای پیکربندی کند که این خطوط را (به تفکیک افقی و عمودی) از نویسههای واقعی تمیز داده و آنها را حذف کند. |
شکل 100- قابلیت تشخیص و حذف خطوط گرافیکی ممکن است در بهبود کیفیت بازشناسی مؤثر باشد (پنجرهی تنظیمات) |
|
رویکردهای تحلیل متن |
|
از پارامترهایی که میتواند برای غلبه بر مشکل تفاوت کیفیت اسناد ورودی به شما کمک کند میتوان به «رویکرد تحلیل متن» اشاره کرد. این رویکردها در مواجهه با اسناد مختلف اثرات متفاوتی دارند. به عنوان مثال یک پیکربندی خاص ممکن است کیفیت بازشناسی یک دسته از اسناد را به حالت ایدهآل نزدیک کند، درحالیکه کیفیت بازشناسی دستهی دیگری از اسناد را کاهش دهد و همانگونه که پیشتر اشاره شد فرآیند دستیابی به پارامترهای مناسب برای اسناد مختلف یک فرآیند تجربی است و با آزمایش و خطا میتوان به پارامترهای مناسب دست پیدا کرد.رویکرد تحلیل متن را از طریق «تنظیمات -› کارایی -› بازشناسی -› رویکرد تحلیل متن» تعیین و پارامترهای «حد آستانه» و «همسایگی» آن را تنظیم کنید. مناسبترین رویکرد برای اکثر اسناد، رویکرد استاندارد با حد آستانهی 35 است. |
شکل 101- تعیین رویکرد تحلیل متن (پنجرهی تنظیمات) |
|
کشیده |
|
در تایپ فارسی برای منظم کردن خطوط و حذف فاصلههای خالی آخر آنها، از نویسهی «کشیده» استفاده میشود. نویسهی کشیده که معادلی در الفبای فارسی ندارد یک خط ریز افقی است که میتواند به شکل پیوستهی حروف متصل گردد. مثلاً با اضافه کردن چند کشیده بین حروف «ی» و «ر» در کلمهی «شیر» میتوان آن را به این صورت تایپ کرد: «شیــــــــر».آراکس این قابلیت را دارد که کشیدهها را در حین بازشناسی حذف کند و یا آنها را به صورت کشیده بازشناسی نماید. برای فعال یا غیرفعال کردن این قابلیت گزینهی متناظر را در پنجرهی «تنظیمات»، برگهی «خواندن»، گروه «فرآیند ناحیهبندی خودکار و بازشناسی» فعال یا غیرفعال کنید. |
شکل 102- تنظیم بازشناسی کشیدهها (پنجرهی تنظیمات) |

