جستجو در سایت

راهنمای کاربران - فصل ششم - بازشناسی

بازشناسی

 مقدمه

فرآیند خودکار استخراج متن از تصویر سند را بازشناسی یا خواندن می‏نامیم. قسمتی از یک نرم‏افزار نویسه‏خوان که وظیفه‏ی تحلیل بلوکهای متنی و بازشناسی متن آنها را به عهده دارد موتور بازشناسی نامیده می‏شود. هر نویسه خوان، بسته به نوع طراحی ممکن است چندین موتور بازشناسی داشته باشد. در این فصل فرآیند بازشناسی آراکس را مرور می‏کنیم و تنظیمات قابل تغییر توسط کاربر را که بر کیفیت خروجی این فرآیند تأثیردارند، مورد بررسی قرار می‏دهیم.

فرمان های خواندن

برای «خواندن» سند جاری کافی است فرمان «بازشناسی -› بازشناسی تصویر جاری» را از منوی اصلی اجرا کنید یا بر روی دکمه‏ی «خواندن» از نوار ابزار اصلی (دکمه‏ی بازشوی سوم از سمت راست) کلیک کنید.

  شکل 86- دکمه‌ی بازشوی خواندن

در صورتی که سند قبلاً ناحیه‏بندی نشده باشد به صورت خودکار ناحیه‏بندی می‏شود. در صورتی که سند قبلاً بازشناسی شده باشد وضعیت آن به حالت بازشناسی نشده برگشت داده می‏شود و سپس فرآیند بازشناسی آغاز می‏شود. در حین فرآیند بازشناسی بسیاری از فرمانهای آراکس غیرفعال شده، از دسترس کاربر خارج می شوند و دکمه‏ی «توقف» بر روی نوار ابزار اصلی در دسترس قرار می‏گیرد تا هر زمان که بخواهید بتوانید با کلیک بر روی این دکمه، فرآیند بازشناسی را متوقف کنید. آراکس پیشرفت فرآیند بازشناسی را به صورتهای مختلف به اطلاع کاربر می‏رساند. نوار پیشرفت فرآیند بازشناسی بر روی نوار وضعیت آراکس ظاهر می‏شود. هر خطی از متن که خوانده می‏شود متمایز می‏شود (نحوه‏ی تمایز خطوط بازشناسی از طریق «تنظیمات -› رابط کاربر -› رنگبندی و نوع ناحیه‏ها» قابل بدلخواهسازی است، برای این کار از جعبه‏ی بازشوی «نوع ناحیه» عنوان «خطوط متن بازشناسی شده» را انتخاب نموده، نحوه‏ی نمایش را مطابق میل خود بدلخواه کنید).

  شکل 87- آراکس در حین خواندن

با خوانده شدن هر ناحیه شکلک نمایانگر وضعیت آن بروز می‏شود. در صورتی که بازشناسی آن ناحیه بدون خطا تکمیل شده باشد شکلک «بازشناسی شده» بر روی آن ظاهر می‏شود. در موارد نادر، مثلا اسناد با درجه‏تفکیک بسیار کم و نویز زیاد، ممکن است آراکس در خواندن سند دچار مشکل شود که این مسئله با ایجاد شکلک «دارای خطا» روی نمایه‌ی سند، به اطلاع کاربر رسانده می‏شود. پس از آن که سند بدون خطا بازشناسی شد در نوار وضعیت نمایه‏ی سند، شکلک «خوانده شده» ظاهر می‏شود.

  شکل 88- نشانگرهای وضعیت خوانده شدن ناحیه‌ها (متنی و جدولی)

  شکل 89- نشانگرهای وضعیت بازشناسی بر روی نوار وضعیت نمایه‌ی سند در مرورگر دسته

در طول فرآیند بازشناسی ممکن است آراکس برخی از ناحیه‏های متنی را به صورت خودکار به ناحیه‏ی تصویری تبدیل کند. علت این امر آن است که موتور بازشناسی آراکس در این ناحیه‏ها ساختار متنی نیافته و آن را تصویر تشخیص داده است.در صورتی که پس از بازشناسی وضعیت ناحیه‏ها را دستکاری کنید (آنها را جابجا کنید یا خصوصیات آنها را تغییر دهید) شکلک «تغییر کرده» بر روی نمایه‏ی سند در مرورگر دسته ظاهر می‏شود تا بدانید متن خوانده شده مربوط به وضعیت جاری سند نیست و برای اعمال تغییرات جدید لازم است سند را دوباره «بخوانید».

  شکل 90- نشانگر وضعیت «تغییر کرده» بر روی نوار وضعیت نمایه‌ی سند در مرورگر دسته

معمولاً پس از بازشناسی ممکن است بخواهید ویژگیهای زبان یا قلم برخی از ناحیه‏ها را تغییر دهید و آنها را دوباره بخوانید. در این حالت می‏توانید به جای بازشناسی دوباره‏ی کل سند، فقط ناحیه‏های تغییر کرده را بازشناسی کنید. برای این کار ناحیه‏های مورد نظر را انتخاب کنید و از منوی کلیک راست تصویر اصلی، فرمان «خواندن ناحیه» را اجرا کنید. برای بازشناسی دسته‏ای از اسناد، فرمان «بازشناسی -› بازشناسی همه» را از منوی اصلی اجرا کنید یا بر روی دکمه‏ی «خواندن همه» از نوار ابزار اصلی کلیک کنید (دکمه‏ی بازشوی سوم از سمت راست). با اجرای این فرمان، آراکس به طور پیش‏فرض پنجره‏ی «انتخابهای خواندن دسته‏ای» را نمایش می‏دهد. شما با استفاده از این پنجره می‏توانید «دسته‏ی بازشناسی» را مطابق میل خود تعیین کنید. در صورتی که گزینه‏ی نمایش این پنجره را غیرفعال کنید آراکس پس از اجرای فرمان «خواندن همه» به طور پیش‏فرض همه‏ی اسناد موجود در دسته را بدون توجه به وضعیت جاری آنها بازشناسی می‏کند. برای فعالسازی دوباره‏ی این پنجره «تنظیمات» را بازکنید، در برگه‏ی «خواندن»، گروه «فرآیند ناحیه‏بندی خودکار و بازشناسی» آن را دوباره فعال کنید.

  شکل 91 - انتخابهای خواندن دسته‌ای

فرآیند «خواندن همه» یک «پردازش دسته‏ای» است و در حین اجرای آن آراکس به صورت خودکار سند جاری را تغییر می‏دهد و به کلیکهای کاربر بر روی مرورگر دسته پاسخ نمی‏دهد. پس از پایان یا توقف فرآیند بازشناسی به صورت دستی، می‏توانید وضعیت اسناد را از روی نمایه‏های آنها در مرورگر دسته بازبینی کنید و تغییرات لازم را اعمال نمایید.

بهینه‏سازی فرآیند بازشناسی

اسناد مختلف شرایط مختلفی دارند، کیفیت روبش، کیفیت چاپ و کاغذ اسناد، نوع قلم، وضعیت زمینه‏ی متن، میزان پیچیدگی چینش سند و بسیاری پارامترهای گوناگون دیگر باعث می‏شوند پارامترهای بازشناسی‏ای که برای یک دسته از اسناد نزدیک به ایده‏آل عمل کرده‏اند برای دسته‏ی دیگری از اسناد عملکرد قابل قبولی نداشته باشند. شما می‏توانید با تنظیم مناسب پارامترهای بازشناسی روی اسناد مختلف کیفیت بازشناسی را بهبود ببخشید.

دقت بازشناسی

دقت یا اطمینان بازشناسی هر کلمه در آراکس عددی است بین 1 تا 1000 که نشانگر میزان اطمینان محاسبه شده توسط آراکس از تطابق نویسه‏ی استخراج شده با تصویر آن است. هر چه این عدد بالاتر باشد نشانگر دقت بالاتری است. پس از پایان بازشناسی با کلیک بر روی هر کلمه در ویرایشگر متنی آراکس می‏توانید عدد دقت آن را در نوار وضعیت آراکس مشاهده کنید.

 شکل 92- دقت بازشناسی کلمه‌ی جاری در ویرایشگر متنی (نوار وضعیت)

همانگونه که در فصل چهارم اشاره شد، آراکس می‌تواند اسنادی را که دقت بازشناسی متوسط آنها پایین‌تر از یک آستانه‌ی از پیش تعیین شده است با یک لایه‌ی رنگ قرمز بر روی نمایه‌ی آنها در مرورگر دسته از بقیه متمایز کند.مشاهده‏ی نمودار پراکندگی دقت یک سند نیز می‏تواند شما را در تنظیم پارامترهای بازشناسی یاری کند. برای مشاهده‏ی نمودار پراکندگی دقت بازشناسی یک سند کافی است در مرورگر دسته روی نمایه‏ی آن کلیک راست کرده، فرمان «اطلاعات سند» را اجرا کنید (یا روی شکلک اطلاعات سند بر روی نمایه‏ی سند کلیک کنید).

  شکل 93- نمودار پراکندگی دقت بازشناسی (پنجره‌ی اطلاعات سند)

محور افقی این نمودار نشانگر دقت کلمات از 0 تا 1000 است و محور قائم آن تعداد کلمات را نشان می‏دهد. هر نقطه روی نمودار با مختصات x روی محور افقی وy روی محور عمودی بیانگر این معناست که تعداد y کلمه‏ی بازشناسی شده دارای دقت بازشناسی x هستند.نمودار پراکندگی دقت در راستای محور افقی دارای دو نیمه است: نیمه‏ی اول تعداد کلمات حائز دقت بازشناسی از 1 تا 900 و نیمه‏ی دوم تعداد کلمات حائز دقت بازشناسی از 900 تا 1000را پوشش می‏دهند. علت این تقسیم‏بندی آن است که برای اسناد عادی فارسی تراکم دقت بازشناسی در فاصله‏ی 900 تا 1000 بسیار بیشتر از فاصله‏ی 1 تا 900 است و به همین لحاظ این تقسیم‏بندی نمودار خواناتری را در اختیار کاربر می‏گذارد.

  شکل 94- نمودار بازشناسی بالا نشان می‌دهد تنظیمات سند (زبان، قلم یا ...) اشتباه است. این نمودار نشان دهنده‌ی یک بازشناسی غیرقابل قبول است.

در صورت تمایل می‌توانید آراکس را طوری تنظیم کنید که عدد دقت بازشناسی متوسط سند را روی نمودار پراکندگی دقت آن بنویسد.

  شکل 95- دقت بازشناسی متوسط سند در گوشه‌ی بالا، سمت چپ نمودار پراکندگی دقت آن نوشته شده است.

این قابلیت را از طریق «تنظیمات -› رابط کاربر -› سایر موارد» فعال کنید.

  شکل 96- فعالسازی نمایش عدد دقت بازشناسی متوسط روی نمودار پراکندگی دقت

نکته 1: غلط‏یاب املایی آراکس می‏تواند کلمه‏هایی را که با دقت پایین شناسایی شده‏اند دستچین کند تا بتوانید راحت‏تر آنها را بازبینی کنید. توضیحات کافی در فصل بعد آمده است.نکته 2: دقت کلماتی که توسط ویرایشگر متنی در متن «درج» می‏شوند (به صورتی که جزء کلمات بازشناسی شده به حساب نیایند) 1000 در نظر گرفته می‏شود. ویرایش کلمات بازشناسی شده تا زمانی که جزئی تلقی شود یا باعث ادغام آنها در کلمات دیگر نشود تغییری در دقت آنها به وجود نمی‏آورد.

موازنه‌ی سرعت و دقت

آراکس همچون بسیاری از نرم‏افزارهایی که هزینه‏ی پردازشی بالا دارند امکاناتی برای تنظیم موازنه‏ی سرعت و دقت در فرآیند بازشناسی دارد. شما امکان انتخاب یکی از گزینه‏های         «بیشترین سرعت»، «موازنه‌ی سرعت و دقت» و «بیشترین دقت» را دارید. گاهی اوقات، بازشناسی یک نمونه سند در حالت «بیشترین سرعت» به شما این اطمینان را می‏دهد که دستیابی به سرعت بالاتر، کیفیت بازشناسی را چندان پایین نمی‏آورد و شما می‏توانید حجم بالایی از اسناد مشابه را در زمان کمتری بازشناسی کنید. برای تنظیم موازنه‏ی سرعت و دقت پنجره‏ی «تنظیمات» را باز کنید و در برگه‏ی «کارایی»، گروه بازشناسی،   «اولویت کارایی در فرآیند بازشناسی» را مطابق میل خود تنظیم کنید. توجه داشته باشید که رابطه‏ی بین سرعت و دقت در این موازنه معکوس است و برای دستیابی به سرعت بالاتر ناگزیرید از دقت بالا صرف نظر کنید و بالعکس.

  شکل 97- تعیین اولویت کارایی در فرآیند بازشناسی (پنجره‌ی تنظیمات)

غیر از این پارامتر، شما می‏توانید بدون از دست دادن دقت با تعیین قلمهای موجود در اسناد زمان بازشناسی را کاهش دهید. در صورتی که می‏دانید در اسناد ورودی قلمهای خاصی وجود ندارند می‏توانید از طریق «تنظیمات»، برگه‏ی «خواندن»، گروه «قلمهای موجود در اسناد» آنها را غیرفعال کنید تا ضمن حفظ دقت، سرعت بازشناسی را افزایش دهید. همچنان که از این توضیح بر می‏آید این پارامتر تنها زمانی مؤثر است که نوع قلم ناحیه‏های سند ورودی «تشخیص خودکار» باشد.

  شکل 98- کاهش بازه‌ی قلمهای موجود در اسناد برای افزایش سرعت خواندن

علاوه بر این می‏توانید آراکس را به گونه‏ای تنظیم کنید که ناحیه‏های جدولی را بازشناسی نکند تا آنها به صورت تصویر در سند نهایی ظاهر شوند. این قابلیت در مواردی که متن جداول اسناد ورودی برایتان اهمیت زیادی ندارند می‏تواند سرعت فرآیند بازشناسی را افزایش دهد    («تنظیمات -› کارایی -› فرآیند ناحیه‏بندی خودکار و بازشناسی»).

  شکل 99- صرف نظر از بازشناسی جدولها (پنجره‌ی تنظیمات)

خطوط گرافیکی

حضور خطوط گرافیکی در اسنادی که نوشته‏های آنها دارای زیرخط است یا آرایش جدولی دارند و یا با خطوط گرافیکی دیگری از هم جدا شده‏اند، در کل باعث کاهش دقت بازشناسی می‏شود. به عنوان مثال ممکن است بخشی از خطوط عمودی سازنده‌ی جدول به صورت حرف «ا» یا رقم «1» بازشناسی شود. شما می‏توانید از طریق پنجره‏ی «تنظیمات»، برگه‏ی «کارایی»، گروه بازشناسی آراکس را به گونه‏ای پیکربندی کند که این خطوط را (به تفکیک افقی و عمودی) از نویسه‏های واقعی تمیز داده و آنها را حذف کند.

  شکل 100- قابلیت تشخیص و حذف خطوط گرافیکی ممکن است در بهبود کیفیت بازشناسی مؤثر باشد (پنجره‌ی تنظیمات)

رویکردهای تحلیل متن

از پارامترهایی که می‏تواند برای غلبه بر مشکل تفاوت کیفیت اسناد ورودی به شما کمک کند می‏توان به «رویکرد تحلیل متن» اشاره کرد. این رویکردها در مواجهه با اسناد مختلف اثرات متفاوتی دارند. به عنوان مثال یک پیکربندی خاص ممکن است کیفیت بازشناسی یک دسته از اسناد را به حالت ایده‏آل نزدیک کند، درحالیکه کیفیت بازشناسی دسته‏ی دیگری از اسناد را کاهش دهد و همانگونه که پیش‏تر اشاره شد فرآیند دستیابی به پارامترهای مناسب برای اسناد مختلف یک فرآیند تجربی است و با آزمایش و خطا می‏توان به پارامترهای مناسب دست پیدا کرد.رویکرد تحلیل متن را از طریق «تنظیمات -› کارایی -› بازشناسی -› رویکرد تحلیل متن» تعیین و پارامترهای «حد آستانه» و «همسایگی» آن را تنظیم کنید. مناسبترین رویکرد برای اکثر اسناد، رویکرد استاندارد با حد آستانه‌ی 35 است.

  شکل 101- تعیین رویکرد تحلیل متن (پنجره‌ی تنظیمات)

کشیده

در تایپ فارسی برای منظم کردن خطوط و حذف فاصله‏های خالی آخر آنها، از نویسه‏ی «کشیده» استفاده می‏شود. نویسه‏ی کشیده که معادلی در الفبای فارسی ندارد یک خط ریز افقی است که می‏تواند به شکل پیوسته‏ی حروف متصل گردد. مثلاً با اضافه کردن چند کشیده بین حروف «ی» و «ر» در کلمه‏ی «شیر» می‏توان آن را به این صورت تایپ کرد: «شیــــــــر».آراکس این قابلیت را دارد که کشیده‏ها را در حین بازشناسی حذف کند و یا آنها را به صورت کشیده بازشناسی نماید. برای فعال یا غیرفعال کردن این قابلیت گزینه‏ی متناظر را در پنجره‏ی «تنظیمات»، برگه‏ی «خواندن»، گروه «فرآیند ناحیه‏بندی خودکار و بازشناسی» فعال یا غیرفعال کنید.

  شکل 102- تنظیم بازشناسی کشیده‌ها (پنجره‌ی تنظیمات)

 

برگشت به صفحه ی فهرست