سيستم هاي تشخيص هويت (پردازش تصوير)
سيستم هاي تشخيص هويت (پردازش تصوير)
فهرست مطالب:
چكيده 5
مقدمه 6
سيستم هاي تشخيص هويت 7
تشخيص الگو 9
پردازش تصوير 9
كاربرد پردازش تصوير 10
اهداف پردازش تصوير 11
OCR فارسي 13
تاريخچه سيستم ها 13
انواع سيستم هاي OCR 15
بررسي مراحل مختلف تكميل يك سيستم OCR 16
1ـ پيش پردازش 16
1ـ1ـ كاهش نويز 16
2ـ1ـ نرماليزه كردن 17
2ـ قطعه بندي 17
3ـ استخراج ويژگي ها 18
4ـ طبقه بندي و بازشناسي 18
5ـ پس پردازش 18
ويژگي هاي كلي نگارش فارسي 19
شناسايي كلمات فارسي با استفاده از شبكه هاي عصبي مصنوعي 19
ـ روش هاي تقطيع 21
ـ شبكه عصبي 21
ـ سيستم پياده سازي شده در اين روش 23
ـ مراحل پيش پردازش 23
ـ استخراج ويژگي 28
ـ مرحله شناسايي 28
ـ الگوريتم جستجو 29
بازشناسي كلمات دست نويس فارسي با حروف گسسته ( با استفاده از شبكه عصبي سلسله مراتبي ) 29
ـ ساختار شبكه عصبي طراحي شده 31
ـ تهيه بانك اطلاعاتي آموزش و تست 33
بازشناسي كلمات دست نويس فارسي با استفاده از ويژگي هيستوگرام گراديان بهبود يافته 33
مرحله پيش پردازش 33
ـ تكنيك هاي پيش پردازش 34
استخراج ويژگي هيستوگرام گراديان محلي 35
شبكه عصبي RBF 37
الگوريتم ISO CLUS 37
بازشناسي برون خطي كلمات دست نويس فارسي بر مبناي فشرده سازي تصاوير 39
ـ مراحل پيش پردازش 41
ـ بررسي الگوريتم تجزيه وتحليل تطابقي 42
ـ الگوريتم CA 42
ـ الگوريتم FCNN 42
بازشناسي برخط حروف فارسي برپايه مدل ماركوف 43
ـ مدل مخفي ماركوف 44
ـ چارچوب بازشناسي 44
ـ غربال كردن حروف نامزد توسط بخش هاي حروف 45
ـ غربال كردن حروف نامزد توسط اجزاي حروف 45
ـ نمونه بردار 46
ـ استخراج ويژگي 47
چكيده
نرم افزارهاي پردازش متن براي تشخيص وبازيابي الفبا توسط كامپيوتر طراحي مي شوند.براي ساخت وتوسعه چنين نرم افزارهايي نيازمند تحقيقات در زمينه هاي سيستم هاي بيومتريك ،پردازش تصوير، سامانه هاي هوشمند كه بر گرفته از (سيستمهاي خبره ،الگوريتم ژنتيك ومنطق فازي ) مي باشيم .در اين تحقيق ابتدا نگاهي اجمالي به مفاهيم سيستم هاي تشخيص هويت ،پردازش تصوير وانواع سيستم هاي پردازش متن ومراحل مختلف براي تكميل چنين سيستم هاي داريم .سپس با استناد به مقالات مختلف در زمينه پردازش متن كه بيشتر مباحث پيش پردازش را با روشهاي مختلف مورد ارزيابي قرار داده اند .روشهاي بهبود مراحل پيش پردازش را براي توسعه يك سيستم پردازش متن كارامد مورد مطالعه وبررسي قرار مي دهيم .مباحث ذكر شده در اين تحقيق شامل (شناسايي كلمات فارسي با استفاده از شبكه هاي عصبي مصنوعي – بازشناسي كلمات دست نويس فارسي با حروف كسسته با استفاده از شبكه هاي عصبي سلسله مراتبي– بازشناسي كلمات دست نويس فارسي بااستفاده از ويژگي هيستوگرام گراديان بهبود يافته – بازشناسي برون خطي كلمات دستنويس فارسي بر مبناي فشرده سازي تصاوير – بازشناسي برخط حروف فارسي بر پايه مدل ماركوف ) مي باشند.
مقدمه
رايانه تنها يك ابزار است، و ما انسان ها مي بايد شيوة كار كردن را به او بياموزيم، و امكانات كار را هم برايش فراهم آوريم،. يكي از آنها نرم افزارها OCR است كه براي تشخيص و بازيابي الفبا توسط كامپيوتر طراحي مي شوند. OCRسرنام اصطلاحي است كه صورت كامل آن در واژه نامه هاي انگليسي به دو صورت آمده است .
1- Recognition Optical Character
2- Optical Character Reader
در چند دهه گذشته بازشناسي الگوهاي نوشتاري شامل حروف، ارقام و ديگر نمادهاي متداول در اسناد نوشته شده به زبان هاي مختلف، توسط گرو ههاي مختلفي از محققين مورد مطالعه و بررسي قرار گرفته است. نتيجه اين تحقيقات منجر به پيدايش مجموع هاي از رو شهاي سريع و تا حد زيادي مطمئن موسوم بهOCR به منظور وارد نمودن اطلاعات موجود در اسناد، مدارك، كتا بها و ساير مكتوبات تايپي و حتي دست نوشت به داخل رايانه شده است.
تصوير سند غالبا توسط روبشگر و يا دوربين ديجيتال توليد ميشود و شامل تعدادي پيكسل با رنگ هاي مختلف و سطوح روشنايي گوناگون است. از ديد انسان، يك سند ممكن است ارزش اطلاعاتي زيادي داشته باشد، ليكن از ديد رايانه تصوير يك سند با تصوير يك منظره تفاوتي ندارد، چرا كه هر دوي آنها مجموعهاي از پيكسلها هستند. براي اينكه بتوان از اطلاعات نوشتاري تصوير سند استفاده كرد، بايد به نحوي نوشتههاي موجود در سند را بازشناسي كرد. چنين كاري توسط نرمافزارهاي نويسهخوان نوري انجام مي شود. واژه OCR ابتدا تنها در مورد بازشناسي ارقام و حروف چاپي بكار گرفته ميشد. پسوند نوري در اين عبارت در مقابل عبارت مركب مغناطيسي قرار داده شد تا اين روش را از روش قديميتر بازشناسي نويسهها با مركب مغناطيسي،MICR، متمايز كند. با گذشت زمان و پيشرفت قابل توجه در اين زمينه، روشهاي بازشناسي دست نوشته و متون چاپي مطرح شدند كه دامنه كار را به كلمات و عبارات رساندند.
هماكنون OCR را بيشتر براي بازشناسي مستندات چاپي مثل صفحات كتابها، مجلهها و نامههاي چاپي به كار ميبرند. سامانه نويسهخوان مثل يك نفر ماشيننويس، متن سند را ميخواند و آن را به قالب مناسب براي ذخيره در رايانه تبديل ميكند. معمولاً يك روبشگر، تصوير سند را براي OCR فراهم ميكند. سامانه نويسهخوان، اشياء موجود در تصوير سند را كه ارقام، حروف، علائم و كلمات هستند، بازشناسي كرده و رشتهي متناظر با آنها را در قالب مناسب ذخيره ميكند. يك فايل تصويري، حجم زيادي دارد و جستجوي متني در آن ممكن نيست. اين در حالي است كه فايل خروجي سامانه نويسهخوان بسيار كم حجم و قابل جستجو است.
سامانههاي نويسهخوان مثل بسياري از سامانههاي هوشمند ديگر، پيچيدگي زيادي دارد. پردازش تصوير و بازشناسي الگو دو پايه اصلي اين سامانهها هستند.كه در ابتداي تحقيق به بررسي انها پرداختيم. پيچيدگي اين سامانهها براي زبانهاي گوناگون، متفاوت است. به عنوان مثال نوشتن OCR براي زبانهاي لاتين به دليل اينكه حروف آنها به طور مجزا نوشته ميشود آسانتر است از زبانهايي مثل فارسي و عربي كه حروف يك كلمه به يكديگر ميچسبند. اين موضوع به علاوه جمعيت كم كاربران زبان فارسي، سبب شده سامانههاي نويسهخوان قدرتمندي براي زبان فارسي نداشته باشيم. البته در سالهاي اخير تلاشهاي قابل تقديري از سوي برخي شركتهاي فعال در زمينه پردازش تصويرانجام شده كه برخي از آنها منجر به محصولات قابل قبولي شده است.