دانلود رايگان مقالات

سيما فايل دانلود مقاله گزارش كارآموزي پروژه نمونه سوال

سيستم هاي تشخيص هويت (پردازش تصوير)

۴ بازديد

سيستم هاي تشخيص هويت (پردازش تصوير)

سيستم هاي تشخيص هويت (پردازش تصوير)

سيستم هاي تشخيص هويت (پردازش تصوير)

فهرست مطالب:

چكيده                                                                      5

مقدمه                                                                       6

سيستم هاي تشخيص هويت                                             7

تشخيص الگو                                                              9

پردازش تصوير                                                            9

كاربرد پردازش تصوير                                                  10

اهداف پردازش تصوير                                                  11

OCR فارسي                                                             13

تاريخچه سيستم ها                                                       13

انواع سيستم هاي OCR                                                 15

بررسي مراحل مختلف تكميل يك سيستم OCR                     16

1ـ پيش پردازش                                                         16

1ـ1ـ كاهش نويز                                                         16

2ـ1ـ نرماليزه كردن                                                      17

2ـ قطعه بندي                                                            17

3ـ استخراج ويژگي ها                                                  18

4ـ طبقه بندي و بازشناسي                                              18

5ـ پس پردازش                                                          18

ويژگي هاي كلي نگارش فارسي                                       19

شناسايي كلمات فارسي با استفاده از شبكه هاي عصبي مصنوعي   19

ـ روش هاي تقطيع                                                      21

ـ شبكه عصبي                                                            21

ـ سيستم پياده سازي شده در اين روش                               23

ـ مراحل پيش پردازش                                                  23

ـ استخراج ويژگي                                                       28

ـ مرحله شناسايي                                                        28

ـ الگوريتم جستجو                                                       29

بازشناسي كلمات دست نويس فارسي با حروف گسسته ( با استفاده از شبكه عصبي سلسله مراتبي )          29

ـ ساختار شبكه عصبي طراحي شده                                    31

ـ تهيه بانك اطلاعاتي آموزش و تست                                 33

بازشناسي كلمات دست نويس فارسي با استفاده از ويژگي هيستوگرام گراديان بهبود يافته    33

مرحله پيش پردازش                                                     33

ـ تكنيك هاي پيش پردازش                                            34

استخراج ويژگي هيستوگرام گراديان محلي                            35

شبكه عصبي RBF                                                       37

الگوريتم ISO CLUS                                                    37

بازشناسي برون خطي كلمات دست نويس فارسي بر مبناي فشرده سازي تصاوير    39

ـ مراحل پيش پردازش                                                  41

ـ بررسي الگوريتم تجزيه وتحليل تطابقي                              42

ـ الگوريتم CA                                                           42

ـ الگوريتم FCNN                                                       42

بازشناسي برخط حروف فارسي برپايه مدل ماركوف                 43

ـ مدل مخفي ماركوف                                                   44

ـ چارچوب بازشناسي                                                   44

ـ غربال كردن حروف نامزد توسط بخش هاي حروف               45

ـ غربال كردن حروف نامزد توسط اجزاي حروف                    45

ـ نمونه بردار                                                              46

ـ استخراج ويژگي                                                       47

چكيده

نرم افزارهاي پردازش متن براي تشخيص وبازيابي الفبا توسط كامپيوتر طراحي مي شوند.براي ساخت وتوسعه چنين نرم افزارهايي نيازمند تحقيقات در زمينه هاي سيستم هاي بيومتريك ،پردازش تصوير، سامانه هاي هوشمند كه بر گرفته از (سيستمهاي خبره ،الگوريتم ژنتيك ومنطق فازي ) مي باشيم .در اين تحقيق ابتدا نگاهي اجمالي به مفاهيم سيستم هاي تشخيص هويت ،پردازش تصوير وانواع سيستم هاي پردازش متن ومراحل مختلف براي تكميل چنين سيستم هاي داريم .سپس با استناد به مقالات مختلف در زمينه پردازش متن كه بيشتر مباحث پيش پردازش را با روشهاي مختلف مورد ارزيابي قرار داده اند .روشهاي بهبود مراحل پيش پردازش را براي توسعه يك سيستم پردازش متن كارامد مورد مطالعه وبررسي قرار مي دهيم .مباحث ذكر شده در اين تحقيق شامل (شناسايي كلمات فارسي با استفاده از شبكه هاي عصبي مصنوعي – بازشناسي كلمات دست نويس فارسي با حروف كسسته با استفاده از شبكه هاي عصبي سلسله مراتبي– بازشناسي كلمات دست نويس فارسي بااستفاده از ويژگي هيستوگرام گراديان بهبود يافته – بازشناسي برون خطي كلمات دستنويس فارسي بر مبناي فشرده سازي تصاوير – بازشناسي برخط حروف فارسي بر پايه مدل ماركوف ) مي باشند.

مقدمه
رايانه تنها يك ابزار است، و ما انسان ها مي بايد شيوة كار كردن را به او بياموزيم، و امكانات كار را هم برايش فراهم آوريم،. يكي از آنها نرم افزارها OCR است كه براي تشخيص و بازيابي الفبا توسط كامپيوتر طراحي مي شوند. OCRسرنام اصطلاحي است كه صورت كامل آن در واژه نامه هاي انگليسي به دو صورت آمده است .
1- Recognition Optical Character
2- Optical Character Reader
در چند دهه گذشته بازشناسي الگوهاي نوشتاري شامل حروف، ارقام و ديگر نمادهاي متداول در اسناد نوشته شده به زبان هاي مختلف، توسط گرو ههاي مختلفي از محققين مورد مطالعه و بررسي قرار گرفته است. نتيجه اين تحقيقات منجر به پيدايش مجموع هاي از رو شهاي سريع و تا حد زيادي مطمئن موسوم بهOCR به منظور وارد نمودن اطلاعات موجود در اسناد، مدارك، كتا بها و ساير مكتوبات تايپي و حتي دست نوشت به داخل رايانه شده است.
تصوير سند غالبا توسط روبشگر و يا دوربين ديجيتال توليد مي‌شود و شامل تعدادي پيكسل با رنگ هاي مختلف و سطوح روشنايي گوناگون است. از ديد انسان، يك سند ممكن است ارزش اطلاعاتي زيادي داشته باشد، ليكن از ديد رايانه تصوير يك سند با تصوير يك منظره تفاوتي ندارد، چرا كه هر دوي آنها مجموعه‌اي از پيكسل‌ها هستند. براي اينكه بتوان از اطلاعات نوشتاري تصوير سند استفاده كرد، بايد به نحوي نوشته‌هاي موجود در سند را بازشناسي كرد. چنين كاري توسط نرم‌افزارهاي نويسه‌خوان نوري انجام مي شود. واژه OCR ابتدا تنها در مورد بازشناسي ارقام و حروف چاپي بكار گرفته مي‌شد. پسوند نوري در اين عبارت در مقابل عبارت مركب مغناطيسي قرار داده شد تا اين روش را از روش قديمي‌تر بازشناسي نويسه‌ها با مركب مغناطيسي،MICR، متمايز كند. با گذشت زمان و پيشرفت قابل توجه در اين زمينه، روش‌هاي بازشناسي دست نوشته و متون چاپي مطرح شدند كه دامنه كار را به كلمات و عبارات رساندند.
هم‌اكنون OCR را بيشتر براي بازشناسي مستندات چاپي مثل صفحات كتاب‌ها، مجله‌ها و نامه‌هاي چاپي به كار مي‌برند. سامانه نويسه‌خوان مثل يك نفر ماشين‌نويس، متن سند را مي‌خواند و آن را به قالب مناسب براي ذخيره در رايانه تبديل مي‌كند. معمولاً يك روبشگر، تصوير سند را براي OCR فراهم مي‌كند. سامانه نويسه‌خوان، اشياء موجود در تصوير سند را كه ارقام، حروف، علائم و كلمات هستند، بازشناسي كرده و رشته‌ي متناظر با آن‌ها را در قالب مناسب ذخيره مي‌كند. يك فايل تصويري، حجم زيادي دارد و جستجوي متني در آن ممكن نيست. اين در حالي است كه فايل خروجي سامانه نويسه‌خوان بسيار كم حجم و قابل جستجو است.
سامانه‌هاي نويسه‌خوان مثل بسياري از سامانه‌هاي هوشمند ديگر، پيچيدگي زيادي دارد. پردازش تصوير و بازشناسي الگو دو پايه اصلي اين سامانه‌ها هستند.كه در ابتداي تحقيق به بررسي انها پرداختيم. پيچيدگي اين سامانه‌ها براي زبانهاي گوناگون، متفاوت است. به عنوان مثال نوشتن OCR براي زبانهاي لاتين به دليل اينكه حروف آنها به طور مجزا نوشته مي‌شود آسانتر است از زبانهايي مثل فارسي و عربي كه حروف يك كلمه به يكديگر مي‌چسبند. اين موضوع به علاوه جمعيت كم كاربران زبان فارسي، سبب شده سامانه‌هاي نويسه‌خوان قدرتمندي براي زبان فارسي نداشته باشيم. البته در سالهاي اخير تلاشهاي قابل تقديري از سوي برخي شركتهاي فعال در زمينه پردازش تصويرانجام شده كه برخي از آنها منجر به محصولات قابل قبولي شده است.