بررسی روش های استخراج ویژگی در بازشناسی حروف و ارقام فارسی

دسته بندي : کامپیوتر » پردازش صدا و تصویر
بررسی روش های استخراج ویژگی در بازشناسی حروف و ارقام فارسی
تعداد صفحات : 44 با فرمت ورد 
 
شناسایی متون چاپی انگلیسی، به علت جدا بودن حروف، ازمسائل ساده تر این حوزه محسوب میشود. اما در مورد زبان فارسی، به علت پیوستگی حروف (حتی در متون چاپی)،شناسایی متن هنوز به عنوان یک موضوع نسبتاً دشوار مطرح است. عمده تحقیقات مربوط به زبان فارسی را پژوهشهاي داخلی تشکیل میدهند، هرچند پژوهشهاي زبان عربی نیز به اندازه کافی به این موضوع شباهت دارد. دستخطهاي فارسی وعربی داراي اختلافات جزئی هستند. از نقطه نظر بازشناسی،دستخط عربی کمی بیشتر پیچیده است، اما شباهتهاي مابین این دو زبان بر تفاوتهایشان ارجح بوده و از اهمیت بیشتري برخوردار است.
بازشناسی متون دستنویس معمولاً در دو حالت برخط (به طور هم زمان با نگارش متن) و برونخط (پس از نگارش متن)اجرا میشود. بازشناسی در سیستمهاي برخط مبتنی بر حرکت قلم (پویایی و تحرك نوشته) بوده و بر رشتهاي از مختصات نقاط مسیر حرکت قلم در حین نگارش اعمال میگردد. بازشناسی درسیستمهاي برونخط بر تصاویر اسکن شده اسناد اعمال میشودو به عبارت دیگر اطلاعات پس از نوشتن، به کمک مراحل پیشپردازشی تفکیک کننده متن از پس زمینه، از تصاویر اخذ می گردد. پروسه نازك سازي و استخراج اسکلت یکی از ضروريترین عملیات پیشپردازشی است که در بازشناسی برونخط به منظورحذف اثر پهناي قلم اجرا میشود، اما در بازشناسی برخط به دلیل اینکه قلم نگارنده خود داراي پهناي نگارشی یک پیکس است، این عملیات اجرا نمیگردد.
هدف اصلی استخراج ویژگی جایگزینی تصویر یک کاراکتر با یک بردار که با فرمولهای ریاضی یا آماری به دست می آید، تا بتوان بین کاراکتر های دیگر تفاوت قائل شد. روش استخراج ویژگی خوب است که بین کاراکتر های یک گروه بیشترین شباهت  باشد ( کمترین تفاوت ) و بین کاراکتر ها در گروه های متفاوت بیشترین تفاوت را داشته باشد.
 
 

1      مقدمه

2      تبدیل موجک

2.1          مقدمه :

2.2          روش استخراج ویژگی با استفاده از تبدیل موجک مبتنی برا بهبود لبه کیرش :

2.3          تبدیل موجک پیچیده و عملیات استخراج ویژگی :

2.4          روش هندسی استخراج ویژگی :

2.5          بحث و نتیجه گیری :

3      استخراج ویژگی ساختاری کاراکتر دستنویس فارسی با استفاده از عملگر مورفولوژی :

3.1          جداسازی نقطه های حرف :

3.2          نازک سازی :

3.3          اعمال عملگرهای مورفولوژی Hit/Miss :

3.4          نتیجه گیری و مشاهدات :

4      استخراج ویژگی با استفاده از گرادیان تصویر :

4.1          نتایج بدست آمده :

5بازشناسی برون خطی کلمات دستنویس فارسی برمبناي فشرده سازي تصاویرواستخراج ضرایبCA

4.2          بررسی پژوهشهاي پیشین

4.3          روش پیشنهادي

4.4          نتیجه گیري

5بهینه‌سازی پارامترهای موثر در استخراج ویژگی از ارقام دست‌نویس فارسی با استفاده از الگوریتم ژنتیک

4.5          استخراج ویژگی

4.5.1              تصویر کوچک شده

4.5.2              نیمرخ‌های چهارگانه

4.5.3              تصویر مقطع عمودی و افقی

4.5.4              ویژگی‌های دیگر

4.6          الگوریتم ژنتیک

4.6.1              بازنمایی

4.6.2              ارزیابی

4.6.3              ترکیب

4.6.4              جهش

4.6.5              انتخاب برای بقا

4.6.6              سایر تنظیمات

4.6.7              نتایج تجربی

4.7          نتیجه‌گیری و کارهای آینده

5      کاربردهای شبکه عصبی در OCR

5.1          پیشپردازش

5.1.1              بهبود تصویر

5.1.2              اصلاح چرخش

5.1.3              باریکسازی

5.2          بخش بندی

5.3          دستهبندی

5.3.1              بازنمایی الگو و رمزگذاری

5.3.2              رمزگذاری ویژگیهای ساختاری

5.3.3              ساختارهای ترکیبی

5.4          جمعبندی و پیشنهادها

6      الگوریتم ژنتیک(Genetic Algorithm)

7      شبکه عصبی

7.1          معرفی شبکه پرسپترون

8                 OCRچیست؟

8.1          تشخیص نوری نویسه‌ها (Optical Character Recognition)

10   منابع:

دسته بندی: کامپیوتر » پردازش صدا و تصویر

تعداد مشاهده: 5196 مشاهده

فرمت فایل دانلودی:.docx

فرمت فایل اصلی: docx

تعداد صفحات: 44

حجم فایل:357 کیلوبایت

 قیمت: 8,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل