پروژه شناسای حروف، طراحی سیستم بازشناسی پلاک خودرو OCR

پروژه شناسای حروف، طراحی سیستم بازشناسی پلاک خودرو OCR

طراحی سیستم بازشناسی پلاک خودرو

چکیده

دراين پژوهش روشي براي تشخيص پلاك خودرو فارسي ارائه گرديددر اين روش ابتدا به كمك عملگر سوبل، لبه‌های عمودي تصوير استخراج مي شوداز تحليل هيستوگرام كمك گرفته و سطرهايي كه لبه ­هاي كمتري دارند حذف مي­شوند، سپس به كمك عمليات مورفولوژي محل پلاك استخراج مي­شودپس از استخراج محل پلاك ،كاراكترها جداسازي شده، سپس به كمك روش بیشینه شباهت كاراكترها شناسايي مي­شوند.

سخن آخر

در این پروژه با پیشنهاد اساتید سعی بر آن شد که به صورت پیش فرض از روش (ML) یا بیشینه شباهت برای تشخیص و خواندن کاراکترها استفاده شود.چرا که این روش از بهترین روش‌های موجود و نیز دارای درصد خطای قابل قبول نسبت به سایر روش‌ها بود. البته با تکمیل بخش ارتقاء می‌توان درصد خطا را باز هم کاهش داد که همانطور که گفته شد به علت کمبود وقت از این بخش برای این بسته نرم افزاری در این برهه از زمان چشم پوشی شد.



=================================================================================


  1. بررسی سیستم های بازشناسی حروف و ارقام در قالب 


چندی پس از انتشار مجموعه داده های IFHCDB و Farsi_CENPARMI، مجموعه داده های بسیار بزرگ HODA که شامل ارقام فارسی است، توسط دانشگاه تربیت مدرس ایجاد شده و در اختیار محققان قرار گرفت. این مجموعه شامل، 102352 نمونه عدد فارسی که از 12000 فرم مربوط به آزمون ورودی کاردانی به کارشناسی و کارشناسی ارشد جمع آوری شده است.

مهمترین ویژگی های این مجموعه عبارتند از :

مجموعه داده برخط، فقط شامل ارقام دستنویس فارسی، تصاویر بصورت سیاه و سفید، شامل 102352 رقم، محدوده سنی و تحصیلات نویسندگان آن محدود، توزیع نمونه ها در هر کلاس تقریباً یکسان است (حدود 10000 نمونه در هر کلاس)، مجموعه داده به سه زیر مجموعه آموزش و آزمایش و یک مجموعه دیگر تقسیم شده است.




در این پژوهش به مروری در مورد روشهای طبقه بندی حروف فارسی پرداخته شد و در ادامه به استخراج ویژگی از نویسه های فارسی پرداختیم. به طور اجمالی این ویژگی ها به صورت زیرعبارتند از:

  1. چرخش قلم (ویژگی AMP)
  2. شکل نویسه (ویژگی زرنیکی جهت تقارن و ویژگی سایه حروف)
  3. الگوی تصویری (به کمک الگوی مربعی 3، 5، 7، 9 تایی)

در ادامه جهت آموزش سیستم از طبقه بندهایی نظیر SVM، ML، L.O.O و NN استفاده شد و طبقه بندی به کمک NN دارای جواب مناسب تری است.سپس جهت بهبود نتایج شبیه سازی از روش های مختلف آموزش نظیر CGBP ، CGF و CGD استفاده شد که نتیجه مربوط به طبقه بندی نهایی  دقت 77.35 و 75.1 دست یافتیم .







Search projects

Recent Posts