За основу евристичного підходу взяті інтуїція і досвід людини: в ньому використовуються принципи перерахування членів класу і загальні властивості. Зазвичай системи, побудовані такими методами, включають набір специфічних процедур, розроблених для конкретних задач розпізнавання. Хоча евристичний підхід відіграє велику роль в розпізнаванні, небагато може бути сказано про загальні принципи синтезу, оскільки розв’язання кожної конкретної задачі потребує використання специфічних прийомів розробки. Це означає, що структура і якість евристичної системи в значній мірі визначається талантом та досвідом роботи тих, хто її розробляє. Найпоширенішими є такі підходи розпізнавання [3].
В більшості випадків зображення одного класу зберігають більш-менш постійні розміри і форми. В цих випадках розпізнавання можна здійснити шляхом порівняння зображень з зразками. Такі зразки називають масками, трафаретами, еталонами.
Найпростіший підхід до розпізнавання образів базується на порівнянні їх з еталонами. В цьому випадку деяка множина образів, по одному з кожного класу образів, знаходиться в пам’яті машини. Вхідний образ, що потрібно розпізнати (невідомого класу) порівнюється з еталоном кожного класу. Класифікація базується на раніше вибраному критерії співставлення подібності. Іншими словами, якщо вхідний образ краще відповідає еталону і-го класу образів, ніж в будь-якому іншому еталоні, то вхідний образ класифікується як належність до і-го класу образів. Такий підхід використаний в більшості випадків для читання друкованих літер і банківських чеків. Недоліком цього підходу, тобто співставлення з еталоном, є те, що важко вибрати еталон, який найбільше підходить з кожного класу образів і встановити необхідний критерій відповідності. Ці труднощі особливо суттєві, коли образи, які належать одному класу, можуть мати значні спотворення. Типовим прикладом цього явища є розпізнавання рукописних літер.
Більш вдосконалений підхід ґрунтується на тому, що замість порівняння вхідного образу з еталоном, класифікація базується на деякій множині відібраних вимірів. Ці відібрані виміри називаються ознаками, і є малочутливими щодо звичайних змін і спотворень. В цьому випадку розпізнавання образу можна розглядати в двох задачах.
Перша задача ґрунтується в визначенні, які вимірювання повинні були б бути зроблені на вхідному образі. Звичайний розв’язок задачі про те, що міряти, є певною мірою суб’єктивний, а також залежать від практичних обставин. На сьогодні дуже мало зроблено в конструюванні загальної теорії вибору вимірювальних ознак.
Друга задача розпізнавання образів базується на класифікації (тобто прийнятті розв’язку, чи належить вхідний образ до того чи іншого класу), що має основу на вимірюваннях відібраних ознак [4].
Одним із перших методів розпізнавання друкованих літер був метод масок. Попередньо центроване зображення літери порівнюється шляхом накладання з масками, трафаретами, виготовленими для всіх літер даного алфавіту. Центрування, тобто перенесення зображення з метою його співставлення з маскою, здійснюється за допомогою фіксації країв знаку, наприклад, верхнього і лівого. Як різновид методу масок можна розглядати метод фрагментів. Аналізуються не всі зображення літери, а тільки деякі “характерні” його ділянки. В залежності від наявності білого або чорного на кожній такій ділянці логічна схема виробляє розв’язок того, яка літера представлена для розпізнавання.
Як бачимо, метод масок і метод фрагментів в їх найпростішому вигляді не застосовується, якщо літера друкується різними шрифтами, або, тим більше, пишеться від руки. Тому були запропоновані гнучкіші методи. Метод проекції полягає в сумуванні (кількості чорного або кількості перетинів вздовж горизонтальних смуг, в яких розміщене зображення літери). Розглядається порядок максимумів і мінімумів цієї суми при переході від смуги до смуги. Аналогічно за допомогою вертикальних смуг аналізується друга проекція тієї ж літери. Отримані дані про чергування максимумів і мінімумів в обох проекціях дозволяють впізнавати літеру незалежно від її розмірів, розташування і деяких змін форми. Цей метод не забезпечує надійного розпізнавання, оскільки існують різні фігури, які дають однакові або дуже близькі проекції, наприклад, косий хрест і контурний ромб з діагоналями, паралельними осям проекції. Крім того, при деформаціях зображення через випадкові спотворення проекції можуть мати значні зміни. Тому аналіз проекцій сам по собі є важкою задачею розпізнавання [5].
Великою популярністю користується метод аналізу штрихових елементів знаку. Він полягає в пошуку вертикальних і горизонтальних відрізків, дуг різної орієнтації, а також в вимірюванні їх довжин і в аналізі взаємного розташування. Цей метод, за задумом авторів, повинен забезпечувати розпізнавання літер різних шрифтів.
пʼятниця, 23 січня 2009 р.
Підписатися на:
Дописати коментарі (Atom)
Немає коментарів:
Дописати коментар