Kurzweil Computer Products компаниясы OCR-дің сапалы дамуына алгашқы қадам жасап, эріпті танып сэі кестендіре алатындай етіп шыгарды. 1986 жылы Calera Recognition Systems компании сы белгісіз эріптермен жүмыс істей алатын жүйені жасады. Бұл жасанды интеллектпе қамтылган бірінші OCR жүйе болды. Жасаушылар программага эр эріптің он мыңдаға үлгісін енгізді.
Сәйкестендіру жүйесімен жұмыстың маңызды аспектілеріне мыналар жатады:
Сәйкестендіріп танудың дэлдігі - 95%.
Құжатты мәтіндік процессорга сақтаудың дэлдігі (MS Word, MS Excel, Word Pr Word Perfect) - 89%.
Электронды жариялаудың дәлдігі (PDF, HTML) - 87%.
Кестелермен жэне бірнеше бағанды мәтінмен жұмыс - 87%.
Қолданудың қарапайымдылығы - 85%.
Жұмыстың сенімділігі - 82%.
Түпнұсқамен тексерудегі қатені тез табу қолайлылығы - 80%.
Түстермен жұмыс - 63%.
Баска косымшага экспорттау -61%.
Жылдамдығы - 55%.
Көптілді сәйкестендіріп тануы - 25%.
OCR пакеті 2 типке бөлінеді: оқытылатын жэне зияткерлік (интеллектуалдық). Оқытылатын пакетпен жүмыс өте көп уақыт алады, ол OCR жүйесінің алғашк: сатысындагыдай. Ал зияткерлік пакетте, суретті мэтіналгыдан өткіземіз, сосын ОС - жүйесінің программасы арқылы автоматты сэйкестендіреміз. Осы пакет арқылы мі нутына 1200 символды сканерлеп, сэйкестендіріп үлгеруге болады. OCR пакетіме жүмыс нэтижесі оның типіне тэуелсіз жэне реттілігінде өңделген қүжат мэтінд: процессорга арналган болса да, ASCII немесе ANSI форматындагы қүжатты ұсынады. Тагы бір кең зерттелетін мәселе, ол қолжазба мәтінді сәйкестендіріп тану. Қазіргі кезі. жеткен дэлдік қолжазба мэтін үшін төмен. Оган Караганда грамматикалық жэне контекст, ақпараты бар мәтінді танып-білудегі дәлдік жоғарырақ. Мысалы, сәйкестендіріп танып білу үдерісінде мәтіннен жеке символды талдағаннан гөрі сөздіктен жеке бүтін сөзді табу оңайырақ.
Бекіту кезеңі
Тапсырма:
Кез келген инфоматикаға қатысты құжатты сканерлеңдер. Құжатты компьютерде өз бумаларыңа сақтаңдар. Мәтінді программаның көмегімен сәйкестендіріп танытыңдар.
Қорытынды кезең
Бүгін сабақта не білдік?
Не үйрендік?
Бағалау кезеңі
Сабақта тапсырманы орындағанына, меңгерген деңгейіне байланысты бағалаймыз.
Үйге тапсырма
Тақырыпты оқу.
САБАҚ ЖОСПАРЫ «Бекітемін»
Оқу ісінің меңгерушісі «___________» ________2014 ж ___________________
Пән аты: Информатика
Класы: 10 «Б»
Қоғамдық - гуманитарлық бағыт
І. Сабақтын тақырыбы: Мәтіндерді танып алу программасы.Сканерленген мәтіндерді редакциялау. Құжаттарды мәтіндік процессорға экспорттау.
Сабақтың мақсаты:
Жаңа тақырыпты түсіндіру, мэтінді тану үгымдарын қалыптастыру.
Логикалық ойлау қабілеттерін, іскерлік дағдыларын дамыту.
Пәнге деген қызығушылықтарын арттыру. Әдемілікке баулу
Сабақтың көрнекілігі: компьютер, мәтіналғы (сканер), принтер, Fine reader программасы, флипчарт, тапсырма карточкалары.
Сабақтың әдістері: түсіндіру, сүрақ-жауап, көрнекілік қолдану, тэжірибелік эдіс. Сабақтың типі: тэжірибелік элементі бар жаңа тақырыпты түсіндіру сабағы.
Өтілетін орны: информатика сыныбы.
Оқушылар білуі тиіс: Fine Reader программасында жүмыс істеуді, мәтіналғымен жүмыс істеуді, принтермен жүмыс істеуді.
Оқушылар меңгеруі тиіс: OCR (Optical Character Recognition) жүйесімен жұмыс істеуді, мәтінді суреттен бөлуді.
Сабақтың барысы
¥йымдастыру кезеңі Оқушыларды үйымдастырып, түгендеу.
Үй тапсырмасын тексеру кезеңі
Үйге берілген тапсырманың орындалуын тексеру.
Жаңа тақырыпқа кіріспе кезеңі
Теория
Қазіргі кезде нарықта сәйкестендіру жүйелерінің бірнеше түрлері бар, олар әртүрлі іскерлік ортадағы қолданушыға, сондай-ақ әртүрлі платформаға негізделген. Мысалы, FineReaderOnline.ru, ABBYY FineReader, Readiris, Persian Reader, Kirtas Technologies Arabic OCR, CuneiForm және т.б.
Осы программалардың ішіндегі коп колданылатындары - FineReader, CuneiForm.
FineReader - мәтіналғы арқылы алынған суреті бар мэтінді түрлендіретін оптикалык сэйкестендіру жүйесі (OCR). Ресейдің ABBYY Software House компаниясы жасаған. Бұл программа элемнің 186 тілін қолдайды. Оның ішінде 38 тілі орфографиялық тексеру жа- сай алады. Әрі программа арқылы қолжазба түріндегі мэтінді де сәйкестендіре аламыз, дегенмен де әркімнің жазуы әртүрлі болатындықтан біраз қиыншылықтар болады.
Атауы
|
Лицензия
|
ОЖ
|
Ескерту
|
FineReaderOnline.ru
|
Коммерциялық
|
Online
|
Сканерленген көптілді құжатты, фотосуреттерді сэйкестендіре алатын Online OCR жүйесі. Жұмыс нэтижесі ре- дакторланатын (PDF, PDF/A, DOC, RTF, XLS, TXT) форматына конвертгеледі.
|
ABBYY FineReader
|
Коммерциялық жэне жекеменшік
|
Windows; Linux, Mac OS
|
Қандай да бір тілде сэйкестендіру үшін сол тілдің қолдауы керек.
|
Readiris
|
Коммерциялық жэне жекеменшік
|
Windows, Mac OS
|
Бельгиялық фирманыц - I.R.I.S. Group өнімі. Сэйкестендірудің аймақтық пакетін жэне Азия тілдері мен орталық шығыс тілдерін қамтиды.
|
Persian Reader
|
Коммерциялық жэне жекеменшік
|
Windows
|
Парсы тіліне арналған.
|
Kirtas Technologies Arabic OCR
|
Коммерциялық
|
Windows
|
Ағьшшын жэне араб тілдерін оқи алады.
|
CuneiForm
|
BSD
|
Windows (GUI), Linux, Mac OS, FreeBSD (CLI)
|
Мэтінді сақтайтын, кестелерді тани алатын енеркэсіптік, көптілді жүйе.
|
Достарыңызбен бөлісу: |