Матнни аниқлаш дастурлари. Ушбудастурлар синфининг инглиз
тилидаги номи — OCR (Optical Character Recognition)дир.
OCR-иловалар қоғоз ташувчисида, фотографияларда, сканерланган
тасвирларда, шунингдек PDF-файлларда тақдим этилган ҳужжатларни матнли
ифодаларини олиш имкониятини беради.
Амалда ушбу соҳадаги бозорда ягона лидер
ABBYY FineReader иловасидан иборат.
Матнларни аниқлаш бўйича FineReader
замонавий
версияларининг
имконияти
яхши
тасурот қолдирадиганки, у фойдаланувчига матн
аниқланмаслигига жуда ҳаракат қилиши лозим.
Кўпчилик ҳолатларда FineReader аниқлаган матн амалда қўлда қайта ишлаш
заруратига эга бўлмайди. Бундан ташқари, илова иллюстрацияларни автоматик
аниқлаши ва уларни мос форматга ўзгартириши мумкин.
OCR-иловаларнинг бошқа оммалашганлари ичида Cognitive Technologies
компаниянинг Cuneiform ва I.R.I.S. (PROMT Professional Giant пакетига киради)
компаниянинг Readiris иловаларини эслатиш зарур.
Уларда ўзларининг ютуқлари мавжуд, лекин, шуни айтиш лозимки умумий
синовда FineReader лидерлик қилмоқда.
Автоматик таржима қилиш системалари.Бундай системалар бирор
тилда ёзилган матнни бошқа тилдаги матнга
автоматик ўзгартиришга имконият беради.
Ғарбий компаниялар рус тили учун машинали
таржима
системаларини
яратишга
ошиқмаганликлари учун, бу бозор амалда
PROMT, Socrat ва қатор бошқа каби иловали
компанияларга тегишлидир.
70
Электрон луғатлар.Булар матнни эмас, алоҳида сўзларни таржима
қилади. Кўпинча уни ҳатто тажрибали таржимонлар ҳам фойланадилар, чунки
арзимаган дақиқаларда электрон луғатлар матндан ажралмаган ҳолда сўзнинг
барча маънолари ҳақида тўлиқ маълумот беради.
Электрон луғатларнинг оммалашган намоёндаси, дастлабки версияси
ABBYY Lingvo 11 бўлган ABBYY компаниянинг Lingvo иловасидир.