|
Optik belgilarni aniqlash qanday ishlaydi
|
bet | 3/15 | Sana | 20.05.2024 | Hajmi | 1,32 Mb. | | #246844 |
Bog'liq SHAXZOD (induvidual loyiha 2)Optik belgilarni aniqlash qanday ishlaydi
1 – rasm. Optik belgilarni aniqlash (OCR)
Optik belgilarni aniqlash (OCR) hujjatning jismoniy shaklini qayta ishlash uchun skanerdan foydalanadi. Barcha sahifalar nusxalangandan so'ng, OCR dasturi hujjatni ikki rangli yoki oq-qora versiyaga aylantiradi. Skanerlangan tasvir yoki bitmap yorug'lik va qorong'i joylar uchun tahlil qilinadi va qorong'u joylar tan olinishi kerak bo'lgan belgilar sifatida aniqlanadi, yorug'lik joylari esa fon sifatida aniqlanadi. Keyin qorong'u joylar alifbo harflari yoki raqamli raqamlarni topish uchun qayta ishlanadi. Ushbu bosqich odatda bir vaqtning o'zida bitta belgi, so'z yoki matn blokini nishonlashni o'z ichiga oladi. Keyin belgilar ikkita algoritmdan biri yordamida aniqlanadi - naqshni aniqlash yoki xususiyatni aniqlash.
Shaklni aniqlash OCR dasturiga skanerlangan hujjat yoki rasm faylidagi belgilarni solishtirish va tanib olish uchun turli shriftlar va formatlardagi matn misollari berilganda foydalaniladi.
Xususiyatlarni aniqlash OCR skanerlangan hujjatdagi belgilarni tanib olish uchun ma'lum bir harf yoki raqamning xususiyatlariga oid qoidalarni qo'llaganida sodir bo'ladi. Xususiyatlarga belgidagi burchakli chiziqlar, kesishgan chiziqlar yoki egri chiziqlar soni kiradi. Masalan, "A" bosh harfi o'rtada gorizontal chiziq bilan uchrashadigan ikkita diagonal chiziq sifatida saqlanadi. Belgi aniqlanganda, u kompyuter tizimlari keyingi manipulyatsiyalarni bajarish uchun foydalanadigan ASCII kodiga (Axborot almashinuvi uchun Amerika standart kodi) aylantiriladi.
OCR dasturi hujjat tasvirining tuzilishini ham tahlil qiladi. U sahifani matnlar, jadvallar yoki rasmlar bloklari kabi elementlarga ajratadi. Chiziqlar so'zlarga, keyin esa belgilarga bo'linadi. Belgilarni ajratib bo'lgach, dastur ularni naqsh tasvirlari to'plami bilan taqqoslaydi. Barcha mumkin bo'lgan mosliklarni qayta ishlagandan so'ng, dastur sizga tanilgan matnni taqdim etadi.
1.2 Mavjud kutubxonalar
Optik belgilarni aniqlash (OCR) vositalari va kutubxonalari tasvir va hujjatlardan matn olishda hal qiluvchi rol o'ynaydi.
|
| |