Tesseract OCR bilan matnni aniqlashni amalga oshirish

Download 1,32 Mb.
bet	8/15
Sana	20.05.2024
Hajmi	1,32 Mb.
	#246844

1 ... 4 5 6 7 8 9 10 11 ... 15

Bog'liq
SHAXZOD (induvidual loyiha 2)

1.5 Bir nechta tillar va shriftlar bilan ishlash
Kop tillilik muammosi

1.4 Tesseract OCR bilan matnni aniqlashni amalga oshirish
Tesseract ochiq kodli matnni aniqlash (OCR) mexanizmi bo‘lib, Apache 2.0 litsenziyasi ostida mavjud. U to'g'ridan-to'g'ri yoki (dasturchilar uchun) tasvirlardan chop etilgan matnni chiqarish uchun API yordamida ishlatilishi mumkin. U turli xil tillarni qo'llab-quvvatlaydi. Tesseract o'rnatilgan GUIga ega emas, lekin 3rdParty sahifasida bir nechta mavjud. Tesseract ko'plab dasturlash tillari va ramkalar bilan mos keladi, ularni bu erda topish mumkin. U katta hujjat ichidagi matnni tanib olish uchun mavjud tartib tahlili bilan ishlatilishi mumkin yoki u bitta matn qatori tasviridan matnni tanib olish uchun tashqi matn detektori bilan birgalikda ishlatilishi mumkin.

2– rasm. Tesseract bilan API yaratish uchun OCR Process Flow

Tesseract 4.00 matn chizig'ini tanuvchi sifatida sozlangan yangi neyron tarmoq quyi tizimini o'z ichiga oladi. U OCRopus-ning Python-ga asoslangan LSTM dasturidan kelib chiqqan, ammo C++ da Tesseract uchun qayta ishlab chiqilgan. Tesseract-dagi neyron tarmoq tizimi TensorFlow-dan oldin paydo bo'lgan, ammo u bilan mos keladi, chunki o'zgaruvchan grafik tavsif tili (VGSL) deb nomlangan tarmoq tavsifi tili mavjud bo'lib, u TensorFlow uchun ham mavjud.

Bitta belgidan iborat tasvirni tanib olish uchun biz odatda konvolyutsion neyron tarmog'idan (CNN) foydalanamiz. Ixtiyoriy uzunlikdagi matn belgilar ketma-ketligidir va bunday muammolar RNN yordamida hal qilinadi va LSTM RNNning mashhur shaklidir.
1.5 Bir nechta tillar va shriftlar bilan ishlash
Optik belgilarni aniqlash (OCR) texnologiyasi tasvirlardan matnli ma'lumotlarni olish qobiliyatini taklif qiluvchi turli sohalarda asosiy toshga aylandi. OCR tizimlarida bir nechta tillar va shriftlarni boshqarish murakkab, ammo muhim jihat bo'lib, bu texnologiyalarning turli lingvistik landshaftlarda qo'llanilishini kengaytiradi.
Ko'p tillilik muammosi:
OCRdagi asosiy muammolardan biri bu ko'plab tillarni o'z ichiga olishdir. Tillar o'ziga xos belgilar, yozuvlar va lingvistik tuzilmalarni namoyish etadi. Muayyan tilga moslashtirilgan an'anaviy OCR tizimlari ko'p tilli kontentga duch kelganda sustlashishi mumkin. Natijada, aniqlik va ishonchlilikni ta'minlaydigan tillar o'rtasida muammosiz o'tishga qodir bo'lgan OCR yechimlariga ehtiyoj tug'iladi.

Download 1,32 Mb.

1 ... 4 5 6 7 8 9 10 11 ... 15

Download 1,32 Mb.