Foydalanilgan adabiyotlar
1.
Emary E. Zawbaa H. Hassanien A. Binary ant lion approaches for feature selection //
Neurocomputing. 2016 vol: 213, рр.54-65.
2.
Jović, A., Brkić, K. & Bogunović, N. A review of feature selection methods with
applications//38th International Convention on Information and Communication Technology,
Electronics and Microelectronics, MIPRO 2015 - Proceedings (2015), pp.1200-1205.
3.
Liu, C., Wang, W., Zhao, Q., Shen, X. & Konan, M. A new feature selection method based
on a validity index of feature subset. Pattern Recognition Letters 92, (2017), рр.1-8.
Namangan Institute of Engineering and Technology
nammti.uz
10.25.2023
Pg.492
MATNLI MA’LUMOTLARNI KLETKALI AVTOMATLAR ASOSIDA TANIB OLISH ALGORITMI
B.B.Umarova
Namangan muhandislik-texnologiya instituti
Annotatsiya. Matnli ma’lumotlarni tanib olish masalasi sunъiy intellekt masalalari 492ptic492
etakchi o’rinlardan birini egallaydi. Matnlarni tanib olish bu komp`yuterning qog’oz hujjatlar, olingan
suratlar, sensorli ekranlar yoki boshqa qurilmalar singari manbalar orqali kiritilgan aniq matnli
ma’lumotni qabul qilish va uni izohlash qobiliyatidir. Matnli ma’lumot joylashgan tasvirdan tanib
olish jarayoni ofline tanib olish deyiladi. Bunda tasvir ko’pincha 492ptic skanerlar orqali kiritiladi.
Harakat dinamikasidan tanib olish esa online tanib olish deyiladi. Bu holda sensorli ekranlardan
foydalaniladi. Quyida asosan ofline tanib olish jarayoni haqida so’z ketadi.
Kalit so’zlar. Matnlarni tanib olish, XADARA loyihasi, Segmentatsiyalash, Belgilarni ajratib
olish, Tanib olish, Belgilar vektori, ZIP kodlar, harfiy ma’lumotlar.
Matnlarni tanib olish tasvirlarga ishlov berish va namunalarni tanib olish sohasida eng faol va
etakchi bo'limlardan biri hisoblanadi. Bu sohada erishilgan yutuqlardan katta hajmli Matnlardan
ma’lumotlarni qidirish, ularga o'zgartirishlar kiritish, o'qilishi va tahrirlanishi oson holatga o'tkazish,
ichida qo'lda yozilgan ma’lumotlar bor hujjatlarni tahrirlash kabi ishlarda unumli foydalanish
mumkin. Matnlarni tanib olish masalasi dunyoning ko'plab tillari uchun biron bir darajada hal
etilgan. Biz o'z ishimizda asosiy eъtiborni o'zbek tilidagi Matnlarni tanib oluvchi tizim yaratish
masalasiga qaratdik.
Matnlarni tanib olish ishi bilan shug'ullanuvchi faol olimlar jamiyati mavjud. Bu sohadagi eng
katta kengashlardan biri bu “Qo'lyozmalarni tanib olish miqyosidagi xalqaro konferentsiya”
(International Conference on Frontiers in Handwriting Recognition (ICFHR)) dir. U juft yillarda
bo'ladi. Yana bir konferentsiya “Hujjatlarni tahlil qilish va tanib olish bo'yicha xalqaro konferentsiya”
toq yillarda bo'lib o'tadi.
Matnlarni tanib olish bo'yicha qilingan ishlardan e’tiborga sazovorlaridan biri 2000 yilda R.
Plamodon va S.N. Srixari tomonidan qilingan [1]. Dunyoda birinchi bo'lib Srixari hamkasblari bilan
birgalikda qo'lda yozilgan manzillarni tanib oluvchi tizimni yaratdi [2]. Bu tizim Matn ma’lumotni
oldin segmentlarga ajratib, raqamlar va harflarni alohida o'qib olar edi. Keyin esa raqamlarni
ma’lumotlar bazasidagi ZIP kodlar bilan, harfiy ma’lumotlarni esa mintaqalar nomi bilan solishtiradi
va eng katta ehtimolikka ega natijalarni qaytaradi.
2014 yilda Germaniyaning Braunsveyg institutida ishlab chiqilgan XADARA loyihasi [3] ham
eъtiborga molikdir. XADARA arab tilidagi qadimiy qo'lyozma matnlar bilan ishlaydigan yarim-
avtomatik dasturlar tizimi. XADARA loyihasi ijrochilari signallarni qayta ishlash, kompyuter ilmlari,
tarix fani hamda tilshunoslik fanlari bo'yicha olimlar jamoasidan tashkil topgan. X XADARA tizimining
tub mohiyati elektronlashtirish va ma’lumot qidirish ishlarini tashkil etish orqali qadimiy manbalar
ustida ishlashni osonlashtiruvchi "uskunalar" tizimidir. Bu tizim nafaqat kutubxonachilar uchun,
balki tarix sohasi vakillari uchu ham nihoyatda foydalidir. Chunki ular bu orqali arab yozuvi tarixi va
xususiyatlarini tahlil etish doirasini kengaytiradilar.
Matnlarni tanib olish masalasini hal qilishda muammo bir necha qismlarga bo'linadi. Bunda
avvalo tasvir sifatini oshirishga katta eъtibor beriladi. Bu jarayon dastlabki ishlov berish deyiladi. Bu
fazada binarizatsiya, ingichkalashtirish va adaptatsiya kabi amallar bajariladi. Keyin segmentatsiya
amalga oshiriladi. Ajratilgan segmentlardan belgilar ajratib olinadi. So'ngra ajratib olingan belgilarga
ko'ra ma’lumotlar bazasidagi etalonlar bilan solishtirish amalga oshiriladi. Bunda neyron to'rlari, K-
|