|
Namangan Institute of Engineering and Technology Pdf ko'rish
|
bet | 533/693 | Sana | 13.05.2024 | Hajmi | 15,56 Mb. | | #228860 |
Bog'liq ТўпламNamangan Institute of Engineering and Technology
nammti.uz
10.25.2023
Pg.493
o'rtacha, yashirin Markov modeli kabi algoritmlardan foydalanish mumkin. Eng katta ehtimollik bilan
o'xshash bo'lgan prototip natija sifatida olinadi. Bu bosqichda lug'at asosida tekshirishni amalga
oshirish maqsadga muvofiqdir. Shu yo'l bilan tizim aniqlik darajasini oshirish mumkin.
Ishdan maqsad o'zbek tilidagi matnli ma’lumotlarni tanib oluvchi tizim yaratish. Ichida o'zbek
tilidagi qo'lyozma matn ma’lumotlar bo'lgan tasvirlardan matnlarni tanib olish algoritmlari va
dasturiy taъminotini ishlab chiqish.
Tuzilayotgan tizimning strukturasi. Tizim quyidagi struktura asosida tuziladi. Dastlab matnni
tanib olish lozim bo'lgan tasvirlar kiritiladi. Kiritilgan tasvirga dastlabki ishlov beriladi va “shovqinlar”
imkon qadar yo'qotiladi. Sifati oshirilgan tasvir segmentlarga bo'linadi va har bir bo'lak alohida tasvir
sifatida saqlanadi. Oq va qora nuqtalar joylashuviga qarab belgilar ajratib olinadi. Ajratib olingan
belgilarga ko'ra ma’lumotlar bazasidagi prototiplar bilan taqqoslanadi. Mos harf topilsa chop etiladi,
aks holda segment kengaytirilib qaytadan belgilar ajratiladi va prototiplar bilan taqqoslanadi. Agar
segmentni kengaytirib bo'lmasa tanib olinmaganlik haqida ma’lumot chiqariladi.
Endi yuqoridagi qadamlarni qisqacha sharhlab o'tamiz.
Tasvirni kiritish odatda optik skanerlash orqali bajariladi. Skanerlash jarayoni orqali original
hujjatning raqamli tasviri olinadi. Tanib olishda odatda transport mexanizmi va yorug'lik
intensivligini kulrang yuzalarga aylantiruvchi sezuvchan moslamadan iborat bo'lgan optik
skanerlardan foydalaniladi.
Dastlabki ishlov berish. Skanerlash jarayoni natijasida olingan tasvir "shovqin"ni maъlum bir
miqdorda o'z ichiga olishi mumkin. Skaner va texnologiyaning yaxshiligiga qarab belgilar
chaplashgan yoki buzilgan bo'lishi mumkin. Bunday nuqsonlarning baъzilari keyinchalik sifatsiz
natijalarni keltirib chiqarishi mumkin. Bu muammolarni binarizatsiya, to'ldirish va siyraklashtirish
amallari yordamida bartaraf etish mumkin.
Binarizatsiya jarayonida kiritilgan tasvir ikkilik tasvirga aylantiriladi. Yaъni fonda turgan
piksellar 0 qiymatni, matn bor deb faraz qilingan piksellar 1 qiymatini oladi. Keyin simvolning ikkilik
tasviri bo'ylab "yurib", avvalo masshtablarni aniqlanadi. To'ldirish jarayonida tasvirda paydo bo'lgan
kichik bo'shliqlar yopiladi. Siyraklashtirishda esa chiziqlar kengliklari kamaytiriladi.
|
| |