110
NUTQNI TANIB OLISHNI OCHIQ MANBALI DASTURLARI TAHLILI
t.f.d., prof. Mamatov Narzullo Solidjonovich,
Jalelov Quwanish Moyatdinovich
“Toshkent irrigatsiya va qishloq xo’jaligini mexanizatsiyalash muhandislari”
Milliy tadqiqot universiteti
kjalelov007@gmail.com
Annotatsiya: Mazkur maqolada ochiq manbali nutqni tanib olish
texnologiyalari
tahlili keltirilib, unda ularning foydalanish imkoniyatlari baholangan
va ushbu tadqiqot doirasidagi tahlillar nutqni aniqlash tizimlarining kelajagini
shakllantirishda ochiq manbali tizimlar ta'siri yoritilgan.
Kalit soʻzlar: TTS
texnologiyasi, nutq sintezi, tizim, model, dasturlash tili,
matn.
Matndan nutqqa yoki nutq sintezi - bu so‘zlarni
taniydigan va inson nutqini
shakllantiradigan matndan sun’iy ravishda yaratilgan inson sifat tovushli nutqdir.
Dastlabki Text-to-Speech tizimi 1968 yilda Yaponiyadagi Elektrotexnika
laboratoriyasida Noriko Umeda va boshqalar tomonidan dunyoga taqdim etilgan. 1961
yilda fizik Jon Larri Kelli va uning hamkasbi Lui Gerstman IBM 704 kompyuteridan
nutqni sintezlash uchun foydalanishdi, bu Bell Laboratoriyalari tarixidagi eng mashhur
voqeadir.
TTS ilovalari yoki Text-to-Speech ilovalari yozma matnni og‘zaki so‘zlarga
aylantirish uchun nutq sintezidan foydalanadigan dasturiy ilovalardir.
TTS ilovalari
ko‘plab afzalliklarga ega [1]. Masalan, TTS ilovalari avtomobil haydash, mashq qilish
yoki vizual e’tiborni talab qiladigan boshqa harakatlar bilan shug‘ullanayotganda yoki
maqolalar, kitoblar va boshqa yozma materiallarni o‘qishda foydalanish mumkin.
Bundan tashqari, TTS ilovalari yangi tilni o‘rganayotgan yoki talaffuzini yaxshilashga
harakat qilayotganlar uchun juda foydali hisoblanadi. Ular matnni bir necha tilda o‘qish
uchun moslashtirilishi mumkin, bu esa til o‘rganuvchilarga nutq qobiliyatlarini mashq
qilishni osonlashtiradi.
Shuningdek, foydalanuvchilar TTS ilovasining tezligini,
ohangini va talaffuzini shaxsiy ehtiyojlariga moslashtirishi mumkin. TTS ilovalari
asosan inson va mashina o'rtasidagi aloqani simulyatsiya
qilishda masalan, dasturlarni
ovozli boshqarishda foydalaniladi. Operatsion tizimlarning katta qismi xususiy
mahsulotlardir, ya'ni foydalanuvchi yoki potentsial ishlab chiquvchi ularning manba
kodiga kirish huquqiga ega emas. Bu nutqni tanib olish
tizimlarini ochiq kodli
loyihalarga integratsiya qilish qobiliyatiga salbiy ta'sir ko’rsatadi. Ochiq manbali
nutqni tanib olish tizimlarini ijobiy va salbiy tomonlarini tavsiflovchi
markazlashtirilgan ma'lumotlar manbai ham mavjud emas.
Natijada, muammoni hal
qilishda nutqni optimal tanib olish tizimini tanlash muammosi yuzaga keladi [2].
Tadqiqotning maqsadi tijorat yoki tadqiqot faoliyati uchun tizimni tanlashda
xarajatlarni kamaytirish uchun ochiq manbali nutqni
tanib olish tizimlaridan
foydalanish bo'yicha hamda matnni nutqga o’tkazishda tavsiyalarni ishlab chiqishdan
iborat.
111
CMU Sphinx, HTK, iAtros, Julius, Kaldi va RWTH ASR tanlangan tizimlar
tanib olishning aniqligi va tezligi, foydalanish qulayligi
va ichki tuzilishi kabi
ko'rsatkichlar bo'yicha taqqoslandi.