|
Mavzu: Nutqli signallarni tahlil qilish algortimlari. Reja
|
bet | 1/7 | Sana | 18.05.2024 | Hajmi | 1,33 Mb. | | #242938 |
Bog'liq Nutqli signallarni tahlil qilish algortimlari;
Mavzu: Nutqli signallarni tahlil qilish algortimlari.
Reja:
1. Zamonaviy nutqni tanish tizimlari
2. Nutqni tanish tizimlarining klassifikasiyasi.
3. Nutq signallarini avtomatik tanish algoritmlari ketma-ketligi.
4. Nutq signalining belgilar tasnifi.
1. Zamonaviy nutqni tanish tizimlari
Nutqni avtomatik tanish masalalari ko’pgina parametrlar asosida xarakterlanadi. Bu parametrlarga nutqni uzatish kanalining xususiyati, lug’at hajmi, nutqning o’zgaruvchanligi, nutq atrofidagi xalaqitlar darajasi, kiruvchi nutqning tipini (ajratilgan/uzluksiz) kiritish mumkin [1].
Ma’lumki, ajratilgan so’zlarni tanib olish uchun diktor so’zlar orasiga qisqa to’xtalishlar qo’yishi kerak. Bu jarayon umumiy nutqning 30% vaqtni egallaydi. Shuning uchun ham nutqni tizimga kiritishni sekinlashtiradi va tabiiylikni pasaytiradi. Uzluksiz nutqda esa bunday qisqa to’xtalishlarni quyish talab qilinmaydi. Tabiiy nutqning bosma matndan yoki sun’iy signallardan farqi shundaki uni sodda tartibda elementlarga (fonemlar, so’z, iboralarga) ajratib bo’lmaydi. Chunki uning aniq bir fizik chegarasi mavjud emas. Ularni faqat tinglovchi ongli ravishda ajratib olishi mumkin. Lekin bu jarayonni texnikaga tushuntirish murakkab ko’p bosqichli jarayondir.
Nutqni tanib olish muammosining murakkabligi, asosan, uning ko’pgina omillarga ta’sir ko’rsatadigan asosiy parametrlarining o’zgaruvchanligi bilan bog’liq. Avvalo, bu nutq shakllanish jarayonining tasodifiy tarkibiy qismi bo’lib, bitta diktor tomonidan aytilgan bir xil so’zning turli tavsiflariga olib keladi. Sezilarli darajada o’zgaruvchanlik turli diktorlarning nutqni hosil qilishdagi shaxsiy farqlari bilan bog’liq. Shuningdek, diktorning jinsi, yosh farqlari, shevalari va so’zlovchining hissiy va jismoniy holati ta’sirini ham qayd etish lozim. Bundan tashqari, akustik jihat, ya’ni mikrofonning almashtirilishi, uning og’izga nisbatan joylashuvi va xonadagi akustik muhit ham sezilarli ta’sir ko’rsatadi.
Lug’at hajmining oshishi tanib olish aniqligini sezilarli darajada pasayishiga olib keladi, chunki lug’at tarkibida talaffuzi jihatidan bir-biriga o’xshash so’zlar guruhi paydo bo’ladi. Bu esa akustik noaniqlikga olib keladi va lug’at hajmining o’sishi bilan eksponensial ravishda oshadi. Lug’atdagi tanib olinadigan so’zlar hajmidan kelib chiqgan holda ularning bir nechta sinflari mavjud. Misol uchun [7] ishda kichik lug’at sifatida o’nlab so’zlardan tashkil topgan lug’at keltirilgan. Kichik hajmdagi tanib olish lug’atidan foydalanadigan ko’plab masalalar va ilovalar mavjud: raqamlar ketma-ketligini tanib olish (telefon raqamlari) [2]; harakatdagi texnik obyektlarni (avtomobil, samolyot va boshqalar) nutq buyruqlari orqali obyektlarni boshqarish tizimi [3], robotlarni masofadan boshqarish tizimi [4, 6], tibbiyot qurilmalarni boshqarish tizimlari [6] va boshqalar. O’rtacha hajmdagi tanib olish lug’ati yuzlab so’zlarni o’z ichiga oladi. Bunday lug’atlar ko’pgina dialogli yoki so’rovlarga javob berish tizimlari uchun yetarlidir [7, 8]. Katta hajmdagi lug’atlar minglab so’zlardan boshlanadi, bunday tanib olish tizimlari cheklangan predmet sohasida, misol uchun avtomatlashtirilgan yordam berish tizimlari, call-markazlarida og’zaki so’rovlarni amalga oshirish, axborot tizimlarida qidiruvlarni tashkil etish yoki diktovka tizimlarida foydalanishi mumkin. Yuz mingdan ortiq so’zlardan iborat lug’at juda katta hajmdagi lug’at deb ataladi va bu deyarli amaliy jihatdan har qanday matn uchun (analitik tillar uchun) stenografik tizimlarni amalga oshirish imkonini beradi [9, 11].
Shunday qilib, zamonaviy nutqni avtomatik tanish tizimlari bajarishi shart bo’lgan eng muhim talablarga quyidagilarni kiritish mumkin: uzluksiz ravishda nutqni kiritish, diktorga bog’liq bo’lmaslik, ko’p sondagi so’zlarni tanish qobilyati va tizimning yuqori tezligi.
Nutqni avtomatik tanish tizimlari kabi murakkab intellektual tizimlarni ko’p mezonli baholash va maqbul modellarni va ularning parametrlarini oqilona tanlash uchun juda muhim vazifadir [10]. Ishlab chiqilayotgan nutqni avtomatik tanish tizimlarining samaradorligini baholash uchun nutqni qayta ishlashning har bir darajasida bir qator mezonlar qo’llaniladi, ular orasida ikkita asosiy mezon ajralmas hisoblanadi bularga: tanib olishning aniqligi va tizimning reaksiya (javob) vaqti.
Ideal avtomatik tizim darhol xatosiz natijalarni berishi kerak. Yaqin yillarda ham kompyuter tizimlari bunday ko’rsatkichga erisha olmaydi, shunday bo’lsada biologik prototip (insonning) unumdorligiga intilish kerak.
|
| |