Nutq signalining belgilar tasnifi




Download 1,33 Mb.
bet4/7
Sana18.05.2024
Hajmi1,33 Mb.
#242938
1   2   3   4   5   6   7
Bog'liq
Nutqli signallarni tahlil qilish algortimlari;

4. Nutq signalining belgilar tasnifi

Nutqni tanish tizimlarini ishlab chiqishda dasturchilar oldiga, birinchi navbatda duch keladigan muhim masala bu nutq signalini parametrik ifodalash uchun optimal usulni ishlab chiqish sanaladi. Ushbu usul, tovushlarni va nutq so’zlarini juda yaxshi ajratishga imkon beradi va shu bilan birga diktorlarning talaffuz xususiyatlariga va akustik muhitning o’zgarishiga invariantligini ta’minlaydi. Amaliyotdan ma’lumki, so’zni tanib olishda hosil bo’ladigan ko’pchilik xatolar signal balandligining o’zgarishi tufayli yuzaga keladi, bu esa mikrofonning noto’g’ri o’rnatilganligi yoki talaffuzning balandligining o’zgarishi tufayli yuzaga keladi. Xatolarni paydo bo’lishining yana bir keng tarqalgan sababi spektr shaklining tasodifiy nochiziqli deformasiyalaridir, ular shu diktorning nutq signalida doimo mavjud bo’ladi. Shuning uchun, samarali nutqni tanib olish tizimlarini yaratishda eng muhim vazifalardan biri tahlil qilinayotgan signalning mazmuniga yetarli darajada adekvat va shu bilan birga diktorlarning ovozlariga va turli akustik muhitlarga invariant vakilini tanlashdan iborat.


Odatda belgilar tizimiga quyidagi talablar quyiladi:

  • informativlik, ya’ni belgilar majmui nutqning tanib olinadigan elementlarini ishonchli identifikasiyalashni ta’minlashi kerak;

  • hajmni minimallashtirish [16, 17], ya’ni ovoz signalini maksimal darajada siqish va parametrlarning statistik korrelasiyalanmaganligi;

  • diktorga bog’liq bo’lmaslik, ya’ni diktorning shaxsiy xususiyatlari bilan bog’liq ma’lumotlarni belgilar vektoridan maksimal tarzda o’chirib tashlash;

  • bir xillik, ya’ni parametrlar o’rtacha bir xil dispersiyaga ega bo’lishi kerak;

  • belgilar to’plamlari o’rtasidagi yaqinlikni aniqlash uchun oddiy metrikadan foydalanish imkoniyati.

Barcha talablarni bir vaqtning o’zida bajarish har doim ham mumkin emas, chunki talablarning o’zi bir-biriga ziddir: bir tomondan, nutq elementlarining parametrik tavsifi ularni ishonchli ajratish uchun yetarli darajada batafsil bo’lishi kerak, boshqa tomondan esa iloji boricha ixcham.
Amaliyotda mikrofondan olingan nutq signali 8-22 kGs diskretlash chastotasida raqamlashtiriladi. Ketma-ket raqamli qiymatlar 10-30 ms davomiylikdagi nutq fragmentiga (freymga) ajratiladi, bunday davomiylik nutqning kvazistasionar qismlariga to’g’ri keladi. Har bir freymdan belgilar vektori hisoblab chiqiladi, bu vektorlar keyinchalik nutqni tanib olishning akustik darajasida qo’llaniladi. Hozirda signallarni parametrik taqdim etishning avtokorrelyasion tahlil, apparatli chiziqli filtrasiya, spektral tahlil, LPC ga asoslangan keng miqyosdagi usullari mavjuddir [14, 15].
Nutqni parametrlashtirishda eng keng tarqalgan yondashuv signal fragmentlarini spektral tahlil qilish hamda ularning kepstral xususiyatlarini hisoblashdir.

Nutq signalini akustik-fonetik modellashtirishda foydalaniladigan modellarning yana bir turi ANN (Artificial neural networks) modellari bo’lib, ularning tuzilishi va prinsiplari inson asab tizimining biologik modellariga asoslangan. Neyronga diskret vaqt momentida kiruvchi bog’lanishlar orqali axborot uzatiladi, ularning asosida chiquvchi signal shakllantiriladi va bu o’z navbatida boshqa neyronlarning kirishlariga uzatiladi. ANN nutqni tanish aniqligini oshirish imkonini beradigan ham akustik ham til modeli sifatida qo’llaniladi. Akustik modellashtirishda HMM (Hidden Markov Model) va ANN ni birlashtirish usuliga qarab gibrid va tandem neyron tarmoq modellari ajratiladi. ANN ni bevosita to’g’ri tarqalgan tarmoqlar va teskari bog’lanishli (rekurrent) tarmoqlariga ajratish mumkin. ANN ning yetarlicha ko’p turlari mavjud bo’lib, ular orasidan quyidagi asosiy turlarini ajratishimiz mumkin: perseptronlar, CNN (Svyortkali neyron tarmoq), rekurrent tarmoqlar va uzoq muddatli qisqa vaqtli xotiraga ega ANN.



Download 1,33 Mb.
1   2   3   4   5   6   7




Download 1,33 Mb.