Signalning kepstral parametrlarini hisoblash algoritmi
“Kepstr” atamasi chiziqli bo‘lmagan filtrlash yordamida signallarning siqilgan, ixcham tasvirini spektral o‘zgartirish qiymatlarining logarifmini olishni anglatadi. Ko‘pincha nutq signallarini qayta ishlashda kepstral ifodalashdan foydalaniladi. Biroq, ovoz traktining tug‘ma xususiyatlari va ishlatiladigan nutq uslubiyati tufayli har bir shaxsning nutqi takrorlanmas hisoblanadi. Nutqni tanib olishning ko‘plab usullari mavjud, aksariyat hollarda ularning barchasi statistik tahlil va ehtimollar nazariyasiga asoslangan. Shu bilan birga, birinchi bosqichda har doim akustik tahlil usullari qo‘llaniladi. Akustik daraja – bu ishlov berishning dastlabki bosqichi hisoblanadi, chunki u faqat audio signalga tegishli. Akustik jarayonlarni o‘rganish ovozli signalni yozib olish, raqamli qayta ishlash va
parametrlashni o‘z ichiga oladi. Xususiyatlarni ajratib olish jarayonining maqsadi – kiruvchi akustik signalini ba’zi bir ixcham parametrli tasvirlash shakliga aylantirishdir [8].
Nutqni talaffuz qilish jarayonida o‘zgartirishi mumkin bo‘lgan va o‘rganish davomida miqdoriy ko‘rsatkichlarni aniqlash mumkin bo‘lgan asosiy parametrlari ham vaqt sohasi bo‘yicha ham va spektral o‘zgartirishlarning natijalaridir.
Vaqt sohasi bo‘yicha o‘zgartirish algoritmlarining parametrlari lokal parametrlarni o‘z ichiga oladi, ularni aniqlash algoritmlari oldinroq berilgan edi. Spektral o‘zgartirishlar parametrlarini aniqlash algoritmlari (signal fragmentlari spektrlari) tegishli bobla bayon etiladi. Ishlov berish zanjirida keyingi bosqichda nutq signallarining integral parametrlarini aniqlash algoritmlari: kepstral koeffitsiyentlarni aniqlash, formant chastotalarini ajratib olish va asosiy ton chastotasini shakllantirish amalga oshiriladi.
Tanib olish tizimlarida nutq signali fragmentlarga bo‘linadi, har bir fragment belgilar vektoriga aylantiriladi, natijada kirish signali funksiya vektorlari to‘plamining ketma-ketligi yoki parametrli tasvir bilan ifodalanadi. Noyob xususiyatli vektor sifatida kepstr koeffitsiyentlarning bir o‘lchovli chastota vektori, shuningdek uning hosilalaridan tashkil topgan vektor ishlatiladi.
Kepstr parametrlarni aniqlashning hisoblash algoritmi avvalgi bo‘limlarda tasvirlangan ishlov berishning dastlabki bosqichlari natijalariga asoslangan: bo‘laklarga bo‘lish, Xemming oynasidan o‘tkazish va DKO‘ algoritmi bilan spektrni olish. Mel-chastota kepstr koyeffitsiyentlari (Mel-frequency cepstrum coefficients – MFCC) axborot xususiyatlari sifatida ishlatiladi. Ular ikkita asosiy filtrlash tushunchalariga asoslangan: kepstr va mel-shkala. Kepstr – bu signalning amplituda spektrining logarifmidan olingan DKO‘ natijasi [8, 9] .
Joriy ishlov berishda, ya’ni nutq signalining fragmentlaridan birini qayta ishlashda, DKO‘ yoyilmasining 2ⁿ = 256 spektral koeffitsiyentlari olinadi. «Mel - shkalasi» yordamida DKO‘ amplituda spektri chiziqli bo‘lmagan (logarifmik) mel- shkalada joylashgan «uchburchak» chastota diapazonlari doirasidagi spektral
koeffitsiyentlarning amplitudalarini qo‘shib silliqlanadi (4.8-rasm) ). Sodda shakl uchun ularning soni 12 ga teng.
4.8-rasm. 12 diapazonli mel-chastotali filtrlarning tarog‘i Yuqorida mel-shkalada olingan spektrni parchalash uchun filtrlarning
“taroqchasini” hosil qilish kerak, bu yerda har bir mel-filtr uchburchak oynaning funksiyasi bo‘lib, u ma’lum bir chastota diapazonidagi energiya miqdorini yig‘ishga va shu bilan Mel-koeffitsiyentini olish imkon beradi. Mel-koeffitsiyentlarining qiymatlari va tahlil qilingan chastota diapazoniga ega bo‘lgan holda, bunday filtrlar to‘plamini qurish mumkin. Mel-koeffitsiyentining tartib raqami qancha ko‘p bo‘lsa, filtr poydevori shunchalik keng bo‘ladi.
Xomaki namunasi uchun diskretlash chastotasi 16 kGs bo‘lgan 24 chastota diapazoni olinadi. Birinchi amplituda koeffitsiyenti - spektrning doimiy komponenti e’tiborga olinmaydi, qolgan 255 spektral koeffitsiyent amplitudasi 24 uchburchak filtrlar orqali o‘rtacha hisoblanadi. Ushbu diapazonlarning chastotalari 4.1-jadvalda keltirilgan.
O‘rtacha vazn ma’lum bir filtr uchun quyi va yuqori chastotalar orasidagi chastotalarga mos keladigan amplituda spektral koeffitsiyentlar uchun topiladi. Agar amplituda polosasining markaziy chastotasiga to‘liq mos keladigan bo‘lsa, unda 1- koeffitsiyentiga ko‘paytiriladi.
Amplituda qiymatiga mos keladigan chastotani o‘rtadan quyi yoki yuqori
chegaraga o‘tkazishda koeffitsiyent 1 dan nolga kamayadi. Amplitudalarning
koeffitsiyentlar bo‘yicha hosilalari yig‘ilib, amplituda qiymatlari soniga bo‘linadi. Bu ma’lum bir chastota diapazoni uchun o‘rtacha og‘irlik.
4.1-jadval
Diapazon
|
Quyi
chastota (Gs)
|
O‘rta
chastota (Gs)
|
Yuqori
chastota (Gt)
|
1
|
0,0000
|
74,24
|
156,4
|
2
|
74,24
|
156,4
|
247,2
|
3
|
156,4
|
247,2
|
347,6
|
4
|
247,2
|
347,6
|
458,7
|
5
|
347,6
|
458,7
|
581,6
|
6
|
458,7
|
581,6
|
717,5
|
7
|
581,6
|
717,5
|
867,9
|
8
|
717,5
|
867,9
|
1034
|
9
|
867,9
|
1034
|
1218
|
10
|
1034
|
1218
|
1422
|
11
|
1218
|
1422
|
1647
|
12
|
1422
|
1647
|
1895
|
13
|
1647
|
1895
|
2171
|
14
|
1895
|
2171
|
2475
|
15
|
2171
|
2475
|
2812
|
16
|
2475
|
2812
|
3184
|
17
|
2812
|
3184
|
3596
|
18
|
3184
|
3596
|
4052
|
19
|
3596
|
4052
|
4556
|
20
|
4052
|
4556
|
5113
|
21
|
4556
|
5113
|
5730
|
22
|
5113
|
5730
|
6412
|
23
|
5730
|
6412
|
7166
|
24
|
6412
|
7166
|
8000
|
Algoritmni amalga oshirishga misol. 4.1-jadvalga muvofiq signal spektrining
256 amplitudasi 0 dan 8000 Gs gacha bo‘lgan chastotalarga to‘g‘ri keladi, harakatlanish bosqichi esa 8000/256 = 31,25 Gs. Birinchi amplituda (4.9-rasm) 0 Gs
chastotasiga, ikkinchisi 31,25 Gs, uchinchisi 62,5 Gs, to‘rtinchi amplituda 93,75 Gs, beshinchisi 125 Gs va oltinchi amplituda 156,25 Gs. Mel shkalasidagi filtr chastotalari: 0 Gs, 74,24 Gs, 156,45 Gs.
4.9-rasm. Uchburchakli filtrlarning birinchi diapozoni
Birinchi diapozon ko‘paytma uchun 6 ta ko‘paytrish koeffitsiyenti va mos keladigan oltita filtr koeffitsiyentini olish uchun (4.1-jadval), uchburchak oynasi funksiyasining gipotenuzalari nisbatlariga mos keladigan uchburchak katetlarining nisbatlarini hisoblash kerak:
1. 0;
31,25/74,24 = 0,43;
62,5/74,24 = 0,84;
(156,4 – 93,75)/(156,4 – 74,24) = 62,65/82,16 = 0,76;
(156,4 – 125)/(156,4 – 74,24) = 0,38;
0.
Hisoblashning keyingi bosqichida DKO‘ yoyilmasining spektral koeffitsiyentining har bir qiymati (birinchi uchburchakning chastota diapazoni 0 - 156,45 Gs ichida) yuqorida olingan uchburchakning tegishli koeffitsiyentiga ko‘paytiriladi. Filtrlar DKO‘ modullarining kvadratlariga qo‘llaniladi. Ushbu
koeffitsiyentlar bo‘yicha spektr amplitudalarning hosilalari yig‘ilib, 6 ga bo‘linadi. Keyingi bosqichda olingan hosilalar logariflanadi.
MFCC koeffitsiyentlarini hisoblashning yakuniy bosqichi 4.1-jadvalning har bir bosqichida DKO‘ni bajarishdir.
Bunday hisoblashlar natijasida 4.1-jadvalning barcha 24 bosqichida 24 elementli spektral (akustik) vektor hosil qilinadi. Va nihoyat, akustik vektorlar bitta til namunasi ichida normallashtiriladi. Buning uchun barcha vektorlarning qiymatlari maksimal uzunlik vektorining teskarisiga ko‘paytiriladi.
Akustik vektorlar soni odatda 12 yoki 24 ga teng olinadi.
4.10-rasm. Kepstr koffitsiyentlarining ketma-ketligi
Amalga oshirilgan matematik o‘zgartirishlar natijasida tanib olishda nutq signalining minglab qiymatlarini muvaffaqiyatli almashtiradigan kichik qiymatlar to‘plami (vektor) olingan (4.10-rasm). Ushbu akslantirish spektrogramma yoki nutq signalining vaqt sohasida ifodalangan shaklidan ancha kichikdir.
|