|
Svyortkali neyron tarmoqlari (CNN). CNN
|
bet | 5/7 | Sana | 18.05.2024 | Hajmi | 1,33 Mb. | | #242938 |
Bog'liq Nutqli signallarni tahlil qilish algortimlari;Svyortkali neyron tarmoqlari (CNN). CNN - yuqori aniqlikdagi tasvirlarda katta hajmdagi ma'lumotlarni samarali ishlash, moslashtirish va tushunish uchun mo'ljallangan arxitektura. CNN – ko’pqatlamli neyron tarmoqlarining bir turi sanaladi. U kichik qadamlar bilan masshtabni va buzilishlarni o’zgartirish asosida tarmoqning invariantligini ta’minlaydigan 2 ta asosiy g’oyani o’zida birlashtiradi bular: lokal reseptiv maydonlar (local receptive fields) va umumiy vaznlar (shared weights). CNN ikki o’lchovli ma’lumotlarni tanish uchun mo’ljallangan, shuning uchun ham neyronlar tarmoqning har bir qatlamida tekisliklarni hosil qiladi. Bu kiruvchi ma’lumotlarning topologiyasini saqlab qolish uchun amalga oshiriladi.
Kiritish qatlami bitta tekislikdan iborat bo’lib, uning o’lchami kirish ma’lumotlarining o’lchamiga to’g’ri keladi. Keyingi qatlamlar svyortkali hisoblanadi va belgilar kartasi deb nomlanadigan (feature maps) bir nechta neyronlar tekisliklaridan tashkil topgan. Svyortkali qatlamning har bir neyroni o’zidan oldingi qatlamning lokal reseptivli maydoniga ulangan. Tarmoqning oxirgi 2 ta qatlami amaliy jihatdan oddiy to’g’ri tarqalgan tarmoqni o’zidan aks ettiradi (17.3-rasm).
17.3-rasm. CNN arxitekturasi.
CNN tarmoqlari 2-o’lchamli ma’lumotlarga asoslanganligi sababli, nutqni tanish masalalarida audio ma’lumotlar tasvir ko’rinishga (spektrogramma) keltiriladi. CNN tarmoqlarining aksariyati tasvirdagi timsollarni tanishning samarali usuli sanaladi va ularni spektrogrammadagi timsollarni tanish uchun ishlatilayotganligini ko’rishimiz mumkin. CNN tarmoqlari asosan ajratilgan so’zlarni tanib olishda muvaffaqiyatli qo’llanilgan [13, 18, 19].
CNN ni quyidagi afzalliklari sababli nutqni tanish tizimlarida samarali foydalanilmoqda.
1) To’liq bog’lanishli neyron tarmoqlari bilan solishtirganda o’qitish tezligi yuqori va o’qitish parametrlari soni kamligi.
2) Grafik prosessorlarda (GPU) o’qitish algoritmini parallel amalga oshirish imkoniyatining mavjudligi.
3) Vizual tanib olish imkoniyati.
4) Tarmoqdagi birlashtiruvchi qatlamda maksimal elementni tanlab olish orqali kirish xususiyatlar kartasining o’lchami kamaytiriladi. Shuning hisobiga ma’ruzachi (diktor) variativligini model parametrlariga ta’sirini kamaytirishga imkon beradi.
5) CNN tarmoqni boshqa bir neyron tarmoqlari bilan birgalikda nutqni tanib olishda qo’llanilishi yuqori tanib olish samaradorlikni ta’minlaydi.
CNN neyron tarmoq modellari quyidagi qatlam turlarini o’z ichiga oladi:
• Svyortka qatlami (Convolutional (CONV))
• Faollashtirishlash (ACT yoki RELU)
• Pooling qatlami (POOL)
• To’liq bog’lanishli qatlam (Fully-connected (FC))
• Batch normalization qatlami (BN)
• Dropout qatlami (DO)
Yuqorida keltirilgan qatlamlarni ketma-ket maxsus holda joylashtirish asosida CNN hosil qilinadi. Odatda CNN ni quyidagicha tekstli diagramma ko’rinishida ifodalash mumkin.
INPUT(IMAGE) => CONV => RELU => FC => SOFTMAX
Odatda bu diagramma orqali sodda CNN ifodalanadi. Bu yerda kiruvchi ma’lumotlar qabul qilinib svyortka qatlamiga uzatiladi, so’ngra faollashtirish bosqichiga, undan keyin esa to’liq bog’lanish bosqichiga o’tkaziladi va nihoyat softmax klassifikator asosida sinflashtiriladi. Bu qatlamlar ichidan faqat CONV va FC (va qisman BN) o’qitish davomida o’rganilgan parametrlarni o’zida saqlovchi qatlamlar sanaladi. Faollashtirish va dropout qatlamlari zaruriy qatlamlar sanalmaydi, lekin ko’p xollarda tarmoq diagrammasiga tarmoq arxitekturasini aniq va ravshan ifodalash uchun kiritiladi. Pooling qatlami ham CONV va FC singari bir xil ahamiyatga egaligi sababli tarmoq diagrammasiga kiritilgan. Chunki ular tasvirning o’lcham sohasiga sezilarli ta’sir ko’rsatadi. CONV, POOL, RELU va FC qatlamlar qurayotgan CNN neyron tarmoq arxitekturasida muxim rol uynaydi.
|
| |