|
Chuqur neyron tarmoqlari.( Глубокие нейронные сети.)
|
bet | 4/4 | Sana | 21.11.2023 | Hajmi | 187,76 Kb. | | #102803 |
Bog'liq Neyron tarmoqlarga asoslangan ma\'lumotlarni qazib olish nazariyasining umumiy ko\'rinishiChuqur neyron tarmoqlari.( Глубокие нейронные сети.)
Sun'iy neyron tarmoqlarga asoslangan chuqur arxitekturalar, avval aytib o'tilganidek, 1980 yilda Fukusima tomonidan ishlab chiqilgan neokognitrondan kelib chiqadi. 1989 yilda LeKun qo'lda yozilgan pochta kodlarini tanib olish muammosini hal qilishda chuqur neyron tarmoqlarni o'rgatish uchun orqaga tarqalish algoritmidan foydalanishga muvaffaq bo'ldi [47]. Muvaffaqiyatli tajribaga qaramay, modelni o'qitish uchun uch kun kerak bo'ldi, bu esa ushbu usulni qo'llashni sezilarli darajada chekladi.
2006 yilda chuqur o'rganish ko'p qatlamli neyron tarmoq sifatida taqdim etildi, uning birinchi qatlami tasvirning asosiy xususiyatlarini ochib berdi va keyingi qatlamlar oddiy ibtidoiy birikmalar ko'rinishida ob'ektning umumlashtirilgan tasvirini qurdi [48]. O'quv jarayoni ko'p sonli sozlanishi parametrlarning mavjudligi bilan murakkablashadi. Odatda, chuqur neyron tarmoqni o'qitish jarayoni ikki bosqichga bo'linadi. Birinchi bosqichda bir qatlamli tarmoq o'qitiladi va keyingi bosqichda tasniflash xatosini minimallashtirish orqali tarmoq qatlamlari orasidagi og'irlik koeffitsientlari taqqoslanadi. Ushbu yondashuv qatlamlar orasidagi optimallashtirish hisobiga ko'p sonli parametrlarga ega tarmoqni o'qitishning murakkabligini kamaytiradi.
Chuqur neyron tarmoq - bu bir nechta yashirin qatlamlarga ega bo'lgan sun'iy neyron tarmoqdir [49]. Qo'shimcha qatlamlar sizga har doimgidan yuqori darajadagi abstraktsiyalarni yaratishga imkon beradi, bu esa haqiqiy dunyoda murakkab ob'ektlarni tanib olish modelini shakllantirish imkonini beradi. Odatda, chuqur uzatish tarmoqlari qo'llaniladi, ammo so'nggi tadqiqotlar takroriy tarmoqlarda chuqur arxitekturaning muvaffaqiyatli qo'llanilishini ko'rsatdi [50]. Tasvirni qayta ishlash bilan bog'liq vazifalarda konvolyutsion neyron tarmoqlar asosan eng yuqori samaradorligi tufayli qo'llaniladi.
Chuqur neyron tarmoqlarni orqaga tarqalish algoritmi yordamida o'rgatish mumkin. Shunday qilib, bir nechta vaznni sozlash qoidalaridan foydalanish mumkin. Masalan, stokastik gradient tushish algoritmi:
bu yerda η - joriy qadamning kattaligini boshqarish uchun doimiy, L - yo'qotish funktsiyasi. Yo'qotish funktsiyasini tanlash mashinani o'rganish muammosi sinfi (nazorat qilinadigan, nazoratsiz, mustahkamlangan) va faollashtirish funktsiyasi bilan aniqlanishi mumkin.
|
| |