264
Ключевые слова:
трансферное обучение, модель, обучение, сеть.
Abstract.
The article provides information on the method
of creating a new type of
model through data transfer based on previously created effective models.
Key words:
transfer learning, model, training, network.
Hozirgi kunda zamonaviy axborot texnologiyalari inson faoliyatining barcha sohalariga
jadallik bilan kirib kelmoqda. Yangi texnologiyalar ta’limda, sanoatda va tibbiyotda ancha
samarali qo‘llanilmoqda. So‘ngi yillarda yaratilgan texnologiyalar haqida ma’lumotga ega
bo‘lish va ushbu texnologiyalardan o‘z sohasida to‘g‘ri foydalanishni tashkil etish orqali
foydalanuvchilar mehnat samaradorligini oshirishlari, vaqt tejamkorligi va kutilayotgan
yutuq va natijalarga tezroq erishishlari mumkin bo‘lmoqda. Zamonaviy texnologiyalarning
sohalarda keng qo‘llanilishi avvalgiga qaraganda turli, ya’ni matn, tasvir, audio va video
ko‘rinishlardagi ma’lumotlarning yig‘ilishiga va qayta ishlanishiga yordam bermoqda. Bu
esa to‘plangan ma’lumotlarga
ishlov berish, ularni o‘rganish va qayta ishlash asosida
bashoratlash, tanib olish, tasniflash masalalarini nafaqat yechish, balki bunday masalalarni
yechishni kompyuter va robotlarga xam o‘rgatish imkoniyati paydo bo‘lmoqda. Matn,
tasvir, audio va video ma’lumotlarni tahlil qilishni kompyuter va robotlarga o‘rgatish sun’iy
intellekt texnologiyalari [1], ya’ni “Mashinaviy o‘qitish” (Machine learning) yo‘nalishining
usul va vositalari yordamida bajarilmoqda [2].
“Transfer learning” (TL) – bu Mashinaviy o‘qitishning yo‘nalishlaridan biri bo‘lib,
“Transferli o‘qitish” ma’nosida tarjima qilinadi va bir vazifadan olingan bilimlarni boshqa
maqsadli vazifaga qo‘llash uchun ishlatiladi. Bu texnologiya ma'lumotlar tahlili bilan
shug‘ullanuvchi mutaxassislar va foydalanuvchilar uchun ko‘plab yechimlarni mavjud
masalalariga qo‘llashga yordam beradi [3]. Misol uchun, Vikipediya maqolalarining
tasnifini o‘rganish jarayonida olingan bilimlar tibbiy matnlarni
tasniflash masalasini
yechish uchun ishlatilishi mumkin. Yoki Computer Vision vazifalaridan biri sifatida
osmondagi qushlarni tanib olish uchun avtomobillarni tasniflash bo‘yicha o‘qitilgan model
yechimidan foydalanish mumkin. Shuningdek “Transfer learning”ni machinani o‘rgatish
uchun yetarlicha ko‘p malumotlar bo‘lmagan hollarda, masalan tibbiyotda onkologik
kasalliklarni bashoratlashda ishlatiladigan insonning biror organidan olingan gistologik
preparatlar tasvirlari to‘plami kam bo‘lgan vaziyatlarda ishlatish mumkin [4].
Shunday ekan “Transfer learning” texnologiyasidan foydalanish uchun quyidagi ikkita
jihatga e’tibor qaratish kerak bo‘ladi:
Ochiq, oldindan tayyorlangan modelga ega bo‘lish;
Belgilarni ajratish yoki to‘liqroq o‘qitish yordamida
model vazifasini qaytadan
tayinlash.
Oldindan tayyorlangan model - bu ayni vaqtda yechilishi kerak bo‘lgan masalaga
o‘xshash masalani yechish uchun boshqa kimdir tomonidan yaratilgan va o‘rgatilgan
modeldir. Oldindan tayyorlangan tarmoqlar (masalan neyron tarmoqlar) odatda modelni
yangi ma’lumotlar bilan boyitish va belgilarni ajratish uchun qo‘llaniladi. Amalda, katta
hisoblash resurslariga ega bo‘lgan mutaxassis yoki foydalanuvchilar, ma'lum bir masalani
yechish uchun katta modellarni tuzadi, va bu modelni masalan ImageNet yoki Wikipedia
Corpus kabi katta ma'lumotlar to‘plamida (Big Data) o‘qitadi (model
parametrlarini
moslaydi) va sinovdan o‘tkazadi. Misol uchun, VGG19 modeli 143 miliondan ziyod
parametrga ega va tasvirni tasniflash uchun ishlatiladi. "Ochiq" deganda modelning
ommaga e'lon qilinganligi va undan erkin foydalanish mumkinligini nazarda tutiladi.
Internet tarmog‘ida TensorFlow Hub, Keras Applications, PyTorch
Hub kabi resurslarda
tayyor o‘qitilgan modellardan foydalanish mumkin. Lekin xamma vaqt xam tayyor
modellar maqsad qilingan masalani to‘laligicha yechishga yordam beravermaydi. Shuning
uchun quyidagi sabablar tufayli ularni qayta sozlashga to‘g‘ri keladi:
Yana xam yuqori aniqlikka erishish;
265
Kerakli formatdagi(ko‘rinishdagi) chiqish signallarini shakllantirish.
Ko‘pgina modellar ko‘plab turdagi vaziyatlarda o‘qitiladi, masalan, ImageNet modeli
mingta sinfga ajratilgan bir million tasvirni o‘z ichiga oladi, shuning uchun bu model
parametrlarini o‘zgartirishga hojat yo‘q. Buning o‘rniga, uni yangi
konkret belgilar bilan
to‘ldirish, va faqat uning oxirgi qatlamlarini yechilishi kerak bo‘lgan masala uchun qayta
o‘qitish foydaliroqdir.TLda modelga uzatilayotgan yangi namunalardan belgilarni ajratib
olish uchun oldingi model tomonidan olingan qonuniyatlardan foydalaniladi, keyinchalik
bu belgilar yangi tasniflagich (klassifikator) orqali o‘tkaziladi. Bu usulda faqatgina maqsad
qilingan masalani yechish uchun oldindan o‘rgatilgan model ustiga boshidan o‘qitiladigan
tasniflagich qo‘shiladi. Ya’ni oldin tayyorlangan model parametr(vazn)laridan foydalanib
yangi model yangi ma’lumotlar asosida o‘qitiladi va buning natijasida yangi model mavjud
parametrlarni saqlagan holda yangi kiritilgan malumotlardan kerakli yangi parametrlarni
qo‘shib oladi. Buni 1-rasmda ko‘rsatilgan Konvolyutsion neyron tarmog‘i (CNN-
Convolutional Neural Network) misolida tushintirish mumkin. Dastlab ImageNet tasvirlar
to‘plamida o‘qitilgan
model vaznlaridan foydalanib, gistoligik tasvirlarni tasniflash
modelini qurish mumkin. Buning uchun bu tarmoqning dastlabki qatlamlari muzlatilib,
oxirgi qatlamlari yangi tasvirlarda qayta o‘qitiladi. Bundan avval esa bu modelning so‘ngi
chiqish qatlamidagi sinflar soni quyilgan masalaga moslashtiriladi.
1-rasm. 1-avval o‘qitilgan model, 2- avval o‘qitilgan modelning o‘zgartirilgan ko‘rinishi.
Natijada avval katta xajmdagi malumotlarda o‘qitilgan va yaxshi tasniflash
ko‘rsatgichlariga ega modeldan foydalanib, usha vazifaga yaqin tipdagi masalalarni yechish
uchun yangi model olinadi. Bu esa quyilgan masalani yechish uchun ko‘p miqdorda
ma’lumotlarga va katta hisoblash resurslariga ega bo‘lmagan foydalanuvchilarga samarasi
ancha yuqori bo‘lgan modellarni faqatgina o‘zida mavjud malumotlar asosida yaratish va
ishlatish imkoniyatini beradi.