Bu insonning asab tizimini ko’paytirishga urinishlarga asoslangan sun’iy intellekt sohasidagi tadqiqotlar yo’nalishlaridan biri

Download 188,9 Kb.
bet	5/12
Sana	17.05.2024
Hajmi	188,9 Kb.
	#239793

1 2 3 4 5 6 7 8 9 ... 12

Bog'liq
Neyron tarmoqlari

Oʻrganishni mustahkamlash

Nazoratsiz oʻrganish
Xarajatlar funksiyasi vazifaga (model sohasi) va har qanday apriori taxminlarga (modelning yashirin xususiyatlari, uning parametrlari va kuzatilgan oʻzgaruvchilar) bogʻliq. Arzimas misol sifatida modelni koʻrib chiqing 𝑓(𝑥)=𝑎 qayerda 𝑎 doimiy va xarajat hisoblanadi 𝐶=𝐸[(𝑥−𝑓(𝑥))2] . Xarajat funksiyasi ancha murakkab boʻlishi mumkin. Uning shakli qoʻllanilishiga bogʻliq: masalan, siqishda u oʻrtasidagi oʻzaro maʼlumot bilan bogʻliq boʻlishi mumkin 𝑥 va 𝑓(𝑥) , holbuki, statistik modellashtirishda bu maʼlumotlar berilgan modelning posterior ehtimoli bilan bogʻliq boʻlishi mumkin (esda tutingki, bu ikkala misolda ham bu miqdorlar minimallashtirilgan emas, balki maksimallashtiriladi).
Oʻrganishni mustahkamlash[
Videooʻyinlarni oʻynash kabi ilovalarda aktyor bir qator harakatlarni amalga oshiradi va har biridan keyin atrof-muhitdan umuman oldindan aytib boʻlmaydigan javob oladi. Oʻqitishni mustahkamlashda maqsad uzoq muddatli (kutilgan yigʻilgan) xarajatlarni minimallashtiradigan harakatlarni amalga oshirish uchun tarmoqni tortish (siyosatni ishlab chiqish) hisoblanadi. Vaqtning har bir nuqtasida agent biror harakatni amalga oshiradi va atrof-muhit baʼzi (odatda nomaʼlum) qoidalarga koʻra kuzatuv va bir lahzalik xarajatlarni keltirib chiqaradi. Har qanday vaziyatda agent xarajatlarni aniqlash uchun yangi harakatlarni oʻrganish yoki tezroq davom etish uchun oldingi oʻrganishdan foydalanishga qaror qiladi.
Rasmiy ravishda atrof-muhit davlatlar bilan Markov qaror jarayoni (MDP) sifatida modellashtirilgan 𝑠1,...,𝑠𝑛∈𝑆 va harakatlar 𝑎1,...,𝑎𝑚∈𝐴 . Holatga oʻtishlar nomaʼlum boʻlgani uchun uning oʻrniga ehtimollik taqsimotlari qoʻllaniladi: lahzali xarajatlar taqsimoti 𝑃(𝑐𝑡|𝑠𝑡) , kuzatish taqsimoti 𝑃(𝑥𝑡|𝑠𝑡) va oʻtish taqsimoti 𝑃(𝑠𝑡+1|𝑠𝑡,𝑎𝑡) , siyosat esa kuzatishlar berilgan harakatlar boʻyicha shartli taqsimlash sifatida belgilanadi.
SNT bunday ilovalarda oʻrganish komponenti boʻlib xizmat qiladi.^[58][59] SNT bilan birgalikda dinamik dasturlash (neyrodinamik dasturlash)^[60] SNT qobiliyati tufayli transport vositalarini marshrutlash,^[61] videooʻyinlar, tabiiy resurslarni boshqarish^[62][63] va tibbiyot^[64] kabi muammolarga qoʻllanilgan. nazorat masalalarini echish uchun sonli yaqinlashish uchun diskretizatsiya tarmogʻining zichligini kamaytirishda ham aniqlik yoʻqotilishini kamaytirish.

Download 188,9 Kb.

1 2 3 4 5 6 7 8 9 ... 12

Download 188,9 Kb.