• Oʻrganishni mustahkamlash
  • Bu insonning asab tizimini ko’paytirishga urinishlarga asoslangan sun’iy intellekt sohasidagi tadqiqotlar yo’nalishlaridan biri




    Download 188,9 Kb.
    bet5/12
    Sana17.05.2024
    Hajmi188,9 Kb.
    #239793
    1   2   3   4   5   6   7   8   9   ...   12
    Bog'liq
    Neyron tarmoqlari

    Nazoratsiz oʻrganish
    Xarajatlar funksiyasi vazifaga (model sohasi) va har qanday apriori taxminlarga (modelning yashirin xususiyatlari, uning parametrlari va kuzatilgan oʻzgaruvchilar) bogʻliq. Arzimas misol sifatida modelni koʻrib chiqing 𝑓(𝑥)=𝑎  qayerda 𝑎  doimiy va xarajat hisoblanadi 𝐶=𝐸[(𝑥−𝑓(𝑥))2] . Xarajat funksiyasi ancha murakkab boʻlishi mumkin. Uning shakli qoʻllanilishiga bogʻliq: masalan, siqishda u oʻrtasidagi oʻzaro maʼlumot bilan bogʻliq boʻlishi mumkin 𝑥  va 𝑓(𝑥) , holbuki, statistik modellashtirishda bu maʼlumotlar berilgan modelning posterior ehtimoli bilan bogʻliq boʻlishi mumkin (esda tutingki, bu ikkala misolda ham bu miqdorlar minimallashtirilgan emas, balki maksimallashtiriladi).
    Oʻrganishni mustahkamlash[
    Videooʻyinlarni oʻynash kabi ilovalarda aktyor bir qator harakatlarni amalga oshiradi va har biridan keyin atrof-muhitdan umuman oldindan aytib boʻlmaydigan javob oladi. Oʻqitishni mustahkamlashda maqsad uzoq muddatli (kutilgan yigʻilgan) xarajatlarni minimallashtiradigan harakatlarni amalga oshirish uchun tarmoqni tortish (siyosatni ishlab chiqish) hisoblanadi. Vaqtning har bir nuqtasida agent biror harakatni amalga oshiradi va atrof-muhit baʼzi (odatda nomaʼlum) qoidalarga koʻra kuzatuv va bir lahzalik xarajatlarni keltirib chiqaradi. Har qanday vaziyatda agent xarajatlarni aniqlash uchun yangi harakatlarni oʻrganish yoki tezroq davom etish uchun oldingi oʻrganishdan foydalanishga qaror qiladi.
    Rasmiy ravishda atrof-muhit davlatlar bilan Markov qaror jarayoni (MDP) sifatida modellashtirilgan 𝑠1,...,𝑠𝑛∈𝑆  va harakatlar 𝑎1,...,𝑎𝑚∈𝐴 . Holatga oʻtishlar nomaʼlum boʻlgani uchun uning oʻrniga ehtimollik taqsimotlari qoʻllaniladi: lahzali xarajatlar taqsimoti 𝑃(𝑐𝑡|𝑠𝑡) , kuzatish taqsimoti 𝑃(𝑥𝑡|𝑠𝑡)  va oʻtish taqsimoti 𝑃(𝑠𝑡+1|𝑠𝑡,𝑎𝑡) , siyosat esa kuzatishlar berilgan harakatlar boʻyicha shartli taqsimlash sifatida belgilanadi.
    SNT bunday ilovalarda oʻrganish komponenti boʻlib xizmat qiladi.[58][59] SNT bilan birgalikda dinamik dasturlash (neyrodinamik dasturlash)[60] SNT qobiliyati tufayli transport vositalarini marshrutlash,[61] videooʻyinlar, tabiiy resurslarni boshqarish[62][63] va tibbiyot[64] kabi muammolarga qoʻllanilgan. nazorat masalalarini echish uchun sonli yaqinlashish uchun diskretizatsiya tarmogʻining zichligini kamaytirishda ham aniqlik yoʻqotilishini kamaytirish.

    Download 188,9 Kb.
    1   2   3   4   5   6   7   8   9   ...   12




    Download 188,9 Kb.

    Bosh sahifa
    Aloqalar

        Bosh sahifa



    Bu insonning asab tizimini ko’paytirishga urinishlarga asoslangan sun’iy intellekt sohasidagi tadqiqotlar yo’nalishlaridan biri

    Download 188,9 Kb.