• Kalit so ‘zlar
  • Mashinali o‘qitishda parametrik va noparametrik usullar annotatsiya




    Download 326.36 Kb.
    bet1/2
    Sana13.05.2023
    Hajmi326.36 Kb.
    #59216
      1   2
    Bog'liq
    MASHINALI O\'QITISH (3)
    xudo xoxlasa tushadi99%, 3-labarotoriya ishi Saralash usul va algoritmlarini tadqiq qilis, cmd buyruqlari, Incremental model nima, 1matematik, word sAM 1 savol, Документ Microsoft Word (4), Ma\'ruzalar (2), ЛАБОРАТОРНАЯ РАБОТА N1, Dasturlash 2, Ariza, Qalandarova Gulshoda, 1648631455, 1650692784, 1651669892 (2)

    MASHINALI OQITISHDA PARAMETRIK VA NOPARAMETRIK USULLAR
    Annotatsiya. Ushbu maqolada mashinali o'qitish usullarining ikkita asosiy turdagi usullari ko'rib chiqildi: parametrik logistik regressiya va parametrik bo'lmagan k-eng yaqin qo'shni. Bu usullarning asosiy farqlarini ajratish jarayonlari, har bir usulning avfzalliklari va kamchiliklari tahlil qilindi. Bu modellar kirish va chiqish o'zgaruvchilari o'rtasidagi munosabatlarning o'ziga xos shaklini qanday o'zgarishini va ular o'quv ma'lumotlaridan ushbu parametrlarini qanday baholash kerakligi ko'rib chiqildi. Shuningdek, modellarning cheklovlari, ularning murakkab, chiziqli bo'lmagan munosabatlarni qo'lga kirita olmasliklari o'rganib chiqildi. Bu esa amaliyotchilarga o'ziga xos qo'llanilishi uchun mos modelni tanlashda yordam beradi. Ushbu maqolada mashinali o'qitishning parametrik logistik regressiya va parametrik bo'lmagan k-eng yaqin qo'shni usullarini o'zaro tahliliy jarayonida “diabet” ma’lumotlar bazasidan foydalanilib hisoblash eksperimenti o'tkazilidi, natijalar jadval va grafikalarda aks ettirilgan.
    Kalit sozlar: mashinali o‘qitish, parametrik, noparametrik, logistik regressiya
    KIRISH
    So‘ngi yillarda mashinali o‘qitish sohasi tez sur’atlar bilan o‘sib bormoqda bu qishloq xo‘jaligi, iqtisodiyot, moliyadan tortib sog‘liqni saqlashgacha bo‘lgan keng sohalarda qo‘llanilib kelinmoqda. Mashinali o‘qitish sun’iy intellekt sohasidagi muhim sohalaridan biriga aylanmoqda, bu kompyuterlaraga ma’lumotlardan o‘rganish va aniq bashorat qilish yoki qaror qabul qilish imkonini beradigan algoritmlar va modellarni taqdim etmoqda. Biroq, modelni tanlash har qanday mashinali o‘qitish loyihasining muvaffaqiyati uchun juda muhimdir. Mashinali o‘qitishning muhim jihatlaridan biri bu natijalarning aniqligi va ishonchliligiga yaxshiroq ta’sir ko‘rsatishi mumkin bo‘lgan usullarni tanlashdir. Mashinali o‘qitishda ishlab chiqilgan modellar ikkita asosiy toifaga bo‘linadi: parametrik va parametrik bo‘lmagan usullardir. Ushbu maqolada biz parametrik va parametrik bo‘lmagan usullarni ko‘rib chiqamiz.
    Parametrik usullar kirish va chiqish ma’lumotlari o‘rtasidagi bog‘liqlikni tavsiflovchi ma’lum miqdordagi parametrlarning spetsifikatsiyasini o‘z ichiga oladi. Parametrik modellarga misol sifatida chiziqli regressiya va logistik regressiyalar kiradi. Ushbu modellar ma’lumotlarning asosiy tuzilishini aniq tushunishini talab qiladi va ko‘pincha ma’lumotlarning taqsimlanishi haqida kuchli taxminlar qiladi.

    1.1 – Rasm. Parametrik model.
    Parametrik usullarning afzalligi, ular ko‘pincha parametrik bo‘lmagan usullarga qaraganda soddaroq izohlanadi. Ular shuningdek, asosiy taqsimot yaxshi ma’lum bo‘lganda va ma’lumotlar parametrlarni aniq baholash uchun yetarlicha katta bo‘lsa, samaraliroq bo‘ladi 1.1 – Rasm.
    Parametrik usullarning kamchiligi shundaki, agar asosiy taqsimot taxminlari buzilgan bo‘lsa, ular yaxshi ishlamasligi mumkin. Bundan tashqari, ular taxmin qilingan taqsimotga mos kelmaydigan o‘zgaruvchilar o‘rtasidagi murakkab ma’lumotlarni aniq ko‘rsata olmasligi mumkin.
    Parametrik bo‘lmagan usullar esa ma’lumotlarning taqsimlanishi haqida hech qanday taxminlar qilmaydi va qa’tiy parametrlar sonining spetsifikatsiyasini talab qilmaydi. Parametrik bo‘lmagan modellarga misollar orasida qaror daraxtlari, k-eng yaqin qo’shni, tasodifiy o‘rmonlar va neyron tarmoqlari kiradi. Ushbu modellar ko‘pincha ma’lumotlarning asosiy tuzilishi noma’lum yoki aniqlash qiyin bo‘lgan hollarda qo‘llaniladi.

    1.2 – Rasm. Noparametrik model.
    Parametrik bo‘lmagan usullarning afzalligi, ular o‘zgaruvchilar o‘rtasidagi murakkab ma’lumotlarni aniqlay oladi va asosiy taqsimot haqida taxminlarni talab qilmaydi. Asosiy taqsimot noma’lum yoki ma’lumotlar tartibsiz bo‘lsa, ular yanada yaxshiroq moslashadi.1.2 – Rasm
    Parametrik bo‘lmagan usullarning kamchiligi shundaki, hisoblash qimmat bo’lishi mumkin va shunga o‘xshash aniqlikka erishish uchun parametrik usullardan ko‘ra ko‘proq ma’lumotlar talab qilinadi. Bunga qo‘shimcha ravishda, ular parametrik usullarga qaraganda kamroq izohlanishi mumkin, chunki ular oddiy asosiy modelga tayanmaydi.
    Mashinali o‘qitishda biz ko‘pincha noma’lum qiymat haqida xulosa chiqarish yoki bashorat qilishni istagan ma’lumotlar bazalariga duch kelamiz. Buning uchun biz ma’lumotlarning asosiy tuzilishini hisobga oladigan tegishli aniq usulni tanlashimiz kerak. Bu ko‘p ishlatiladigan ikkita yondashuv parametrik va parametrik bo‘lmagan usullardir.
    Mashinali o‘qitish modellarining parametrik yoki parametrik bo‘lmagan usullarini ko‘pchilik foydalanadigan ikkita modellari parametrik logistik regressiya va parametrik bo‘lmagan k-yaqin qo‘shni (KNN) usullarini tahlil qilib chiqamiz.
    Parametrik logistik regressiya kirish o‘zgaruvchilari va ikkilik chiqish o‘zgaruvchilri o‘rtasidagi munosabatlarni modellashtiruvchi parametrik tasniflash usuli. Logistik regressiya modeli kirish o‘zgaruvchilari va chiqish o‘zgaruvchisi o‘rtasidagi bog‘liqlik chiziqli ekanligini va chiqish o‘zgaruvchisi Bernulli taqsimotiga amal qilishini taxmin qiladi. Model kirish o‘zgaruvchilari koeffitsientlarini baholaydi va ulardan ikkita mumkin bo‘lgan sinfdan biri bo‘lish ehtimolini hisoblash uchun foydalaniladi. Logistik regressiya funksiya quydagicha aniqlanadi (a):
    (a)
    Bu yerda - bog‘liq o‘zgaruvchi bashorat qilingan ehtimoli va - mustaqil o‘zgaruvchilarning vaznli yig‘indisi va - eksponensial funksiya. Logistik funksiya mustaqil o‘garuvchilarning qiymatlaridan qat’i nazar, bashorat qilingan ehtimollik har doim 0 dan 1 gacha bo‘lishini ta’minlaydi.

    1.3 – Rasm. Logistik Regressiya.
    Parametrik logistik regressiyaning afzalliklari hisoblash samaradorligi, izohlash oson va tasniflash natijalarini ehtimollik bilan izohlashni ta'minlaydi. Logistik regressiya, chiziqli regressiya kabi boshqa parametrik usullarga qaraganda, haddan tashqari moslashishga kamroq moyil.1.3 – Rasm.
    Parametrik logistik regressiyaning kamchiligi shundaki, u kirish o'zgaruvchilari va chiqish o'zgaruvchilari o'rtasidagi chiziqli munosabatni nazarda tutadi, bu har doim ham ma’lumotlar tartibli holatda bo'lmasligi mumkin. Bundan tashqari, model kiritilgan o'zgaruvchilarning taqsimlanishi normal deb taxmin qiladi, bu har doim ham to'g'ri bo'lmasligi mumkin.
    Parametrik bo'lmagan usullar, aksincha ma'lumotlarning asosiy taqsimoti haqida hech qanday taxmin qilmaydi. Buning o'rniga, ular aniq taqsimlashni talab qilmaydigan usullarga tayanadilar.
    Parametrik bo'lmagan usulga misollardan biri k-eng yaqin qo'shni (KNN) algoritmidir. K-eng yaqin qo'shni (KNN) algoritmi o'quv majmuasida bashorat qilinayotgan kuzatishga eng yaqin bo'lgan k kuzatuvni topish orqali ishlaydi. Keyin bashoratning natijasi k eng yaqin kuzatuvlarning o'rtacha qiymati bilan aniqlanadi. K-eng yaqin qo'shni (KNN) parametrik bo'lmagan tasniflash usuli Evklid masofasi formulasi orqali aniqlanadi (b):

    (b)


    d = evklid masofasi;
    ( ) – birinchi nuqtaning koordinatasi;
    ( ) – ikkinchi nuqtaning koordinatasi;



    1.4 – Rasm. k-eng yaqin qo‘shni
    Parametrik bo‘lmagan usul k-eng yaqin qo‘shni (KNN) algoritmi ma'lumotlarning asosiy taqsimoti haqida hech qanday taxminlar qilmaydi, bu uni ko'p qirrali va keng qo'llaniladigan usulga aylantiradi. Ma'lumotlar to'plami shovqinli, murakkab yoki yuqori o'lchamli bo'lsa, ayniqsa foydalidir.
    Parametrik bo‘lmagan k-eng yaqin qo‘shni (KNN) algoritmi usulining afzalliklari shundaki, u parametrik emas, ya'ni u ma'lumotlarning asosiy taqsimoti haqida hech qanday taxminlarni talab qilmaydi. Bundan tashqari, u kirish o'zgaruvchilari va chiqish o'zgaruvchilari o'rtasidagi chiziqli bo'lmagan munosabatlar bilan ishlash uchun osongina moslashtirilishi mumkin.
    Parametrik bo‘lmagan k-eng yaqin qo‘shni (KNN) algoritmi usulining kamchiliklari, ayniqsa ma'lumotlar to'plami katta yoki katta o'lchamli bo'lsa, hisoblash qimmat bo'lishi mumkin. Bundan tashqari, u nomutanosib sinflar bilan yaxshi ishlamasligi mumkin yoki sinflar orasidagi qaror chegarasi juda chiziqli bo'lmasa.

    Download 326.36 Kb.
      1   2




    Download 326.36 Kb.

    Bosh sahifa
    Aloqalar

        Bosh sahifa



    Mashinali o‘qitishda parametrik va noparametrik usullar annotatsiya

    Download 326.36 Kb.