• Muammoni tushunish
  • Model tanlash
  • Tasniflash mashinasini o'rganish qanday ishlaydi?




    Download 64,62 Kb.
    bet6/8
    Sana15.05.2024
    Hajmi64,62 Kb.
    #233860
    1   2   3   4   5   6   7   8
    Tasniflash mashinasini o'rganish qanday ishlaydi?
    Tasniflashning asosiy g'oyasi kirish ma'lumotlari va chiqish yorliqlari o'rtasidagi naqsh va munosabatlarni o'rganish uchun kirish ma'lumotlari tegishli chiqish yorliqlari bilan bog'langan yorliqli ma'lumotlar to'plamida modelni o'rgatishdir. Model o'qitilgandan so'ng, u yangi ko'rinmaydigan ma'lumotlar uchun chiqish belgilarini bashorat qilish uchun ishlatilishi mumkin.

    9.2 rasm. Mashinali o’qitishda sinflash jarayoni
    Tasniflash jarayoni odatda quyidagi bosqichlarni o'z ichiga oladi:
    Muammoni tushunish
    Tasniflashni boshlashdan oldin, siz hal qilmoqchi bo'lgan muammoni tushunish muhimdir. Siz bashorat qilmoqchi bo'lgan sinf belgilari qanday? Kirish ma'lumotlari va sinf belgilari o'rtasida qanday bog'liqlik bor?
    Faraz qilaylik, bemorda ma'lum bir kasallik bor yoki yo'qligini, xususiyatlar deb ataladigan 7 ta mustaqil o'zgaruvchiga asoslanib, taxmin qilishimiz kerak. Bu shuni anglatadiki, faqat ikkita mumkin bo'lgan natija bo'lishi mumkin:

    • Bemorda kasallik bor, bu "rost" degan ma'noni anglatadi.

    • Bemorda kasallik yo'q. bu "yolg'on" degan ma'noni anglatadi.

    Bu ikkilik tasniflash muammosi.
    Ma'lumotlarni tayyorlash
    Muammoni yaxshi tushunganingizdan so'ng, keyingi qadam ma'lumotlaringizni tayyorlashdir. Bu ma'lumotlarni yig'ish va qayta ishlashni va ularni o'qitish, tekshirish va test to'plamlariga bo'lishni o'z ichiga oladi. Ushbu bosqichda ma'lumotlar tozalanadi, oldindan qayta ishlanadi va tasniflash algoritmi tomonidan ishlatilishi mumkin bo'lgan formatga aylantiriladi.
    X: Bu N * M matritsa ko'rinishidagi mustaqil xususiyatdir. N - bu raqam. kuzatishlar soni va M - xususiyatlar soni.
    y: Har bir N kuzatish uchun bashorat qilingan sinflarga mos keladigan N vektor.
    Xususiyatlarni chiqarish
    Tegishli xususiyatlar yoki atributlar turli sinflarni farqlash uchun ishlatilishi mumkin bo'lgan ma'lumotlardan olinadi.
    Faraz qilaylik, bizning X kiritishimiz 7 ta mustaqil xususiyatga ega bo'lib, yorliqga ta'sir qiluvchi atigi 5 ta xususiyatga ega yoki qolgan 2 tasi ahamiyatsiz yoki o'zaro bog'liq emas, biz faqat ushbu 5 xususiyatdan faqat modelni o'qitish uchun foydalanamiz.
    Model tanlash
    Tasniflash uchun ishlatilishi mumkin bo'lgan juda ko'p turli xil modellar mavjud, jumladan logistik regressiya, qarorlar daraxtlari, vektorli mashinalarni qo'llab-quvvatlash (SVM) yoki neyron tarmoqlar. Ma'lumotlaringiz hajmi va murakkabligi hamda mavjud hisoblash resurslarini hisobga olgan holda muammoingizga mos modelni tanlash muhimdir.

    Download 64,62 Kb.
    1   2   3   4   5   6   7   8




    Download 64,62 Kb.

    Bosh sahifa
    Aloqalar

        Bosh sahifa



    Tasniflash mashinasini o'rganish qanday ishlaydi?

    Download 64,62 Kb.