|
Mashinani o'rganish algoritmlarining turlari
|
bet | 4/10 | Sana | 14.05.2024 | Hajmi | 1,17 Mb. | | #232713 |
Bog'liq Masharipov Sanatbek mashinali o\'qitish3. Mashinani o'rganish algoritmlarining turlari
Mashinani o'rganish algoritmlarining to'rt turi mavjud: nazorat qilinadigan, nazoratsiz, yarim nazoratli va mustahkamlovchi. Byudjetingizga, talab qilinadigan tezlik va aniqlikka qarab, har bir tur va variant o'z afzalliklariga ega. Mashinani oʻrganishning ilgʻor algoritmlari bir nechta texnologiyalarni, jumladan, chuqur oʻrganish, neyron tarmoqlar va tabiiy tilni qayta ishlashni talab qiladi va nazoratsiz va nazorat ostida oʻrganishdan foydalanishga qodir.6 Quyida eng ommabop va koʻp ishlatiladigan algoritmlar keltirilgan.
Nazorat ostidagi o'rganish algoritmlari
Nazorat ostidagi ta'limni ma'lumotlarni qazib olishda ikki turdagi muammolarni ajratish mumkin: tasniflash va regressiya.
Tasniflash test ma'lumotlarini muayyan toifalarga aniq belgilash uchun algoritmdan foydalanadi. U ma'lumotlar to'plamidagi aniq ob'ektlarni tan oladi va ushbu ob'ektlarni qanday belgilash yoki belgilash kerakligi haqida ba'zi xulosalar chiqarishga harakat qiladi. Keng tarqalgan tasniflash algoritmlari - chiziqli tasniflagichlar, qo'llab-quvvatlovchi vektor mashinalari (SVM), qaror daraxtlari, K-eng yaqin qo'shni va tasodifiy o'rmon, ular quyida batafsilroq tavsiflanadi.
Regressiya bog'liq va mustaqil o'zgaruvchilar o'rtasidagi munosabatni tushunish uchun ishlatiladi. U odatda ma'lum bir biznes uchun sotishdan tushgan daromad kabi prognozlarni amalga oshirish uchun ishlatiladi. Chiziqli regressiya, logistik regressiya va polinomli regressiya mashhur regressiya algoritmlaridir.
Boshqariladigan mashinalarni o'rganish jarayonlarida turli xil algoritmlar va hisoblash texnikasi qo'llaniladi, ular ko'pincha Python kabi dasturlardan foydalanish orqali hisoblanadi. Nazorat qilinadigan o'rganish algoritmlari quyidagilarni o'z ichiga oladi:
AdaBoost yoki gradientni kuchaytirish: Adaptiv kuchaytirish7 deb ham ataladigan bu usul kam ishlayotgan regressiya algoritmini kuchsizlari bilan birlashtirib, kuchliroq algoritm yaratish uchun kuchaytiradi, natijada xatoliklar kamayadi. Boosting bir nechta tayanch baholovchilarning prognozlash kuchini birlashtiradi.
Sun'iy neyron tarmoqlar: ANN, neyron tarmoqlari yoki simulyatsiya qilingan neyron tarmoqlari (SNN) sifatida ham tanilgan, mashinani o'rganish usullarining bir qismi bo'lib, chuqur o'rganish algoritmlarining markazida joylashgan. O'quvchi algoritmi neyronlar deb ataladigan qurilish bloklari yordamida kirish ma'lumotlaridagi naqshlarni taniydi va vaqt o'tishi bilan o'qitilgan va o'zgartiriladigan inson miyasidagi neyronlarga yaqinlashadi. (Batafsil "neyron tarmoqlar" da.)
Qaror daraxti algoritmlari: Raqamli qiymatlarni bashorat qilish (regressiya muammolari) va ma'lumotlarni toifalarga tasniflash uchun ishlatiladi, qaror daraxtlari daraxt diagrammasi bilan ifodalanishi mumkin bo'lgan bog'langan qarorlarning shoxlangan ketma-ketligini ishlatadi. Qaror daraxtlarining afzalliklaridan biri shundaki, ular neyron tarmog'ining qora qutisidan farqli o'laroq tekshirish va tekshirish oson.
O'lchamlarni qisqartirish: Agar tanlangan ma'lumotlar to'plami ko'p sonli xususiyatlarga ega bo'lsa7 , u yuqori o'lchamlilikka ega. Keyin o'lchamlarni kamaytirish funksiyalar sonini qisqartiradi va faqat eng mazmunli tushunchalar yoki ma'lumotlarni qoldiradi. Masalan, asosiy komponent tahlili.
K-eng yaqin qo'shni: KNN nomi bilan ham tanilgan ushbu parametrik bo'lmagan algoritm ma'lumotlar nuqtalarini ularning yaqinligi va boshqa mavjud ma'lumotlar bilan bog'lanishiga qarab tasniflaydi. Shunga o'xshash ma'lumotlar nuqtalarini bir-biriga yaqin joyda topish mumkin deb taxmin qiladi. Natijada, u odatda Evklid masofasi orqali ma'lumotlar nuqtalari orasidagi masofani hisoblashga intiladi va keyin u eng tez-tez uchraydigan toifa yoki o'rtacha toifaga asoslangan toifani tayinlaydi.
Chiziqli regressiya: Chiziqli regressiya qaram o'zgaruvchi va bir yoki bir nechta mustaqil o'zgaruvchilar o'rtasidagi munosabatni aniqlash uchun ishlatiladi va odatda kelajakdagi natijalar haqida bashorat qilish uchun foydalaniladi. Agar bitta mustaqil o'zgaruvchi va bitta qaram o'zgaruvchi bo'lsa, u oddiy chiziqli regressiya deb nomlanadi.
Logistik regressiya: qaram o'zgaruvchilar uzluksiz bo'lganda chiziqli regressiya qo'llanilsa-da, qaram o'zgaruvchi kategorik bo'lganda logistik regressiya tanlanadi, ya'ni "to'g'ri" va "noto'g'ri" yoki "ha" va "yo'q" kabi ikkilik natijalar mavjud. Ikkala regressiya modeli ham ma'lumotlar kiritish o'rtasidagi munosabatlarni tushunishga harakat qilsa-da, logistik regressiya asosan spam identifikatsiyasi kabi ikkilik tasniflash muammolarini hal qilish uchun ishlatiladi.
Neyron tarmoqlar: Asosan chuqur o'rganish algoritmlari uchun foydalanilgan neyron tarmoqlar inson miyasining tugunlar qatlamlari orqali o'zaro bog'liqligini taqlid qilish orqali kirish o'rgatish ma'lumotlarini qayta ishlaydi. Har bir tugun kirishlar, og'irliklar, egilish (ostona) va chiqishdan iborat. Agar ushbu chiqish qiymati belgilangan chegaradan oshsa, u tarmoqdagi keyingi qatlamga ma'lumotlarni uzatib, tugunni "yondiradi" yoki faollashtiradi. Neyron tarmoqlar gradient tushish jarayoni orqali yo'qotish funktsiyasiga asoslangan tuzatishlardan o'rganadilar. Xarajat funktsiyasi nolga yaqin yoki nolga yaqin bo'lsa, siz modelning to'g'riligiga ishonchingiz komil bo'lishi mumkin.
Naif Bayes: Bu yondashuv Bayes teoremasidan sinfning shartli mustaqilligi tamoyilini qabul qiladi. Bu shuni anglatadiki, bitta xususiyatning mavjudligi ma'lum bir natija ehtimolida boshqasining mavjudligiga ta'sir qilmaydi va har bir bashoratchi ushbu natijaga teng ta'sir qiladi. Naive Bayes tasniflagichlarining uch turi mavjud: Multinomial Naive Bayes, Ber
Yarim nazorat ostida o'qitish algoritmlari
Bunday holda, o'rganish berilgan kirish ma'lumotlarining faqat bir qismi etiketlanganda sodir bo'ladi - algoritmga biroz "boshlang'ich" ni beradi. Ushbu yondashuv ikkala dunyoning eng yaxshi tomonlarini birlashtirishi mumkin10 - nazorat ostida mashinani o'rganish bilan bog'liq yaxshilangan aniqlik va nazoratsiz mashinani o'rganishda bo'lgani kabi, tejamkor yorliqsiz ma'lumotlardan foydalanish qobiliyati.
Mustahkamlash algoritmlari
Bunday holda, algoritmlar xuddi odamlar o'rganganidek, mukofot va jarimalar orqali o'rgatiladi, ular ballni yuqoriga va pastga siljitish ehtimoli haqida umumiy tushunchaga ega bo'lgan mustahkamlovchi o'rganish agenti11 tomonidan o'lchanadi va kuzatiladi. Sinov va xato orqali agent vaqt o'tishi bilan eng qulay natijalarga olib keladigan harakatlarni amalga oshirishni o'rganadi. Resurslarni boshqarish, robototexnika va video o'yinlarda mustahkamlovchi o'rganish ko'pincha qo'llaniladi.
|
| |