|
Mashinali o’qitishning o’qituvchisiz(unsupervised) o’qitish algoritmlari
|
bet | 9/10 | Sana | 14.05.2024 | Hajmi | 1,17 Mb. | | #232713 |
Bog'liq Masharipov Sanatbek mashinali o\'qitish3. Mashinali o’qitishning o’qituvchisiz(unsupervised) o’qitish algoritmlari.
O’qituvchisiz o’qitish (unsupervised learning) – bu mashinani o’qitish usulidan biri bo’lib, bunda modelni oldindan aniq bo’lgan ma’lumotlar bilan o’qitish amalga oshirilmaydi, aksincha obyekt parametrlarini (ma'lumotlarni) topish uchun modelga o'z ustida ishlashga imkon yaratib beriladi. Supervised learning usuliga qaraganda murakkab usul hisoblanadi va bashoratlash jarayoni avtomatik lekin noaniqroq bo’lishi mumkin. Unsupervised learning usulida asosan “klasterlash” masalasi yechiladi.
12-rasm. O’qituvchisiz o’qitish.
O’qituvchisiz o’qitishning maqsadi ma’lumotlarhaqida ko’proq ma’lumot olish uchun ma’lumotlar tarkibidagi asosiy tuzilmani yoki taqsimotni modellashtirishdir. Bular o’qituvchisiz o’qitish deb nomlanadi, chunki yuqoridagi o’qituvchili o’qitishdan farqli ravishda to’g’ri ma’lumotlar yo’q va nazoratga oluvchi yo’q.
O’qituvchisiz o’qitishda muommolarni klasterlash va assotsiatsiya masalalariga bo’lib o’rganiladi.
Klasterlash ma’lumotlar tarkibidagi guruhlarni topish va ularni saralashdan iborat
Assotsiatsiya – bu ma’lumotlarning kata qismlarni tavfsiflovchi belgilarni toppish, Misol uchun X ni soyib olganlar Y ni ham soyib olishadi.
O’qituvchisiz o’qitish algoritmlari quyidagilardan iborat:
k-metodili algoritm klasterlash muommolari uchun;
Aprior algoritmi asosiatsiya qoidalari bo’yicha masalalarni yechish uchun.
Mashinali o’qitishda o’qituvchili va o’qituvchisiz o’qitishning afzalliklari va kamchiliklari.
Nazorat ostidagi ta'lim jarayonida siz mashinani yaxshi "belgilangan" ma'lumotlardan foydalangan holda o'rgatasiz.
Nazorat qilinmagan o'rganish - bu mashinani o'rganish texnikasi, bu erda siz modelni nazorat qilishingiz shart emas.
Nazorat ostidagi o'rganish ma'lumotlarni to'plash yoki oldingi tajribadan olingan ma'lumotlarni ishlab chiqarish imkonini beradi.
Nazorat qilinmagan mashinalarni o'rganish ma'lumotlardan har qanday noma'lum naqshlarni topishga yordam beradi.
Masalan, siz ob-havo sharoiti, kunning vaqti va ta'tiliga qarab qaytib kelish uchun vaqtni aniqlay olasiz.
Masalan, Baby boshqa itlarni o'tmishda kuzatilgan ta'lim asosida aniqlashi mumkin.
Regressiya va tasniflash - bu nazorat qilinadigan mashinalarni o'rganish texnikasining ikki turi.
Klasterlash va assotsiatsiya - bu nazoratsiz o'rganishning ikki turi.
Nazorat qilinmagan o'quv modelida kirish va chiqish o'zgaruvchilari beriladi, nazoratsiz o'qitish modeli bilan faqat kirish ma'lumotlari beriladi
O’qituvchisiz (unsupervised) o’qitish algoritmlari, mashinalarning öz-o'rganuvchan qobiliyatlarga ega bo'lishini ta'minlash uchun ishlatiladi. Bu algoritmlar, e'lon qilinmagan ma'lumotlar to'plamidan o'rganish va ulardan foydalanib ma'lumotlarni tahlil qilishni o'rganishga harakat qiladi. Bu algoritmlar, ma'lumotlar orasidagi tarz, kategoriya yoki o'zaro bog'liqliklarni aniqlashga yordam berishadi.
Quyidagi mashinali o’qitishning o’qituvchisiz algoritmlari bilan tanishishingiz mumkin:
Clusterlash (Guruhlash): Bu algoritm, ma'lumotlar to'plamini o'ziga xos guruhlarga bo'lib ajratishda ishlatiladi. Ma'lumotlar o'zlarining o'xshashliklari, o'xshashliklari yoki o'xshashliklari bo'lmaganligi asosida guruhlarga ajratiladi. K-means, DBSCAN va Hierarchical clusterlash kabi algoritmlar bu yo'nalishga kiradi.
Görüntü işleme (Image Processing): O'qituvchisiz algoritmlar görüntü işleme va kompyuterli ko'rib chiqish sohasida keng qo'llaniladi. Bu algoritmlar, görüntülerdagi ob'ektlarni aniqlash, nusxalash, qayta tiklash va boshqa operatsiyalarni bajarish uchun ishlatiladi. Örnek algoritmalardan biri, görüntülerdagi foydalanishni o'rganish uchun kullanılan Öz-o'rganuvchan taniyish algoritmasidir (PCA).
İlgarilik analizi (Association Analysis): Bu algoritmlar, ma'lumotlardagi ilgarliklarni aniqlash va qayta tiklash uchun ishlatiladi. Bu ilgarliklar, ma'lumotlar to'plamidagi ob'ektlar orasidagi bog'liqlik va ulardagi o'zgaruvchanliklarga asoslanganliklarni aniqlaydi. Apriori algoritmasi, ilgarlik analizi uchun keng qo'llaniladigan bir algoritmadir.
Boylam analizi (Dimensionality Reduction): Bu algoritmlar, ma'lumotlar to'plamidagi xususiyatlarni kichraytirish yoki o'zaro bog'liqliklarni aniqlash uchun foydalaniladi. Bu, ma'lumotlar to'plamining o'lchami katta bo'lgandagina yoki ma'lumotlar o'zaro bog'liqliklarining ko'p bo'lganligida foydali bo'ladi. Örnek algoritmalardan biri Principal Component Analysis (PCA) algoritmasidir.
Aniqlash (Anomaly Detection): Bu algoritmlar, ma'lumotlar to'plamidagi anormalliklarni aniqlash uchun ishlatiladi. Anormalliklar, odatiy holatdan farq qiladigan ma'lumot ob'ektlarini aniqlashda yordam beradi. Bu algoritmlar, anormalliklarni aniqlash uchun iste'mol qilinadigan statistik metodlarni va ma'lumotlar to'plami orasidagi o'zgaruvchanliklarni o'rganishga qaratilgan algoritmlardir.
Bu, mashinali o’qitishning o’qituvchisiz algoritmlari bilan tanishish uchun faqat bir nechta misollar. Boshqa ham bir nechta o’qituvchisiz algoritmlar mavjud, va har biri ma'lum bir vazifani bajarish uchun ma'lumotlar to'plamkerakli bo'lgan algoritmlarni taqdim etadi. Har bir algoritma o'ziga xos xususiyatlarga ega bo'lishi mumkin va har biri ma'lumotlarni tahlil qilishda foydalaniladigan bir usulni o'z ichiga oladi.
Bu erda nazoratsiz o'rganish algoritmlari haqida ba'zi qo'shimcha tafsilotlar:
Generativ modellar: Generativ modellar ma'lumotlarning asosiy taqsimotini modellashtirishga qaratilgan nazoratsiz o'rganish algoritmlari. Ular kiritilgan ma'lumotlarning statistik xususiyatlarini o'rganadilar va asl ma'lumotlarga o'xshash yangi namunalarni yaratishlari mumkin. Generativ modellarga misol sifatida Gauss aralashmasi modellari (GMM), yashirin Markov modellari (HMM) va variatsion avtokoderlar (VAE) kiradi.
Yashirin o'zgaruvchan modellar: Yashirin o'zgaruvchan modellar kuzatilgan ma'lumotlarni tushuntiruvchi yashirin yoki yashirin omillarni aniqlashga qaratilgan. Ular kuzatilgan ma'lumotlar ko'rinadigan o'zgaruvchilar va yashirin o'zgaruvchilar kombinatsiyasi tomonidan yaratilgan deb taxmin qilishadi. Maqsad, kuzatilgan ma'lumotlar asosida yashirin o'zgaruvchilarning qiymatlarini chiqarishdir. Yashirin Dirichlet taqsimoti (LDA) - mavzuni modellashtirish uchun ishlatiladigan mashhur yashirin o'zgaruvchan model.
Zichlikni baholash: Zichlikni baholash algoritmlari kiritilgan ma'lumotlarning ehtimollik zichligi funksiyasini baholashga qaratilgan. Ular ma'lumotlar taqsimotining taqdimotini taqdim etadi, bu esa chegaralarni aniqlash va anomaliyalarni aniqlash kabi vazifalar uchun foydali bo'lishi mumkin. Yadro zichligini baholash (KDE) va Gauss aralashmasi modellari (GMMs) keng tarqalgan bo'lib foydalaniladigan zichlikni baholash usullaridir.
Ko'p tomonlama o'rganish: Ko'p o'lchovli o'rganish algoritmlari yuqori o'lchamli ma'lumotlarda pastki o'lchamli strukturani yoki manifoldni ochishga qaratilgan. Ular murakkab ma'lumotlarning o'lchamini kamaytirish va vizualizatsiya qilish uchun ishlatilishi mumkin. Manifold o'rganish algoritmlariga misollar t-SNE (t-Distributed Stochastic Neighbor Embedding) va Isomap.
Mustahkamlovchi ta’lim: Mustahkamlovchi ta’lim asosan nazorat ostidagi ta’lim sohasi bilan bog‘liq bo‘lsa-da, nazoratsiz mustahkamlovchi o‘rganish algoritmlari ham mavjud. Ushbu algoritmlar aniq nazoratsiz sinov va xato orqali optimal siyosatni o'rganishga qaratilgan. Ular atrof-muhitni o'rganadilar, o'z harakatlarining oqibatlaridan saboq oladilar va mukofot va jazolar asosida xatti-harakatlarini optimallashtiradilar.
Xulosa
Shuni ta'kidlash kerakki, nazoratsiz o'rganish algoritmlari trening uchun belgilangan ma'lumotlarga tayanmaydi. Buning o'rniga, ular qimmatli tushunchalarni taqdim etishi va ma'lumotlarni tahlil qilish, namunani aniqlash va qaror qabul qilishda turli xil ilovalarga olib keladigan etiketlanmagan ma'lumotlardan naqshlar, tuzilmalar yoki munosabatlarni olishga e'tibor qaratadi.
|
| |