|
Big Datalarni tahlil qilish uchun Mashinali o‘qitish algoritmlariga umumiy nuqtai
|
bet | 124/182 | Sana | 19.05.2024 | Hajmi | 5,69 Mb. | | #244351 |
Bog'liq Python sun\'iy intellekt texnologiyasi Dasrlik 2024Big Datalarni tahlil qilish uchun Mashinali o‘qitish algoritmlariga umumiy nuqtai
Mashinali o‘qitish - bu odamlar tomonidan osonlikcha qayta ishlanmaydigan va tahlil qilib bo‘lmaydigan katta ma’lumotlar to‘plamini tahlil qilish uchun kuchli vosita. U yangi ma’lumotlar asosida bashorat qilish yoki qaror qabul qilish uchun ma’lumotlardan o‘rganish uchun algoritmlarni o‘rgatishni o‘z ichiga oladi. Katta ma’lumotlar yuqori hajm, tezlik va ma’lumotlarning xilma-xilligi bilan ishlay oladigan maxsus Mashinali o‘qitish usullarini talab qiladi.
Big Datalarni tahlil qilish uchun ishlatiladigan ba’zi mashhur mashina o‘rganish algoritmlari kiradi
Tasodifiy o‘rmon : bir nechta qaror daraxtlarini quradigan va ularni aniq bashorat qilish uchun birlashtiradigan nazorat ostidagi o‘rganish algoritmi.
K-Means Clustering : nazoratsiz o‘rganish algoritmi bo‘lib, o‘xshash elementlarni xususiyatlariga qarab birlashtiradi.
Neyron tarmoqlar : katta ma’lumotlardagi murakkab naqshlarni tahlil qilish uchun inson miyasining tuzilishi va funktsiyasini taqlid qiluvchi chuqur o‘rganish algoritmining bir turi.
Mashinali o‘qitish uchun katta ma’lumotlar to‘plamini oldindan qayta ishlash
Mashinali o‘qitish algoritmlarini katta ma’lumotlar to‘plamlariga qo‘llashdan oldin, ma’lumotlarni tozalash, formatlash va algoritmlar tomonidan osongina tahlil qilinadigan formatga aylantirish orqali oldindan qayta ishlash muhimdir. Bu ko‘pincha quyidagilarni o‘z ichiga oladi:
Yo‘qotilgan qiymatlarni qayta ishlash : nol yoki bo‘sh qiymatlarni tegishli hisob-kitoblar bilan almashtirish yoki ularni butunlay olib tashlash.
Xususiyatlarni masshtablash : turli o‘lchov birliklarida solishtirish mumkin bo‘lgan xususiyatlarni masshtablash.
Ma’lumotlarni kodlash : bitta issiq kodlash kabi usullardan foydalangan holda kategorik o‘zgaruvchilarni raqamli shaklga aylantirish.
Ma’lumotlar to‘plamini o‘quv va sinov to‘plamlariga bo‘lish ham muhim, shunda siz yangi, ko‘rilmagan ma’lumotlarda mashina o‘rganish modelingiz samaradorligini baholashingiz mumkin. O‘quv majmuasi modelni o‘rgatish uchun ishlatiladi, sinov to‘plami esa uning aniqligini o‘lchash uchun ishlatiladi.
|
| |