Bog'liq ma-lumotlarni-intelektual-tahlil-qilishda-data-mining-qo-llash
www.scientificprogress.uz
Page 135
beradi. Tasniflash masalasidan farqli o'laroq, parametrning qiymati cheklangan sinflar
to'plami emas, balki haqiqiy sonlar to'plamidir.
3) Assotsiatsiya vazifasi. Assotsiatsiya qoidalarini qidirishda maqsad ob'ektlar yoki
hodisalar o'rtasidagi tez-tez bog'liqliklarni (yoki assotsiatsiyalarni) topishdir. Topilgan
bog'liqliklar qoidalar ko'rinishida taqdim etilgan va tahlil qilingan ma'lumotlarning
mohiyatini yaxshiroq tushunish uchun ham, voqealar sodir bo'lishini bashorat qilish
uchun ham ishlatilishi mumkin.
4) Klasterlashning vazifasi mustaqil guruhlar (klasterlar) va ularning xususiyatlarini
tahlil qilinayotgan ma'lumotlarning butun majmuasida izlashdan iborat. Ushbu
muammoni hal qilish ma'lumotlarni yaxshiroq tushunishga yordam beradi. Bundan
tashqari, bir hil ob'ektlarni guruhlash ularning sonini kamaytirishga va natijada tahlilni
osonlashtirishga imkon beradi.
5) Ketma-ket naqshlar - vaqt bilan bog'liq bo'lgan hodisalar o'rtasida qonuniyatlarni
o'rnatish, ya'ni. Agar X voqea sodir bo'lsa, Y hodisasi ma'lum vaqtdan keyin sodir
bo'lishiga bog'liqlikni aniqlash.
6) og'ishlarni tahlil qilish - eng xarakterli bo'lmagan naqshlarni aniqlash.
Sanab o'tilgan vazifalar maqsadiga ko'ra tavsiflovchi va bashoratli bo'linadi.
Ta'riflash vazifalari tahlil qilinayotgan ma'lumotlarni tushunishni yaxshilashga
qaratilgan. Bunday modellardagi asosiy nuqta - natijalarning inson idroki uchun
qulayligi
va
shaffofligi.
Ehtimol,
topilgan
naqshlar
o'rganilayotgan
aniq
ma'lumotlarning o'ziga xos xususiyati bo'lib, boshqa joyda topilmaydi, lekin u hali ham
foydali bo'lishi mumkin va shuning uchun ma'lum bo'lishi kerak. Ushbu turdagi
muammolar klasterlash va assotsiatsiya qoidalarini qidirishni o'z ichiga oladi.
Bashoratli masalalarni yechish ikki bosqichga bo'linadi. Birinchi bosqichda
ma'lum natijalarga ega bo'lgan ma'lumotlar to'plamiga asoslangan model quriladi.
Ikkinchi bosqichda u yangi ma'lumotlar to'plamiga asoslangan natijalarni bashorat qilish
uchun ishlatiladi. Bunday holda, albatta, qurilgan modellarning iloji boricha aniq
ishlashi talab qilinadi. Ushbu turdagi muammolar tasniflash va regressiya
muammolarini o'z ichiga oladi. Bu, shuningdek, assotsiatsiya qoidalarini topish
muammosini o'z ichiga oladi, agar uni hal qilish natijalaridan ma'lum voqealar sodir
bo'lishini
taxmin
qilish
uchun
foydalanish
mumkin
bo'lsa.
Muammolarni hal qilish usullariga ko'ra ular nazorat ostida o'qitish (o'qituvchi bilan
o'qitish) va nazoratsiz ta'lim (o'qituvchisiz o'rganish) ga bo'linadi. Bu nom ingliz tilidagi
adabiyotlarda tez-tez ishlatiladigan va barcha Data Mining texnologiyalariga ishora
qiluvchi Machine Learning (mashinalarni o'rganish) atamasidan kelib chiqqan.
Nazorat ostida o'qitishda ma'lumotlarni tahlil qilish muammosi bir necha
bosqichda hal qilinadi. Birinchidan, har qanday Data Mining algoritmidan foydalanib,
tahlil qilingan ma'lumotlarning modeli - klassifikator quriladi. Keyin klassifikator