218
Oldinlari to
g‘-kon sanoatida oltin qazib olish uchun yer maydonini tanlash
va
undagi topilmalarni k
o‘p marta saralash kerak bo‘lardi. Ba’zida izlovchi bir
nechta qimmatbaho rudalarni topishi yoki u oltin koniga tushib qolishi mumkin,
lekin aksariyat hollarda u hech narsa topolmaydi yoki boshqa istiqbolli joyga
boradi, hatto vaqtni bekor sarflash hisoblab oltinni qazib olishdan butunlay voz
kechadi.
Bugungi kunda yangi ilmiy uslublar va ixtisoslashgan uskunalarning paydo
b
o‘lishi qazish ishlarini ancha aniq va unumli bajarilishiga zamin yaratdi. Data
Mining m
a’lumotlar uchun xuddi shunday rivojlandi. Matematik va statistlar
tomonidan q
o‘llanilgan eski usullar natijasida konstruktiv va foydali
m
a’lumotlarni olish uchun ko‘p vaqt talab qilingan.
Bugungi kunda bozorda k
o‘plab vositalar, shu
jumladan turli xil usullar
mavjud b
o‘lib, Data Miningni ko‘pchilik kompaniyalar uchun tobora ko‘proq
daromad keltiradigan biznesga aylantiradi.
Data Mining atamasi
o‘z nomini ikkita tushunchadan olgan: kata
m
a’lumotlar bazasidan qimmatli ma’lumotlar qidirish (data) va kon rudalarini
qazib olish (mining). Ikkala jarayon ham juda k
o‘p xom-ashyoni elakdan
o‘tkazishni yoki aqlli tadqiqotlar va qimmatli ma’lumotlarni qidirishni talab
qiladi.
Data
Mining atamasi odatda m
a’lumotlarni qazib olish, ma’lumotlarni
ajratish, m
a’lumotlarni intellektual tahlili, qonuniyatlarni qidirish vositasi,
namunalar tahlili deb tarjima qilinadi.
Data Mining tushunchasi 1978-yilda paydo b
o‘lgan bo‘lib 90-yillarning
birinchi yarmidan ommalashdi.
O‘sha vaqtga qadar ma’lumotlarni qayta ishlash
va tahlil qilish, asosan,
kichik m
a’lumotlar bazalarini qayta ishlash
muammolarining hal qilinishini amaliy statistika doirasida amalga oshirildi.
220
Data Mining texnologiyasining mohiyati
va maqsadi quyidagicha
tavsiflanishi mumkin: bu katta hajmdagi m
a’lumotlarni aniq bo‘lmagan, obyektiv
va amalda foydali deb qidirish uchun m
o‘ljallangan texnologiya.
Bilim - bu t
a’riflangan masala, mavzu, muammo va h.k.lar to‘g‘risida ma’lum
darajadagi xabardorlikka mos keladigan yaxlit tavsifni shakllantiruvchi
m
a’lumotlar to‘plamidir.
Bilimlardan foydalanish (knowledge deployment) aniq foydaga erishish
uchun topilgan bilimlarni amalda q
o‘llashni anglatadi (masalan, bozor uchun
raqobatda).
Tadqiqotlardan shuni k
o‘rsatadiki, Data
Miningdan foydalangan holda
muvaffaqiyatli yechimlar va ushbu texnologiya b
o‘yicha yomon tajribalar
mavjud. Data Mining texnologiyasi muvaffaqiyatli b
o‘lishi mumkin bo‘lgan
sohalar quyidagi xususiyatlarga ega:
• bilimga asoslangan yechimlarni talab qilish;
• o‘zgaruvchan muhitga ega bo‘lish;
• ochiq, yetarli va mazmunli ma’lumotlarga ega bo‘lish;
• to‘g‘ri qarorlardan yuqori dividendlar berish.
Data Mining texnologiyasi uzoq vaqt davomida m
a’lumotlarni tahlil
qilishning t
o‘laqonli mustaqil
sohasi sifatida tan olinmagan, ba’zan uni
"statistikaning bir b
o‘lagi" deb atashgan (Pregibon, 1997).
Bugungi kunga kelib, Data Mining b
o‘yicha bir nechta qarashlar mavjud.
Ulardan birining tarafdorlari buni klassik m
a’lumotlarni tahlil qilishdan
chal
g‘itadigan sarob deb bilishadi. Boshqa yo‘nalishni qo‘llab-quvvatlovchilar
Data Miningni tahlil qilishning an'anaviy yondashuvga alternativa sifatida qabul
qiladiganlardir. Shuningdek, hozirda Data
Mining va klassik statistik
m
a’lumotlarni tahlil qilish sohasidagi zamonaviy yutuqlardan birgalikda
foydalanish imkoniyati k
o‘rib chiqilmoqda.
Foydalanilgan adabiyotlar r
o‘yhati:
1.
Чубукова И. А. Data Mining: o‘quv qo‘llanma . - М .: Axborot texnologiyalari
Internet universiteti: 2006. - 382 b. - ISBN 5-9556-0064-7
221
2.
Ian H. Witten, Eibe Frank and Mark A. Hall Data Mining: Practical Machine
Learning Tools and Techniques. - 3rd Edition. - Morgan Kaufmann, 2011. - P.
664. - ISBN 9780123748560