10-DARS
BIG DATA VA DATA MINING
67
Big Data
– vaqt o‘tgan sayin o‘sib
boruvchi katta
ma’lumotlar to‘plami. U o‘zida ma’lumotlar ustida amallar
bajarishga yo‘naltirilgan texnik va dasturiy vositalarni
jamlaydi. An’anaviy ma’lumotlar
bazasidan farqli ravishda,
Big Data katta hajmdagi ma’lumotlarni yig‘ish, qayta
ishlash va uzatish imkoniyatlarini taqdim etadi.
Bu esa
ma’lumotlarni samarali tahlil qilish orqali kerakli axborotni
qo‘lga kiritishga yordam beradi. Big Datani yaxshiroq tushunish
uchun uning tur va
xususiyatlarini yaxshi bilishimiz lozim.
Big Data 3 ta asosiy turga bo‘linadi:
•
1) tuzilmalashtirilgan;
•
2) tuzilmalashtirilmagan;
•
3) yarim tuzilmalashtirilgan.
Tuzilmalashtirilgan Big Data
– aniq formatda qayta ishlanishi,
saqlanishi va olinishi
mumkin bo‘lgan katta ma’lumotlar to‘plami. U oddiy jadval ko‘rinishidagi ma’lumotlar
bo‘lishi mumkin. Ya’ni bunda ma’lumotlar oldindan tartibli ravishda tuzilgan bo‘ladi. Bunga
misol tariqasida maktab o‘quvchilari haqidagi elektron jadvalni keltirish mumkin.
Tuzilmalashtirilmagan Big Data
– aniq shakl yoki tuzilishga ega bo‘lmagan katta
hajmdagi ma’lumotlar to‘plami. Misol tariqasida elektron
pochta manziliga kelayotgan
xabarlarni keltirish mumkin. Pochtaga kelgan ma’lumotlar tartibsiz,
turli fayl formatlarida
(matn, audio, video, tasvir, hujjat) bo‘ladi. Tuzilmalashtirilmagan ma’lumotlarni qayta
ishlash yoki tahlil qilish qiyin va ko‘p vaqtni talab etadi.
Yarim tuzilmalashtirilgan Big Data
– bir vaqtning o‘zida tuzilmalashtirilgan va
tuzilmalashtirilmagan ma’lumotlarni o‘z ichiga olgan katta ma’lumotlar to‘plami.
Big Dataning xususiyatlari
Big Data 5 ta asosiy xususiyati orqali oddiy ma’lumotlar bazasidan ajralib turadi.
1. Hajm
Big Data o‘zida katta hajmdagi ma’lumotlarni saqlashi va ularni boshqarishi mumkin.
An’anaviy MBBT vositalari esa katta hajmdagi ma’lumotlar bilan ishlay olmaydi.
Download