|
Kompyuter injiniring ” fakulteti Kompyuter injiniring
|
bet | 5/27 | Sana | 09.01.2024 | Hajmi | 1,34 Mb. | | #132841 |
Bog'liq 2 deadline Boburjon AMALIY MASHG‘ULOT- 13
Mavzu: NoSQL ma'lumotlar bazalari HBase
Ishning maqsadi: Fayl tizimida (HDFS) ishlash orqali Hadoop-ning kengayish qobiliyatini, kalit/qiymat ombori sifatida real vaqtda ma'lumotlarga kirishni o‘rganish.
HBase Hadoop ma'lumotlar bazasi deb ataladi, chunki u Hadoop tepasida ishlaydigan NoSQL ma'lumotlar bazasi. U Hadoop taqsimlangan fayl tizimida (HDFS) ishlash orqali Hadoop-ning kengayish qobiliyatini, kalit/qiymat ombori sifatida real vaqtda ma'lumotlarga kirish va Map Reduce-ning chuqur tahliliy imkoniyatlarini birlashtiradi. Ushbu maqola HBase bilan tanishtiradi va u ma'lumotlarni qanday tashkil etishi va boshqarishini tavsiflaydi, so'ngra mahalliy HBase muhitini qanday o'rnatish va HBase qobig'i yordamida ma'lumotlar bilan o'zaro ishlashni namoyish etadi.
Apache HBase- bu NoSQL ma'lumotlar bazasi bo'lib, u Hadoop tepasida taqsimlangan va kengaytiriladigan katta ma'lumotlar do'koni sifatida ishlaydi. Bu shuni anglatadiki, HBase Hadoop Distributed File System (HDFS) ning taqsimlangan qayta ishlash paradigmasidan foydalanishi va Hadoop-ning MapReduce dasturlash modelidan foydalanishi mumkin. Bu potentsial millionlab ustunlarga ega bo'lgan milliardlab qatorli katta jadvallarni joylashtirish va tovar apparatlari klasteri bo'ylab ishlash uchun mo'ljallangan. Ammo Hadoop ildizlaridan tashqari, HBase o'ziga xos kuchli ma'lumotlar bazasi bo'lib, real vaqt rejimidagi so'rovlar imkoniyatlarini kalit/qiymat do'koni tezligi va MapReduce orqali oflayn yoki ommaviy qayta ishlash bilan birlashtiradi. Muxtasar qilib aytganda, HBase sizga alohida yozuvlarni so'rash, shuningdek, katta hajmdagi ma'lumotlar bo'yicha jamlangan analitik hisobotlarni olish imkonini beradi.
Bir oz tarixda Google qiyin muammoga duch keldi: Qanday qilib u butun Internet bo'ylab o'z vaqtida qidiruv natijalarini taqdim eta oladi? Javob shundaki, u asosan Internetni keshlashi va bu ulkan keshni tezda qidirishning yangi usulini aniqlashi kerak edi. Buning uchun quyidagi texnologiyalarni aniqladi:
Google fayl tizimi: Katta taqsimlangan ma'lumotlarni talab qiluvchi ilovalar uchun kengaytiriladigan taqsimlangan fayl tizimi
BigTable: Katta o'lchamlarga o'lchash uchun mo'ljallangan tuzilgan ma'lumotlarni boshqarish uchun taqsimlangan saqlash tizimi: minglab tovar serverlarida petabayt ma'lumotlar
MapReduce: Katta ma'lumotlar to'plamlarini qayta ishlash va yaratish uchun dasturlash modeli va tegishli dastur
Google ushbu hujjatlarni e'lon qilganidan ko'p vaqt o'tmay, biz ularning ochiq kodli ilovalarini ko'ra boshladik va 2007 yilda Mayk Kafarella HBase deb nomlangan ochiq manbali BigTable ilovasi uchun kodni chiqardi. O'shandan beri HBase Facebook, Twitter va Adobe-da ishlaydigan yuqori darajadagi Apache loyihasiga aylandi.
HBase relyatsion ma'lumotlar bazasi emas va ma'lumotlaringizni modellashtirishda boshqacha yondashuvni talab qiladi. HBase aslida to'rt o'lchovli ma'lumotlar modelini belgilaydi va quyidagi to'rtta koordinatalar har bir hujayrani belgilaydi (1-rasmga qarang):
Qator kaliti: Har bir satr o'ziga xos qator kalitiga ega; qator kaliti ma'lumotlar turiga ega emas va ichki ravishda bayt massivi sifatida ko'rib chiqiladi.
Ustunlar oilasi: qator ichidagi ma'lumotlar ustunlar oilalariga ajratiladi; har bir satrda bir xil ustunlar oilalari to'plami mavjud, lekin qatorlar bo'ylab bir xil ustunlar oilalari bir xil ustunli kvalifikatsiyalarga muhtoj emas. HBase ostidagi ustunlar oilalarini o'zlarining ma'lumotlar fayllarida saqlaydi, shuning uchun ularni oldindan aniqlash kerak va ustunlar oilalariga o'zgartirish kiritish qiyin.
Ustun kvalifikatori: Ustunlar oilalari ustun kvalifikatsiyalari deb ataladigan haqiqiy ustunlarni belgilaydi. Ustun saralovchilarini ustunlarning o'zi deb o'ylashingiz mumkin.
Versiya: Har bir ustunda sozlanishi mumkin boʻlgan sonli versiyalar boʻlishi mumkin va siz ustun kvalifikatsiyasining maʼlum bir versiyasi uchun maʼlumotlarga kirishingiz mumkin.
|
| |