INTERNATIONAL SCIENTIFIC AND TECHNICAL CONFERENCE
“DIGITAL TECHNOLOGIES: PROBLEMS AND SOLUTIONS OF PRACTICAL
IMPLEMENTATION IN THE SPHERES”
APRIL 27-28, 2023
326
HADOOP HDFS ORQALI KATTA HAJMLI MA’LUMOTNI TAQSIMLANGAN
SAQLASH TIZIMLARIDA SAQLASH
1
Quzibayev Xudayshukur Shavkat o'g'li,
2
O‘razmatov Tohir Quronbayevich,
3
Bekimmetova Durdona Ikromjon qizi,
4
Egamov Zafarbek Raximboy o'g'li
1
Muhammad Al Xorazmiy nomidagi Toshkent Axborot Texnologiyalari Universiteti doktoranti
2
Muhammad Al Xorazmiy nomidagi Toshkent Axborot Texnologiyalari Universiteti Urganch
filiali, katta o’qituvchi
3
Muhammad Al Xorazmiy nomidagi Toshkent Axborot Texnologiyalari Universiteti Urganch
filiali,
talaba
4
Muhammad Al Xorazmiy nomidagi Toshkent Axborot Texnologiyalari Universiteti Urganch
filiali, stajyor o’qituvchi
https://doi.org/10.5281/zenodo.7856340
Annotatsiya. Ushbu maqolada biz katta hajmli ma’lumot sifatida qarash mumkin bo’lgan
tarixiy asarni Hadoop HDFS orqali taqsimlangan saqlash tizimlarida saqlash jarayonini ko’rib
o’tdik. Buning uchun katta hajmdagi ma’lumot sifatida o’zbek adibi Abdulla Qodiriyning “O’tkan
kunlar” asarini oldik.
Kalit so’zlar: Big Data, Hadoop HDFS, Hadoop MapReduce, taqsimlangan saqlash tizimi
Kirish
Dunyoda raqamlangan ma'lumotlar hajmi shiddat bilan o’sib bormoqda. Bu o’z
navbatida raqamli ma’lumotlarni saqlab qo’yich, ularni saralash, qayta
ishlash va ular asosida
xulosalar chiqarish kabi muommolarni yuzaga chiqaradi. Bu muommolarni o’rganish va yechimlar
taklif qilish uchun axborot texnologiyalari sohasida Big data, Data science (malumotlar ilmi), Data
mining (ma'lumotlarni intelektual tahlili), Machine learning (mashinali o'qitish), Deep learning
(chuqur o'qitish), Sun'iy neyron tarmog'i kabi fan tarmoqlari vujudga keldi. Biz ushbu maqolada
tadqiq qilgan qilgan muommo BigData (katta hajmli ma’lumotlar) sohasiga tegishli.
Hozirgi
kundagi ma’lumotlarning keskin oshib borish fonida, ularni saqlash
va tezkor qayta ishlash
masalasi mavuning dolzarbligini ko’rsatadi.
Tadqiqot obyekti sifatida o’zbek adibi Abdulla Qodiriyning “O’tkan kunlar” asarini katta
hajmli ma’lumot sifatida belgilab oldik. Tadqiqot predmeti sifatida esa katta hajmli ma’lumotlarni
saqlash uchun ishlatiladigan Apache Hadoop HDFS hamda ma’lumotlarni parallel qayta ishlovchi
Hadoop MapReduce dasturlarini belgilab oldik.
Izlanishlarimizning vazifalari sifatida quyidagilarni belgilab oldik:
Katta hajmli ma’lumotni taqsimlangan fayl tizimlarida saqlash
Katta hajmli ma’lumotni parallel hisoblash yordamida qayta ishlab
natija olish
Olingan natijalarni solishtirib xulosalar chiqarish
Obyekt sifatida belgilab olganimiz Abdulla Qodiriyning “O’tkan kunlar”
asarining
elektron shakldagi talqinini topamiz. 220 betdan iborat elektron matn shakldagi asarni .txt
formatiga o’tkazib olamiz.