|
Matematika-informatika akulteti axborot texnologiyalari kafedrasi big data va ma
|
bet | 16/19 | Sana | 05.01.2024 | Hajmi | 60,21 Kb. | | #130807 |
Bog'liq Matematika-informatika akulteti axborot texnologiyalari kafedras-fayllar.orgМаълумот - бу бирор бир объект, жараѐн, ходиса ѐки воқеликни ифодалаб (таснифлаб) берувчи белги ѐки белгилар мажмуасидир. Берилган маълумот (белги)лар қандай қиймат қабул қилишига қараб маълумотларнинг бир қанча турлари мавжуд.
D
Megabayt: 1 MB = 106 bayt
Gigabayt: 1 GB = 109 bayt
Terabayt: 1 TB = 1012 bayt
Petabayt: 1 PB = 1015 bayt
Eksobayt: 1 EB = 1018 bayt Zettabayt: 1 ZB = 1021 bayt
unyoda qancha raqamli ma'lumotlar to'plangan? 2015-16 yillarda insoniyat tomonidan yaratilgan raqamli axborot miqdori 4 zettabayt ma'lumotni tashkil etdi. 2020 yilgacha bu hajm 40 zettabaytgacha oshishi kutilmoqda.
1000 sahifali bitta elektron kitob taxminan 3 megabaytni tashkil qiladi, shuning uchun bu 2,73 TB ma'lumotni o'z ichiga olgan kutubxona taxminan bir kvadrillion jildni o'z ichiga olishi kerak.
Shu bilan birga, hozir dunyoda 130 millionga yaqin kitoblar mavjudligi ma'lum. Ularning axborot imkoniyatlarini baholash juda qiyin. Taxminan 10 million jild bor, ular haqiqatda foydali ma'lumotlarni o'z ichiga oladi. Elektron shaklda yozishda ular 30 Ptb oladi, ya'ni. barcha to'plangan ma'lumotlardan million marta kamroq. Bu birlamchi ma'lumot va uni konsentratsiyalangan shaklga - bilimga tarjima qilish natijasi o'rtasidagi farqni ko'rsatadi.
Juda katta ma'lumotlar bazasi (VLDB) - bu jismoniy xotira qurilmasida juda katta hajmdagi joyni egallaydigan ma'lumotlar bazasi. Bu atama ma'lumotlar bazasining maksimal mumkin bo'lgan hajmlarini anglatadi, ular jismoniy ma'lumotlarni saqlash texnologiyalari va dasturiy ta'minot bilan ishlash texnologiyalaridagi so'nggi yutuqlar bilan belgilanadi.
“O‘ta katta hajm” tushunchasining miqdoriy ta’rifi vaqt o‘tishi bilan o‘zgarib turadi. Shunday qilib, 1997 yilda dunyodagi eng katta matnli ma'lumotlar bazasi 7 terabayt hajmli Knight Ridderning DIALOG edi. 2001 yilda eng katta ma'lumotlar bazasi 10,5 terabayt, 2003 yilda - 25 terabayt deb hisoblangan. 2005 yilda dunyodagi eng katta ma'lumotlar bazalari yuzlab terabayt hajmli saqlash joyi deb hisoblangan. 2006 yilda Google qidiruv tizimi 850 terabaytlik ma'lumotlar bazasidan foydalangan
2010 yilga kelib, ultra-katta ma'lumotlar bazasi hajmi kamida petabaytlarda o'lchanishi kerak deb hisoblangan.
2014 yilga kelib, bilvosita hisob-kitoblarga ko'ra, Google o'z serverlarida jami 10-15 ekzabaytgacha ma'lumotlarni saqlagan.
Ba'zi hisob-kitoblarga ko'ra, 2025 yilga borib, genetiklar 100 milliondan 2 milliardgacha odamning genomlari to'g'risida ma'lumotlarga ega bo'lishadi va bu hajmdagi ma'lumotlarni saqlash uchun 2 dan 40 ekzabaytgacha kerak bo'ladi.
Shunday qilib, tahlilchilar qo'lida ishlab chiqarish jarayonlarini monitoring qilish natijasida olingan, ommaviy tibbiy ko'riklar jarayonida to'plangan yoki sotsiologik so'rovlar jarayonida to'plangan juda katta hajmdagi ma'lumotlar mavjud. Buning nima keragi bor? Ushbu ma'lumotlar o'z-o'zidan foydasiz va undan foydali bilimlarni olish uchun qayta ishlanishi kerak.
Bilim - bu ma'lum bir fan sohasidagi mutaxassislarning tajribasini rasmiylashtiradigan va dastlabki ma'lumotlarda aniq ko'rsatilmagan javoblar (yechimlar) berishga imkon beradigan faktlar va qoidalar.
Bilimning o'zi kerak emas, lekin boshqaruv qarorlarini shakllantirish uchun uni amalga oshirish mumkin.
O'z navbatida, qabul qilinayotgan qarorlarning sifati nazorat tizimlarining samaradorligi va ularni muayyan fan sohalarida amalga oshirish orqali baholanadi.
Masalan, sanoatda boshqaruv qarorlarining yakuniy sifati, qoida tariqasida, korxonaning iqtisodiy samaradorligi nuqtai nazaridan baholanadi.
Axborot tahlilining uch darajasi
Semiotika (imo-ishora tizimlari haqidagi fan) g‘oyalari nuqtai nazaridan ma’lumotlarning adekvatligi
ma'lumot, uning mazmunining ko'rsatilgan ob'ekt tasviriga mos kelishi uchta shaklda ifodalanishi mumkin:
sintaktik;
semantik;
pragmatik.
Sintaktik adekvatlik aks ettirishning rasmiy tuzilmaviy xususiyatlarini takrorlash, semantik va iste'mol parametrlaridan abstraktsiyalash bilan bog'liq. Sintaktik darajada quyidagilar hisobga olinadi: media turi, tasvirlash usuli, uzatish va qayta ishlash tezligi, kod formati, konversiyaning ishonchliligi va aniqligi va boshqalar. Shu bilan birga, axborot o'z tashuvchisining energiya va fazo-vaqt xususiyatlariga nisbatan o'zgarmasdir. Xuddi shu ma'lumot turli xil kodlarda mavjud bo'lishi mumkin.
Semantik shakl tushuncha va g'oyalarning shakllanishini, ma'no, ma'lumot mazmunini aniqlashni ta'minlaydi. Xabardagi semantik ma'lumotlarning miqdori nisbiy qiymatdir: bir xil xabar vakolatli foydalanuvchi uchun semantik tarkibga ega bo'lishi va qobiliyatsiz foydalanuvchi uchun ma'nosiz (semantik shovqin) bo'lishi mumkin.
Axborotni ko'rib chiqishning pragmatik jihati uning qiymati, foydaliligi va tizim maqsadlariga erishish uchun amaliy foydalanish bilan bog'liq.
|
| |