Apache Hadoop va Spark: Ma'lumotlarni tahlil qilish uchun kirish va foydalanish holatlari Abdullayev Jasurbek kontur

Download 24.83 Kb.
bet	6/12
Sana	25.03.2023
Hajmi	24.83 Kb.
	#46614

1 2 3 4 5 6 7 8 9 ... 12

Bog'liq
Apache Hadoop and Spark Introduction and Use Cases for Data Ana-fayllar.org
5-SINF Tarix-converted, Mektep sabaqliqlari MB, №3 Amaliy ishi Mavzu Klaster tizimlarini o’rganish Ishdan maqsa, “Operatsiyalar-operandlar” grafigi ko’rinishidagi hisoblash mode, shaxs son zamon kategoriya, husnixat 2, 2-SINF Jismoniy tarbiya, portal.guldu.uz-madaniyat iqtisodiyoti-1, Inf.tex.loyihalashtirish test, Dasturiy mahsulotlarning tasnifi, 7-sinf Matematika 1-ChSB demo (Umumta lim), Ixtisosliklar kesimida, 2-ma\'ruza media va AC ta\'limi, Ma\'ruzalar matni-КРЕДИТ 1-ҚИСМ

Bitta yechim - Apache Spark
Spark Disk orniga xotiradan foydalanadi

MapReduce- ning kamchiligi

Maʼlumotlaringizni Xarita va qisqartirishga majburlaydi

Boshqa ish oqimlari etishmayotgan birlashma, filtr, flatMap , groupByKey , birlashma, kesishish, ...

Diskdan Diskka (HDFS) "Acyclic Ma'lumotlar oqimi" asosida

Xarita va qisqartirishdan oldin va keyin Diskka o'qing va yozing (davlatsiz mashina)

Iterativ vazifalar, ya'ni Machine Learning uchun samarali emas

Faqat Java mahalliy tomonidan qo'llab-quvvatlanadi

Boshqa tillarni qo'llab-quvvatlash kerak

Faqat ommaviy qayta ishlash uchun

Interaktivlik, oqimli ma'lumotlar

Bitta yechim - Apache Spark

MapReduce-ning ko'pgina kamchiliklarini hal qiladigan yangi umumiy tizim

Hadoop ekotizimidan foydalanishga qodir , masalan, HDFS, YARN, HBase , S3, ...

Boshqa ko'plab ish oqimlari mavjud, ya'ni qo'shilish, filtrlash, flatMapdistinct , groupByKey , reduceByKey , sortByKey , yig'ish, hisoblash, birinchi ...

(taxminan 30 ta samarali taqsimlangan operatsiyalar)

Ma'lumotlarni xotirada keshlash (iterativ, grafik va mashinani o'rganish algoritmlari va boshqalar uchun)

Native Scala, Java, Python va R-ni qo'llab-quvvatlash

Tadqiqot ma'lumotlarini tahlil qilish uchun interaktiv qobiqlarni qo'llab-quvvatlaydi

Spark API-dan foydalanish juda oddiy

AMPLab UC Berkeleyda ishlab chiqilgan , hozir Databricks.com tomonidan

Spark Disk o'rniga xotiradan foydalanadi

Takrorlash 1

Takrorlash 2
HDFS o'qiladi
Takrorlash 1
Takrorlash 2
HDFS
o'qing
HDFS
Yozing
HDFS
o'qing
HDFS
Yozing
Spark: Xotirada ma'lumotlarni almashish
Hadoop : Ma'lumot almashish uchun diskdan foydalaning

Download 24.83 Kb.

1 2 3 4 5 6 7 8 9 ... 12

Download 24.83 Kb.