• Bitta yechim - Apache Spark
  • Spark Disk orniga xotiradan foydalanadi
  • Apache Hadoop va Spark: Ma'lumotlarni tahlil qilish uchun kirish va foydalanish holatlari Abdullayev Jasurbek kontur




    Download 24.83 Kb.
    bet6/12
    Sana25.03.2023
    Hajmi24.83 Kb.
    #46614
    1   2   3   4   5   6   7   8   9   ...   12
    Bog'liq
    Apache Hadoop and Spark Introduction and Use Cases for Data Ana-fayllar.org
    5-SINF Tarix-converted, Mektep sabaqliqlari MB, №3 Amaliy ishi Mavzu Klaster tizimlarini o’rganish Ishdan maqsa, “Operatsiyalar-operandlar” grafigi ko’rinishidagi hisoblash mode, shaxs son zamon kategoriya, husnixat 2, 2-SINF Jismoniy tarbiya, portal.guldu.uz-madaniyat iqtisodiyoti-1, Inf.tex.loyihalashtirish test, Dasturiy mahsulotlarning tasnifi, 7-sinf Matematika 1-ChSB demo (Umumta lim), Ixtisosliklar kesimida, 2-ma\'ruza media va AC ta\'limi, Ma\'ruzalar matni-КРЕДИТ 1-ҚИСМ

    MapReduce- ning kamchiligi


  • Maʼlumotlaringizni Xarita va qisqartirishga majburlaydi

    • Boshqa ish oqimlari etishmayotgan birlashma, filtr, flatMap , groupByKey , birlashma, kesishish, ...

  • Diskdan Diskka (HDFS) "Acyclic Ma'lumotlar oqimi" asosida

  • Xarita va qisqartirishdan oldin va keyin Diskka o'qing va yozing (davlatsiz mashina)

    • Iterativ vazifalar, ya'ni Machine Learning uchun samarali emas

  • Faqat Java mahalliy tomonidan qo'llab-quvvatlanadi

    • Boshqa tillarni qo'llab-quvvatlash kerak

  • Faqat ommaviy qayta ishlash uchun

    • Interaktivlik, oqimli ma'lumotlar

    Bitta yechim - Apache Spark


  • MapReduce-ning ko'pgina kamchiliklarini hal qiladigan yangi umumiy tizim

  • Hadoop ekotizimidan foydalanishga qodir , masalan, HDFS, YARN, HBase , S3, ...

  • Boshqa ko'plab ish oqimlari mavjud, ya'ni qo'shilish, filtrlash, flatMapdistinct , groupByKey , reduceByKey , sortByKey , yig'ish, hisoblash, birinchi ...

    • (taxminan 30 ta samarali taqsimlangan operatsiyalar)

  • Ma'lumotlarni xotirada keshlash (iterativ, grafik va mashinani o'rganish algoritmlari va boshqalar uchun)

  • Native Scala, Java, Python va R-ni qo'llab-quvvatlash

  • Tadqiqot ma'lumotlarini tahlil qilish uchun interaktiv qobiqlarni qo'llab-quvvatlaydi

  • Spark API-dan foydalanish juda oddiy

  • AMPLab UC Berkeleyda ishlab chiqilgan , hozir Databricks.com tomonidan

    Spark Disk o'rniga xotiradan foydalanadi

    Takrorlash 1


    Takrorlash 2
    HDFS o'qiladi
    Takrorlash 1
    Takrorlash 2
    HDFS
    o'qing
    HDFS
    Yozing
    HDFS
    o'qing
    HDFS
    Yozing
    Spark: Xotirada ma'lumotlarni almashish
    Hadoop : Ma'lumot almashish uchun diskdan foydalaning
  • 1   2   3   4   5   6   7   8   9   ...   12




    Download 24.83 Kb.

    Bosh sahifa
    Aloqalar

        Bosh sahifa



    Apache Hadoop va Spark: Ma'lumotlarni tahlil qilish uchun kirish va foydalanish holatlari Abdullayev Jasurbek kontur

    Download 24.83 Kb.