• Parametrlar quyidagicha yangilanadi
  • Toshkent axborot texnologiyalari universiteti urganch filiali kompyuter injineringi fakulteti




    Download 117,37 Kb.
    bet6/8
    Sana22.05.2024
    Hajmi117,37 Kb.
    #250384
    1   2   3   4   5   6   7   8
    Bog'liq
    Vaisbek Davlatov Mustaqil ishi ishi

    RMSProp


    RMSProp (Root Mean Square Propagation) - har bir parametr uchun o'quv ko'rsatkichini moslashtirish usuli. Fikr og'irliklar uchun o'quv ko'rsatkichini o'sha og'irlik uchun so'nggi gradientlarning harakatlanuvchi o'rtacha ko'rsatkichlari bo'yicha bo'lishdir. Shunday qilib, birinchi harakatlanuvchi o'rtacha standart bo'yicha xisoblanadi

    𝑣
    (
    𝑀


    ,
    𝑑
    )
    :=
    Ξ³
    𝑣
    (
    𝑀
    ,
    𝑑
    βˆ’
    1
    )
    +
    (
    1
    βˆ’
    Ξ³
    )
    (
    βˆ‡
    𝑄
    𝑖
    (
    𝑀
    )
    )
    2
    { v(w,t):=\gamma v(w,t-1)+(1-\gamma )(\nabla Q_{i}(w)^{2}}
    Qayerda
    Ξ³{ \gamma } β€” unutish koeffitsienti.


    Parametrlar quyidagicha yangilanadi


    𝑀
    :=


    𝑀
    βˆ’
    Ξ·
    𝑣
    (
    𝑀
    ,
    𝑑
    )
    βˆ‡
    𝑄
    𝑖
    (
    𝑀
    )
    { w:=w-{\frac {\eta }{\sqrt {v(w,t)}}}\nabla Q_{i}(w)}
    RMSProp turli dasturlarda o'quv ko'rsatkichlarining yaxshi moslashuvini ko'rsatdi. RMSPropni Rpropning umumiylashuvi sifatida ko'rish mumkin. Ushbu usul faqat to'liq paketlar bilan emas, balki miniketlar bilan ishlashga qodir [25].
    Odam
    Adam[26] (Adaptive Moment Estimation uchun qisqa) β€” RMSProp optimizerining yangilanishi. Ushbu optimallashtirish algoritmida ham gradient, ham gradient ikkinchi momentlarning harakatlanuvchi o'rtacha ko'rsatkichlari qo'llanadi. Agar parametrlar berilgan bo'lsa
    𝑀
    (
    𝑑
    )
    { w^{(t)}}, va yo'qotish funksiyasi
    𝐿
    (
    𝑑
    )
    { L^{(t)}}, Π³Π΄Π΅
    𝑑
    { t} joriy iteratsiya indeksini aks ettiradi (hisobot bilan boshlanadi
    0
    { 0}), Odam algoritmi bo'yicha parametr qayta hisoblash formulalar bilan belgilangan

    π‘š
    𝑀
    (


    𝑑
    +
    1
    )
    ←
    Ξ²
    1
    π‘š
    𝑀
    (
    𝑑
    )
    +
    (
    1
    βˆ’
    Ξ²
    1
    )
    βˆ‡
    𝑀
    𝐿
    (
    𝑑
    )
    { m_{w}^{(t+1)}\leftarrow \beta _{1}m_{w}^{(t)}+(1-\beta _{1})\nabla _{w}L^{(t)}}
    𝑣
    𝑀
    (
    𝑑
    +
    1
    )
    ←
    Ξ²
    2
    𝑣
    𝑀
    (
    𝑑
    )
    +
    (
    1
    βˆ’
    Ξ²
    2
    )
    (
    βˆ‡
    𝑀
    𝐿
    (
    𝑑
    )
    )
    2
    { v_{w}^{(t+1)}\leftarrow \beta _{2}v_{w}^(t)+(1-\beta _{2})(\nabla _{w}L^{(t)})^{2}}
    π‘š
    ^
    𝑀
    =
    π‘š
    𝑀
    (
    𝑑
    +
    1
    )
    1
    βˆ’
    Ξ²
    1
    𝑑
    +
    1
    { {\hat {m}}_{w}={\frac {m_{w}^(t+1)}}{1-\beta _{1}^{t+1}}}
    𝑣
    ^
    𝑀
    =
    𝑣
    𝑀
    (
    𝑑
    +
    1
    )
    1
    βˆ’
    Ξ²
    2
    𝑑
    +
    1
    { {\hat {v}}_{w}={\frac {v_{w}^(t+1)}}{1-\beta _{2}^{t+1}}}
    𝑀
    (
    𝑑
    +
    1
    )
    ←
    𝑀
    (
    𝑑
    )
    βˆ’
    Ξ·
    π‘š
    ^
    𝑀
    𝑣
    ^
    𝑀
    +
    Ξ΅{ w^{(t+1)}\leftarrow w^{(t)}-\eta {\frac {{\hat {m}}_{w}}{{\sqrt {{\hat {v}}_{w}}}}+\epsilon }}}
    Qayerda
    Ξ΅{ \epsilon } 0 ga bo'linishni oldini olish uchun ishlatiladigan kichik qo'shimcha bo'lib, va
    Ξ²
    1
    { \beta _{1}} iga
    Ξ²
    2
    { \beta _{2}} mos ravishda gradientlar va gradient sekund momentlari uchun koeffitsientlarni unutmoqda. Kvadrat va kvadrat ildiz element bo'yicha hisoblangan.



    Download 117,37 Kb.
    1   2   3   4   5   6   7   8




    Download 117,37 Kb.

    Bosh sahifa
    Aloqalar

        Bosh sahifa



    Toshkent axborot texnologiyalari universiteti urganch filiali kompyuter injineringi fakulteti

    Download 117,37 Kb.