|
HDF5 (Ma’lumotlarning ierarxik formatlari)
|
bet | 92/182 | Sana | 19.05.2024 | Hajmi | 5,69 Mb. | | #244351 |
Bog'liq Python sun\'iy intellekt texnologiyasi Dasrlik 2024HDF5 (Ma’lumotlarning ierarxik formatlari)
HDF5 formatini bitta fayl ichida joylashgan va tavsiflangan fayl tizimi deb hisoblash mumkin. Kompyuteringizda saqlangan fayl va papkalar haqida o‘ylab ko‘ring. Ammo HDF5 faylida biz kompyuterlarimizda “kataloglar” yoki
“papkalar” deb ataydigan narsalar groups deb nomlanadi va kompyuterimizdagi fayllar datasets deb ataladi.
Foydalanish holatlarimiz uchun biz barcha tasvirlarni HDF5 formatida saqlaymiz va ularni tasvir tegishli turi va toifasiga qarab turli papkalarga joylashtiramiz.
OpenCV(Ochiq Manba Kompyuter Vision) kutubxonasi
Bu ochiq manbali kompyuter ko‘rish va mashinali o‘qitish dasturlari kutubxonasi. OpenCV kompyuterni ko‘rish ilovalari uchun umumiy infratuzilmani ta’minlash va tijorat mahsulotlarida mashinani idrok etishdan foydalanishni tezlashtirish uchun qurilgan.
Tasvirlar hajmini o‘zgartirish va undan xususiyat vektorlarini yaratish uchun biz OpenCV kutubxonasidan foydalanamiz, bunga rasm ma’lumotlarini numpy massivlariga aylantirish orqali erishish mumkin.
Modelni o‘rgatish uchun biz chuqur neyron tarmoqlarining CNN (Convolutional Neural Network) kengaytmalaridan birini ishlatamiz.
CNN (Convolutional Neyron Network)
Machine Learning yordamida har qanday muammoni hal qilishning muhim jihatlaridan biri ob’ektlar to‘plamidan xususiyatlarni ajratib olishdir. Tasvirga ishlov berishda xususiyatlar to‘plami asosan tasvir yaratilgan har bir pikseldir.
Xususiyatlar to‘plami tasvirning o‘lchamlari va o‘lchamiga bog’liq.
Bir megabaytdagi piksellar soni rasmning rang rejimiga bog’liq.
8 bitli (256 rang) rasmda bir megabaytda 1048576 yoki 1024 X 1024 piksel mavjud.
16 bitli (65536 rang) rasm, bir megabaytda 524288 (1024 X 512) piksel mavjud.
24-bit RGB (16,7 million rang) rasm, bir megabaytda taxminan 349920 (486 X 720) piksel mavjud.
32-bitli CYMK (16,7 million rang) rasm, bir megabaytda 262144 (512 X 512) piksel mavjud.
48 bitli rasm, bir megabaytda atigi 174960 (486 X 360) piksel mavjud.
CNN oddiy taxmin bilan ishlaydi, tasvirdan ba’zi xususiyatlarni aniqlash uchun barcha piksellar talab qilinmaydi.
Tasniflash muammosi uchun biz tasvirlar ichidagi chegaralarni/qirralarni yuqorida ko‘rsatilgan toifalardan biriga tasniflash uchun aniqlaymiz. Shunday qilib, biz asosan CNN yordamida Edge aniqlash muammosini hal qilmoqchimiz.
Konvolyutsion qatlamlar konvolyutsion neyron tarmoqlarda ishlatiladigan asosiy qurilish bloklaridir.
Konvolyutsiya - bu faollashtirishga olib keladigan kirishga filtrning oddiy qo‘llanilishi. Xuddi shu filtrni kiritishga qayta-qayta qo‘llash natijasida funksiyalar xaritasi deb ataladigan faollashuvlar xaritasi, kirishda aniqlangan funksiyaning joylashuvi va kuchini, masalan, tasvirni ko‘rsatadi.
Konvolyutsion neyron tarmoqlarning innovatsiyasi - bu tasvirlarni tasniflash kabi ma’lum bir bashoratli modellash muammosi cheklovlari ostida o‘quv ma’lumotlar to‘plamiga xos bo‘lgan ko‘p sonli filtrlarni parallel ravishda avtomatik ravishda o‘rganish qobiliyati. Natijada kiritilgan tasvirlarning istalgan joyida aniqlanishi mumkin bo‘lgan juda o‘ziga xos xususiyatlar.
CNN ni tushunish uchun konvolyutsiyalar qanday ishlashini tushunishimiz kerak. Keling, har bir katak bitta pikselni ifodalovchi 5x5 qiymat matritsasi sifatida tasvirlangan tasvirni olaylik. Keyin siz 3x3 matritsani olishingiz va tasvir atrofida 3x3 oynani siljitishingiz mumkin. Har bir pozitsiyada tasvirga 3x3 matritsa tashrif buyuradi, biz matritsa uni joriy rasm holatidagi qiymatlar bilan ko‘paytiramiz.
Xulosa qilib aytganda, konvolyutsiya quyidagicha ishlaydi.
7.2.1-rasm. Konvolyutsiya quyidagicha ishlash oynasi
Harakatlanuvchi oyna yadro deb ataladi. Oyna har safar harakatlanadigan masofa qadam deb ataladi.
Konvolyutsion qatlamning maqsadi filtrlashdir. Rasm ustida harakatlanar ekanmiz, tasvirning ushbu qismida naqshlarni samarali tekshiramiz. Bu filtrlar, vektor sifatida ko‘rsatilgan og’irliklar to‘plamlari tufayli ishlaydi, ular konvolyutsiya orqali chiqarilgan qiymatlarga ko‘paytiriladi.
CNNning odatiy arxitekturasi quyidagi komponentlarni o‘z ichiga oladi.
7.2.2-rasm. CNNning odatiy arxitekturasi
Pooling konvolyutsiyaga o‘xshash ishlaydi, farq yadroga qo‘llaniladigan funksiya va tasvir oynasi chiziqli emas.
Eng keng tarqalgan birlashma funktsiyalari maksimal birlashtirish va o‘rtacha birlashtirishdir. Maksimal birlashtirish oynadan maksimal qiymatni oladi, o‘rtacha birlashtirish esa oynadagi barcha qiymatlarning o‘rtacha qiymatini oladi.
|
| |