|
Toshkent axborot texnologiyalari universiteti samarqand filiali telekommunikatsiya texnologiyalari va kasb ta
|
bet | 3/5 | Sana | 14.01.2024 | Hajmi | 48,42 Kb. | | #137184 |
Bog'liq M.I 4MNIST ma'lumotlar bazasi (Milliy standartlar va texnologiyalar institutining qisqartmasi) qo'lda yozilgan raqamlar namunalarining to'liq ma'lumotlar bazasidir. Maʼlumotlar bazasi AQSh Milliy standartlar va texnologiyalar instituti tomonidan birinchi navbatda neyron tarmoqlarga asoslangan mashinani oʻrganishdan foydalangan holda tasvirni aniqlash maqsadida taklif qilingan standartdir. Ma'lumotlar oldindan tayyorlangan misol tasvirlaridan iborat bo'lib, ular asosida tizimlar o'qitiladi va sinovdan o'tkaziladi. Ma'lumotlar bazasi NIST 20x20 pikselli qora va oq namunalarning asl to'plamini qayta ishlashdan so'ng yaratilgan. NIST ma'lumotlar bazasini yaratuvchilar, o'z navbatida, AQSh aholini ro'yxatga olish byurosining namunalari to'plamidan foydalanganlar, ularga amerikalik universitet talabalari tomonidan yozilgan ko'proq test namunalari qo'shilgan. NIST to'plamidan olingan namunalar normallashtirildi va 28x28 pikselli kulrang rangdagi tasvirga qisqartirildi.
MNIST ma'lumotlar bazasida o'qitish uchun 60 000 ta rasm va sinov uchun 10 000 ta rasm mavjud. O'quv va sinov namunalarining yarmi NIST o'quv to'plamidan, qolgan yarmi esa NIST test to'plamidan edi.
MNIST ma'lumotlar bazasida o'qitilgandan so'ng minimal xatolikka erishish uchun ko'plab urinishlar bo'lgan va ilmiy adabiyotlarda muhokama qilingan. Rekord natijalar konvolyutsion neyron tarmoqlardan foydalanish bo'yicha nashrlarda ko'rsatilgan, xatolik darajasi 0,23% gacha ko'tarilgan. Ma'lumotlar bazasini yaratuvchilarning o'zlari bir nechta sinov usullarini taqdim etdilar . Asl ish shuni ko'rsatadiki, qo'llab-quvvatlovchi vektor mashinasidan foydalanish 0,8% xato darajasiga erishishi mumkin. U ikkita asosiy kichik to'plamga bo'lingan: 60 000 ta o'quv to'plami tasvirlar va 10 000 ta rasmdan iborat test to'plami. Trening to'plami modelni o'rgatish uchun ishlatiladi, test to'plami esa modelning ishlashini baholash uchun ishlatiladi.
MNIST ma'lumotlar to'plamidagi har bir namunaning tuzilishi quyidagicha: Har bir tasvir 28x28 o‘lchamdagi kulrang shkala piksel qiymatlari matritsasi sifatida taqdim etiladi, bunda har biri piksel qiymati 0 dan 255 gacha bo'lgan butun sondir. Har bir rasm bilan bog‘langan yorliq 0 dan 9 gacha bo‘lgan bitta butun son qiymatidan iborat, tasvir ko'rsatadigan raqamni ko'rsatadi.
MNIST ma'lumotlar to'plami tasvirni aniqlash va tasniflash vazifalari uchun keng qo'llaniladi va unga juda ko'p turli xil algoritmlar, shu jumladan chuqur neyron tarmoqlari, qo'llab-quvvatlash vektor mashinalari, qaror daraxtlari va k-eng yaqin qo'shnilar. Ma'lumotlar to'plami mavjud yangi algoritmlarning ish faoliyatini baholash uchun standart etalonga aylanadi mashinani o'rganish va kompyuterni ko'rish sohasi.
|
| |