1.5 Kompyuterni ko'rishda chuqur o'rganish yutuqlari
Machine Translated by Google
1.1-jadval: Tasvirlarni tasniflash bo'yicha yuqori o'rinli guruhlarning ishlashi
ILSVRC 2012. ImageNet-dan olingan har bir tasvir bir nechta ob'ektni o'z ichiga olishi mumkinligi
sababli, baholash uchun odatda top-5 xatolik darajasi ishlatilgan. Chuqur o'rganish boshqalardan ustun keldi
10% dan ortiq qo'lda tayyorlangan xususiyatlarga asoslangan kompyuter ko'rish usullari.
Toÿliq matn: http://dx.doi.org/10.1561/2000000071
Qo'lda ishlangan xususiyatlar
Ularning tasniflash aniqliklari orasidagi farqlar kamroq edi
Top-5 xatolik darajasi (%)
26.979
odamlar inqilobiy yutuqni chuqur olib kelganiga ishonishdi
ImageNet tasvirni tasniflash vazifasi va ob'ektga chuqur CNN
PSACAL VOC da aniqlash. Aniqlash darajasi 20% ga yaxshilandi.
ko'rish muammolari mos ravishda yaxshilanishi mumkin. Shuning uchun, chuqur o'rganish
U. Tokio 3
U. Oksford 4 Xerox/
INRIA
1
Tavsif
Baholash uchun odatda top-5 xatolik darajasi ishlatilgan. Tasniflash
ImageNet-dan o'rganilgan xususiyatlarni yaxshi umumlashtirish mumkin
Chuqur o'rganish
ularni 10% dan ko'proq ortda qoldirib, eng yaxshi 5 xatolik darajasiga erishdi
Qo'lda ishlangan xususiyatlar
1.5. Kompyuterni ko'rishda chuqur o'rganish yutuqlari
15.132
ikkita GPU bilan amalga oshiriladi.
[69]. Masalan, boshqa taniqli ob'ektni aniqlash va aniqlash
chuqur modellarni o'rgatish. Girshick va boshqalar. [56] oÿrganilgan xususiyatlarni qoÿllagan
bu sohani o'rganish. Ko'p o'tmay, odamlar ingl
27.058
1%. ImageNet-dan olingan har bir rasmda bir nechta ob'ektlar bo'lishi mumkinligi sababli,
Daraja
Bu xulosa sezilarli ta'sir ko'rsatadi. Bu shuni ko'rsatadiki, ImageNet va boshqa ko'plab
kompyuterlarda chuqur o'rganish orqali yaxshiroq xususiyatlar o'rganilgan
tasvirning asosiy haqiqati orasida bo'lsa, to'g'ri hisoblanadi
U
guruhi. Toronto
ob'ektni aniqlash kabi boshqa ma'lumotlar to'plamlari va kompyuterni ko'rish vazifalariga
ImageNet-da kompyuterning ko'rish maydonini boshqaradigan vosita bo'ldi.
[56], tasvirni segmentlash [97], tasvirni qidirish [154] va ob'ektni kuzatish
model tomonidan bashorat qilingan eng yaxshi beshta sinf. Biroq, Xinton guruhi
Qo'lda ishlangan xususiyatlar
2
15,3 %. Ular konvolyutsion neyron tarmog'idan (CNN) foydalanganlar [83]
Bu so'nggi paytlarda eng ko'p e'tiborni jalb qilishning sabablaridan biridir.
qiyinchilik - PASCAL VOC. Biroq, uning o'quv majmuasi juda kichik
Kompyuterni ko'rish jamiyati bu natijadan hayratda qoldi. Ko'pchilik
26.172
13
Machine Translated by Google
|