Videoni siqishni asosiy protseduralari




Download 13,06 Mb.
Pdf ko'rish
bet89/205
Sana03.06.2024
Hajmi13,06 Mb.
#259764
1   ...   85   86   87   88   89   90   91   92   ...   205
Bog'liq
UUM VAT 2022-2023

Videoni siqishni asosiy protseduralari 
Video kodek asl video ketma-ketlikni siqilgan shaklda kodlaydi, shuningdek 
siqilgan video ketma-ketlikni dekodlaydi va raqamli video nusxasini ishlab chiqaradi 
yoki asl video ketma-ketligiga yaqinlashadi. Kodek o‘ziga xos model yordamida asl 
kadrlarni o‘zgartiradi. Kodlash modeli - bu ma’lumotlarni aniq bir darajada qayta 
tiklash uchun ishlatilishi mumkin bo‘lgan video ma’lumotlarning samarali kodlangan 
namoyishi. Ideal holda, model ketma-ketlikni eng kichik bitlar soniga va eng yuqori 
aniqlikka ega bo‘lishi kerak. Ushbu ikkita maqsad (yuqori sifat va siqishni 
samaradorligi) odatda bir-biriga zid keladi, chunki video ma’lumotlarning yuqori 
siqilish darajasi dekoder chiqishda sifatning sezilarli pasayishini anglatadi. Video 
kodek quyidagi asosiy funksional bloklardan iborat:

rangli bo‘shliqni konversiya qilish bloki; 

vaqtinchalik statistik munosabatlarni yo‘q qilish uchun blok (vaqt o‘tishi bilan 
videofilm kadrlarining o‘xshashligi); 

kadrdagi ulashgan piksellar orasidagi fazoviy statistik munosabatlarni bartaraf 
etish uchun blok; 
 

entropiya kodlovchi bloki.
 
3. Audio va videofaylni yo‘qotishli siqish 
Audio va videoni siqish 
Yuqori sifatli raqamli audio diskda katta hajmni talab qiladi. Standart 
arxivatorlardan foydalangan holda fayllar hajmini kamaytirishga urinishlar audio 
ma’lumotlarning o‘ziga xosligi tufayli sezilarli yutuqlarga olib kelmaydi. Shunga 
qaramay, ma’lumotlar tuzilishini tahlil qilish va keyinchalik ba’zi bir yo‘qotishlar 
bilan siqishn asosida maxsus usullardan foydalangan holda audio ma’lumotni siqishni 
juda muhim darajasiga erishish mumkin. 


125 
Mavjud analog misollar bilan sifat jihatidan taqqoslanadigan tovushni qayta 
ishlashning haqiqiy imkoniyati faqat 80-yillarning oxirlarida paydo bo‘ldi. 1988 yilda 
Xalqaro Standartlar Tashkiloti (ISO) MPEG (Moving Pictures Expert Group) 
qo‘mitasini tuzdi, uning asosiy vazifasi harakatlanuvchi rasmlar, tovush va ularning 
kombinatsiyasini kodlash standartlarini ishlab chiqishdir. O‘zining o‘n yillik faoliyati 
davomida qo‘mita ushbu masala bo‘yicha bir qator standartlarni ishlab chiqdi. 
Natijada, ushbu sohadagi keng qamrovli tadqiqotlarni sarhisob qilgan holda, 
ma’lumotlarni saqlash uchun bir qator aniq formatlar tavsiya etildi, ular natijalar 
sifati va ma’lumotlar oqimining tezligi jihatidan juda yaxshi hisoblanadi. 
Hozirgi kunda uchta keng tarqalgan video saqlash standartlari MPEG-1, 
MPEG-2 va MPEG-4 hisoblanadi. Dastlabki ikkita formatda audio-ma’lumotlarni 
saqlash uchun format ham mavjud - Layer-1, Layer-2 va Layer-3. Ushbu uchta audio 
format MPEG-1 uchun belgilangan va kichik kengaytmalar MPEG-2-da ishlatiladi. 
Uchala format ham bir-biriga o‘xshash, ammo siqilish va murakkablik o‘rtasida har 
xil darajadagi murosadan foydalaniladi. Layer-1 eng oddiy darajadir, siqishni uchun 
katta xarajatlarni talab qilmaydi, shuningdek, unchalik katta bo‘lmagan siqishni 
nisbati bilan ta’minlaydi. Layer-3 eng ko‘p vaqt sarflaydi va eng yaxshi siqishni 
ta’minlaydi. So‘nggi paytlarda ushbu format juda mashhur bo‘ldi. Odatda MP3 deb 
nomlanadi. Ushbu nom ushbu formatda saqlangan audio fayllarning kengaytmasi 
bilan bog‘liq. 
Yo‘qotilgan audio kompressiya texnikasi asosida yotgan g‘oya asl tovushning 
inson qulog‘iga yetib bo‘lmaydigan tafsilotlarini e'tiborsiz qoldirishdir. Bu yerda bir 
nechta fikrlarni ta'kidlash mumkin. 
Shovqin darajasi. Ovozni siqish oddiy haqiqatga asoslanadi - agar odam baland 
ovozli sirenaning yonida bo‘lsa, u yaqin atrofda turgan odamlarning suhbatini 
eshitishi ehtimoldan yiroq emas. Va bu narsa odam baland ovozga katta e'tibor 
bergani uchun emas, balki ko‘proq darajada, inson qulog‘i balandroq ovoz bilan bir 
xil chastota diapazonida yotadigan tovushlarni yo‘qotadi. Ushbu effekt maskalanish 
deb ataladi, u tovush va chastotadagi farq bilan o‘zgaradi. 
Ikkinchi nuqta - audio chastotalar diapazonini pastki diapazonlarga bo‘lish, 
ularning har biri alohida-alohida ishlov berish orqali amalga oshiriladi. Kodlash 
dasturi har bir diapazondagi eng baland tovushlarni chiqaradi va aynan shu ma’lumot 
uchun tarmoqning maqbul shovqin darajasini aniqlaydi. Eng yaxshi kodlash 
dasturlari, shuningdek, qo‘shni bantlarning ta'sirini hisobga oladi. Bitta banddagi juda 
baland ovoz maskalanish effekti va yaqin atrofdagi tasmalarga ta'sir qilishi mumkin. 
Kodlashning yana bir nuqtasi - insonning ovozni idrok etish xususiyatlariga 
asoslangan psixoakustik modeldan foydalanish hisoblanadi. Ushbu model yordamida 
siqish eshitilmasligi ma’lum bo‘lgan chastotalarni olib tashlashga asoslanadi, shu 
bilan birga inson qulog‘i osongina eshitadigan tovushlarni ehtiyotkorlik bilan 


126 
saqlaydi. Afsuski, bu yerda aniq matematik formulalar bo‘lishi mumkin emas. 
Insonning tovushni idrok etishi murakkab, to‘liq tushunilmagan jarayondir, shuning 
uchun siqish usullarini tanlash ekspert guruhlari tomonidan turli xil siqilgan 
tovushlarni tinglash va taqqoslashni tahlil qilish asosida amalga oshiriladi. Ammo bu 
yerda psixoakustik modellarni takomillashtirish sohasida deyarli cheksiz imkoniyatlar 
mavjud. Inson ovozini kodlash uchun mavjud algoritmlarning aksariyati bunday 
signalning yuqori bashorat qilinishiga asoslangan - universal MPEG siqishni 
algoritmlari ushbu texnikani turli xil muvaffaqiyatlar bilan tatbiq etishga urindi. 
Boshqa siqish texnikasi - qo‘shma stereo deb ataladigan vositadan foydalanish. 
Ma’lumki, odamning eshitish vositasi faqat o‘rta chastotalar yo‘nalishini aniqlay 
oladi - baland va past tovushlar manbadan ajralib turganday tuyuladi. Bu shuni 
anglatadiki, ushbu fon chastotalari mono signalga kodlanishi mumkin. Bularning 
barchasiga 
qo‘shimcha 
ravishda 
siqish 
uchun 
kanallardagi 
oqimlarning 
murakkabligidagi farq ishlatiladi. Masalan, agar o‘ng kanalda bir muncha vaqt to‘liq 
sukunat bo‘lsa, ushbu "zahiradagi" joy chap kanalning sifatini yaxshilash uchun 
ishlatiladi yoki u yerda biroz oldinroq oqimga sig‘magan kerakli bitlar u yerda 
"siqilgan". Siquvning oxirgi bosqichida Huffman siqish algoritmi ishlatiladi. Ushbu 
jarayon yuqorida tavsiflangan usullardan foydalangan holda yomon siqilgan nisbatan 
bir hil signallarning siqilish koeffitsientini yaxshilaydi. Ta'riflangan g‘oyalar asosida 
siqish algoritmlari tuziladi, ular siqilish nisbati 10:1 va undan yuqori bo‘lgan, ovoz 
sifati deyarli yo‘qolmaydi. Kodlash paytida kerakli siqilish darajasi o‘rnatiladi va 
siqishni algoritmlari sifatni yo‘qotish hisobiga kerakli siqilish darajasining qiymatiga 
erishadi. Kerakli siqilish darajasi odatda Kbit/s bilan o‘lchangan bit tezligi sifatida 
ko‘rsatiladi. 
"Bit tezligi" atamasi bir soniyada uzatiladigan ma’lumotlarning sonini 
anglatadi. Ushbu atama rus tiliga turli xil manbalarda turli xil tarjima qilingan. 
Yaqinda rus tili uchun yangi bo‘lgan "bitrate" so‘zi ko‘pincha rasmiy tarjima o‘rniga 
ishlatilmoqda. Tarjima variantlari quyidagilar: "ma’lumotlar oqimining kengligi", "bit 
oqimining murakkabligi", "oqim tezligi", "bit tezligi". Ba'zan ovozli fayllar uchun 
ushbu parametr faylni siqish tezligi deb ataladi. Masalan, fayl 128 Kbit/s gacha 
siqilgan deyiladi. Haqiqat shundaki, bit tezligi tovushning bir soniyasiga to‘g‘ri 
keladigan tovush faylining jismoniy hajmiga bevosita bog‘liqdir. 
MPEG oilasining barcha kompressiya formatlari qisqa vaqt oralig‘ida 
ajratilgan rasmlarda yuqori ortiqcha ma’lumotlardan foydalanadi. Ikki qo‘shni 
kvadrat o‘rtasida, odatda, sahnaning faqat bir qismi o‘zgaradi - masalan, fon fonida 
kichik ob'ektning silliq harakati. Bunday holda, voqea joyi to‘g‘risida to‘liq ma’lumot 
tanlab saqlanadi - faqat mos yozuvlar tasvirlari uchun. Qolgan kadrlar uchun farq 
ma’lumotlarini uzatish kifoya: ob'ekt joylashuvi, uning siljish yo‘nalishi va kattaligi, 
harakatlanayotganda ob'ekt orqasida ochiladigan yangi fon elementlari to‘g‘risida. 


127 
Bundan tashqari, bu farqlar nafaqat avvalgi tasvirlar bilan taqqoslaganda, balki 
keyingi tasvirlar bilan ham shakllanishi mumkin (chunki ularda ob'ekt 
harakatlanayotganda fonning ilgari yashirin qismi aniqlanadi). 
Siqish formatining MPEG oilasi ma’lumot miqdorini quyidagicha kamaytiradi: 

Videoning vaqtincha ortiqcha bo‘lishi bekor qilindi (faqat farqlar to‘g‘risidagi 
ma’lumotlar hisobga olinadi); 

Sahnaning kichik detallarini bostirish orqali tasvirlarning fazoviy ortiqchaligini 
yo‘q qiladi; 

Xromatiklik haqida ba’zi ma’lumotlar olib tashlanadi; 

Olingan raqamli oqimning axborot zichligi uning tavsifi uchun eng maqbul 
matematik kodni tanlash orqali oshiriladi. 
MPEG siqishni formatlari faqat ramkalarini siqadi - I-ramkalar (Ichki ramka). 
Ikkala qo‘shni I-ramkalar orasidagi o‘zgarishlarni o‘z ichiga olgan ramkalar - P-
ramkalar (ehtimoliy ramka) ular orasidagi intervallarga kiritilgan. I-ramka va P-
ramka o‘rtasida ma’lumot yo‘qotilishini kamaytirish uchun B-freymlar (Ikki 
yo‘nalishli ramka) deb nomlangan narsa kiritiladi. Ular oldingi va keyingi kadrlardan 
olingan ma’lumotlarni o‘z ichiga oladi. MPEG siqishni formatida kodlashda har xil 
turdagi ramkalar zanjiri hosil bo‘ladi. Odatda ramka ketma-ketligi quyidagicha 
ko‘rinadi: 
I B B P B B I B B P B B I B B ... 
Shunga ko‘ra, ularning raqamlariga muvofiq kadrlar ketma-ketligi quyidagi 
tartibda namoyish etiladi: 
1 4 2 3 7 6 5 ... 

Download 13,06 Mb.
1   ...   85   86   87   88   89   90   91   92   ...   205




Download 13,06 Mb.
Pdf ko'rish

Bosh sahifa
Aloqalar

    Bosh sahifa



Videoni siqishni asosiy protseduralari

Download 13,06 Mb.
Pdf ko'rish