125
Mavjud analog misollar bilan sifat jihatidan taqqoslanadigan tovushni qayta
ishlashning haqiqiy imkoniyati faqat 80-yillarning oxirlarida paydo bo‘ldi. 1988 yilda
Xalqaro Standartlar Tashkiloti (ISO) MPEG (Moving Pictures Expert Group)
qo‘mitasini tuzdi, uning asosiy vazifasi harakatlanuvchi rasmlar,
tovush va ularning
kombinatsiyasini kodlash standartlarini ishlab chiqishdir. O‘zining o‘n yillik faoliyati
davomida qo‘mita ushbu masala bo‘yicha bir qator standartlarni ishlab chiqdi.
Natijada, ushbu sohadagi keng qamrovli tadqiqotlarni sarhisob qilgan holda,
ma’lumotlarni saqlash uchun bir qator aniq formatlar tavsiya etildi, ular natijalar
sifati va ma’lumotlar oqimining tezligi jihatidan juda yaxshi hisoblanadi.
Hozirgi kunda uchta keng tarqalgan video saqlash standartlari MPEG-1,
MPEG-2 va MPEG-4 hisoblanadi. Dastlabki ikkita formatda audio-ma’lumotlarni
saqlash uchun format ham mavjud - Layer-1, Layer-2 va Layer-3. Ushbu uchta audio
format MPEG-1 uchun belgilangan va kichik kengaytmalar MPEG-2-da ishlatiladi.
Uchala format ham bir-biriga o‘xshash, ammo siqilish va murakkablik o‘rtasida har
xil darajadagi murosadan foydalaniladi. Layer-1 eng oddiy darajadir, siqishni uchun
katta xarajatlarni talab qilmaydi, shuningdek, unchalik katta bo‘lmagan siqishni
nisbati bilan ta’minlaydi. Layer-3 eng ko‘p vaqt sarflaydi va eng yaxshi siqishni
ta’minlaydi. So‘nggi paytlarda ushbu format juda mashhur bo‘ldi. Odatda MP3 deb
nomlanadi. Ushbu nom ushbu formatda saqlangan audio fayllarning kengaytmasi
bilan bog‘liq.
Yo‘qotilgan audio kompressiya texnikasi asosida yotgan g‘oya asl tovushning
inson qulog‘iga yetib bo‘lmaydigan tafsilotlarini e'tiborsiz qoldirishdir. Bu yerda bir
nechta fikrlarni ta'kidlash mumkin.
Shovqin darajasi. Ovozni siqish oddiy haqiqatga asoslanadi - agar odam baland
ovozli sirenaning yonida bo‘lsa, u yaqin atrofda turgan odamlarning suhbatini
eshitishi ehtimoldan yiroq emas. Va bu narsa odam baland ovozga katta e'tibor
bergani uchun emas, balki ko‘proq darajada, inson qulog‘i balandroq ovoz bilan bir
xil chastota diapazonida yotadigan tovushlarni yo‘qotadi. Ushbu effekt maskalanish
deb ataladi, u tovush va chastotadagi farq bilan o‘zgaradi.
Ikkinchi nuqta - audio chastotalar diapazonini pastki diapazonlarga bo‘lish,
ularning har biri alohida-alohida ishlov berish orqali amalga oshiriladi.
Kodlash
dasturi har bir diapazondagi eng baland tovushlarni chiqaradi va aynan shu ma’lumot
uchun tarmoqning maqbul shovqin darajasini aniqlaydi. Eng yaxshi kodlash
dasturlari, shuningdek, qo‘shni bantlarning ta'sirini hisobga oladi. Bitta banddagi juda
baland ovoz maskalanish effekti va yaqin atrofdagi tasmalarga ta'sir qilishi mumkin.
Kodlashning yana bir nuqtasi - insonning ovozni idrok etish xususiyatlariga
asoslangan psixoakustik modeldan foydalanish hisoblanadi. Ushbu model yordamida
siqish eshitilmasligi ma’lum bo‘lgan chastotalarni olib tashlashga asoslanadi, shu
bilan birga inson qulog‘i osongina eshitadigan tovushlarni ehtiyotkorlik bilan
126
saqlaydi. Afsuski, bu yerda aniq matematik formulalar bo‘lishi mumkin emas.
Insonning tovushni idrok etishi murakkab, to‘liq
tushunilmagan jarayondir, shuning
uchun siqish usullarini tanlash ekspert guruhlari tomonidan turli xil siqilgan
tovushlarni tinglash va taqqoslashni tahlil qilish asosida amalga oshiriladi. Ammo bu
yerda psixoakustik modellarni takomillashtirish sohasida deyarli cheksiz imkoniyatlar
mavjud. Inson ovozini kodlash uchun mavjud algoritmlarning aksariyati bunday
signalning yuqori bashorat qilinishiga asoslangan - universal MPEG siqishni
algoritmlari ushbu texnikani turli xil muvaffaqiyatlar bilan tatbiq etishga urindi.
Boshqa siqish texnikasi - qo‘shma stereo deb ataladigan vositadan foydalanish.
Ma’lumki, odamning eshitish vositasi faqat o‘rta chastotalar yo‘nalishini aniqlay
oladi - baland va past tovushlar manbadan ajralib turganday tuyuladi.
Bu shuni
anglatadiki, ushbu fon chastotalari mono signalga kodlanishi mumkin. Bularning
barchasiga
qo‘shimcha
ravishda
siqish
uchun
kanallardagi
oqimlarning
murakkabligidagi farq ishlatiladi. Masalan, agar o‘ng kanalda bir muncha vaqt to‘liq
sukunat bo‘lsa, ushbu "zahiradagi" joy chap kanalning sifatini yaxshilash uchun
ishlatiladi yoki u yerda biroz oldinroq oqimga sig‘magan kerakli bitlar u yerda
"siqilgan". Siquvning oxirgi bosqichida Huffman siqish algoritmi ishlatiladi. Ushbu
jarayon yuqorida tavsiflangan usullardan foydalangan holda yomon siqilgan nisbatan
bir hil signallarning siqilish koeffitsientini yaxshilaydi. Ta'riflangan g‘oyalar asosida
siqish algoritmlari tuziladi, ular siqilish nisbati 10:1 va undan yuqori bo‘lgan, ovoz
sifati deyarli yo‘qolmaydi. Kodlash paytida kerakli siqilish darajasi o‘rnatiladi va
siqishni algoritmlari sifatni yo‘qotish hisobiga kerakli siqilish darajasining qiymatiga
erishadi. Kerakli siqilish darajasi odatda Kbit/s bilan o‘lchangan
bit tezligi sifatida
ko‘rsatiladi.
"Bit tezligi" atamasi bir soniyada uzatiladigan ma’lumotlarning sonini
anglatadi. Ushbu atama rus tiliga turli xil manbalarda turli xil tarjima qilingan.
Yaqinda rus tili uchun yangi bo‘lgan "bitrate" so‘zi ko‘pincha rasmiy tarjima o‘rniga
ishlatilmoqda. Tarjima variantlari quyidagilar: "ma’lumotlar oqimining kengligi", "bit
oqimining murakkabligi", "oqim tezligi", "bit tezligi". Ba'zan ovozli fayllar uchun
ushbu parametr faylni siqish tezligi deb ataladi. Masalan, fayl 128 Kbit/s gacha
siqilgan deyiladi. Haqiqat shundaki, bit tezligi tovushning bir soniyasiga to‘g‘ri
keladigan tovush faylining jismoniy hajmiga bevosita bog‘liqdir.
MPEG oilasining barcha kompressiya formatlari qisqa vaqt oralig‘ida
ajratilgan rasmlarda yuqori ortiqcha ma’lumotlardan foydalanadi. Ikki qo‘shni
kvadrat o‘rtasida, odatda, sahnaning faqat bir qismi o‘zgaradi - masalan,
fon fonida
kichik ob'ektning silliq harakati. Bunday holda, voqea joyi to‘g‘risida to‘liq ma’lumot
tanlab saqlanadi - faqat mos yozuvlar tasvirlari uchun. Qolgan kadrlar uchun farq
ma’lumotlarini uzatish kifoya: ob'ekt joylashuvi, uning siljish yo‘nalishi va kattaligi,
harakatlanayotganda ob'ekt orqasida ochiladigan yangi fon elementlari to‘g‘risida.
127
Bundan tashqari, bu farqlar nafaqat avvalgi tasvirlar bilan taqqoslaganda, balki
keyingi tasvirlar bilan ham shakllanishi mumkin (chunki ularda ob'ekt
harakatlanayotganda fonning ilgari yashirin qismi aniqlanadi).
Siqish formatining MPEG oilasi ma’lumot miqdorini quyidagicha kamaytiradi:
Videoning vaqtincha ortiqcha bo‘lishi bekor qilindi (faqat farqlar to‘g‘risidagi
ma’lumotlar hisobga olinadi);
Sahnaning kichik detallarini bostirish orqali tasvirlarning fazoviy ortiqchaligini
yo‘q qiladi;
Xromatiklik haqida ba’zi ma’lumotlar olib tashlanadi;
Olingan raqamli oqimning axborot zichligi uning tavsifi uchun eng maqbul
matematik kodni tanlash orqali oshiriladi.
MPEG siqishni formatlari faqat ramkalarini siqadi - I-ramkalar (Ichki ramka).
Ikkala qo‘shni I-ramkalar orasidagi o‘zgarishlarni o‘z
ichiga olgan ramkalar - P-
ramkalar (ehtimoliy ramka) ular orasidagi intervallarga kiritilgan. I-ramka va P-
ramka o‘rtasida ma’lumot yo‘qotilishini kamaytirish uchun B-freymlar (Ikki
yo‘nalishli ramka) deb nomlangan narsa kiritiladi. Ular oldingi va keyingi kadrlardan
olingan ma’lumotlarni o‘z ichiga oladi. MPEG siqishni formatida kodlashda har xil
turdagi ramkalar zanjiri hosil bo‘ladi. Odatda ramka ketma-ketligi quyidagicha
ko‘rinadi:
I B B P B B I B B P B B I B B ...
Shunga ko‘ra, ularning raqamlariga muvofiq kadrlar ketma-ketligi quyidagi
tartibda namoyish etiladi:
1 4 2 3 7 6 5 ...