İnformasiyanın miqdarı üçün Şennon düsturu
Çox hallarda baş verən hadisələri törədə biləcək mümkün hallar eyni ehtimallı olmur. Məsələn, pul və ya zər simmetrik deyilsə, onun bir üzünün düşmə ehtimalı fərqlənəcəkdir. Müxtəlif ehtimallı mümkün hallar üçün informasiyanın miqdarı düsturunu 1948-ci ildə
K.Şennon təklif etmişdir: I
N
pi log 2 pi
i 1
Burada: İ – informasiyanın miqdarı, N –
mümkün halların sayı,
pi - i-ci halın ehtimalıdır.
Fərz edək ki, qeyri-simmetrik piramidanın üzlərinin düşmə ehtimalları:
1
p1 , p2
2
, p3
və p4
kimidir. Bu halda informasiyanın miqdarı:
I (1 log 1
2 2 2
1 log 1
4 2 4
log 1
8 2 8
1 log 1) (1
8 2 8 2
2 3 3) 14
4 8 8 8
1
1,75
bit olar.
Eyni ehtimallı hallar üçün Şennon düsturu I
log 2
N
şəklinə düşür.
Eyni ehtimallı hallarda bu informasiyanın miqdarı 2 bit ( 4 22
2 I və ya
I log 2 4
) olur. Göründüyü kimi, eyni ehtimallı hallarda alınan informasiyanın miqdarı
daha çoxdur. Bu, əslində, maksimal miqdardır. İnformasiyanın miqdarının təyini üçün təklif edilən bu yanaşma ehtimallı üsul adlanır. Bu üsul hər hansı suala cavab vermək üçün azı nə qədər cəhd edilməsini təyin etməyə imkan verir. Məsələn, 32 hərfli əlifbanın hər hansı hərfinin təyini üçün azı 5 addım tələb olunur.
İnformasiyanın təqdimatı və kodlaşdırılması Dil və işarələr sistemi
Dil informasiyanın təqdimatı vasitəsidir. Dilin təməlində işarələr (səslər, hərflər, jestlər) yığımı durur. İşarələrin qrammatik qaydalara uyğun düzülməsi dilin əsas obyekt- lərini (sözləri) əmələ gətirir. Sözlərdən cümlə düzəldilməsi qaydasına sintaksis deyilir.
Dillərdən biri də formal dildir. Buraya: say sistemləri, cəbr dili, proqramlaşdırma dilləri və s aiddir. Formal dilin qrammatikası və sintaksisi ciddi qaydalara söykənir.
Say sistemi, formal dil olaraq, obyektləri (ədədləri) adlandırmağa, yazıb-oxumağa və hesabi əməllər icrasına imkan verir.
Canlı orqanizmlərdə informasiyanın təqdimatı
İnsan ətraf mühit haqqındakı informasiyanı hiss üzvləri vasitəsi ilə qəbul edir. Əsəb telləri (reseptorlar) hiss üzvlərinin verdiyi informasiyanı (təsiri) neyronlara (əsəb hüceyrələrinə) ötürür. Bu hüceyrələr zənciri əsəb sistemini əmələ gətirir. Neyron 2 vəziyyətdə ola biləndir: həyəcanlı və həyəcansız. Həyəcanlı neyron elektrik impulsu yaradıb əsəb sistemi ilə ötürür. Bu iki vəziyyətə neyron dilinin əlifbası kimi baxmaq olar. Beləliklə, canlı orqanizmdə informasiya təqdimatı neyron dili vasitəsi ilə baş tutur ki, bu da 2-lik say sistemində işləmək deməkdir. Yəni kompüterin 2-lik say sistemində işləməsi təsadüfi deyildir.
İnformasiyanın kodlaşdırılması
İnformasiya təqdimatının bir formadan (işarələr sistemindən) digərinə keçirilməsinə kodlaşdırma deyilir. Kodlaşdırma mahiyyətcə, tərcümə olduğundan, uyğunluq (ekviva- lentlik) cədvəlinə (lüğətə) əsaslanır. İnformasiya mübadiləsi zamanı kodlaşdırma (tərcü- mə) və dekodlaşdırma (əks tərcümə) baş verir. Məsələn, klaviatura sıxılan düymə kodlarını 2-lik rəqəmlər sırası şəklində kompüterə ötürdükdən sonra monitor həmin 2-lik rəqəmləri klaviatura düymələrindəki simvollara çevirir.
Kompüterdə informasiyanın 2-lik kodlaşdırılması
Kompüterdə informasiyanın təqdimatı üçün 2-lik kodlaşdırmadan istifadə edilir. Çünki yalnız iki vəziyyətdə ola bilən yüksək etibarlı texniki element mövcuddur. Bu element elektromaqnit reledən, maqnitlə işlənmiş səthdən, lazerlə işlənmiş səthdən və triggerdən ibarətdir ki, bunlar da yalnız 2 vəziyyətdə ola bilir. Vəziyyətin biri 1-ə, digəri 0-
a müvafiq gəlir. Kompüterə daxil edilən ədədi, mətni, qrafik, səs və video informasiya 2-
lik koda çevrilir. 2-lik kodun rəqəmləri olan 0 və 1-ə eyni ehtimallı iki mümkün hal kimi baxmaq olar. Hər işarə 1 bit informasiya daşıyır.
2.5.4.1 Səs informasiyasının kolaşdırılması
Səs müəyyən tezlikli və amplitudalı sinusoidal dalğadır. Səsin tezliyi herts-lə ölçülür. İnsan 20-17000 herts tezlikli dalğaları eşidə bilir. Səsi rəqəmsal kodla ifadə etmək üçün səsin müəyyən vaxt kəsiyindəki intensivliyi göstəricisindən31, məsələn, 0,001 saniyədə 48 dəfə və ya 1 saniyədə 48000 dəfə döyünən dalğadan istifadə edilir.
Səsin keyfiyyət xarakteristikaları aşağıdakılardır:
-seçim dəqiqliyi və ya səsin kodlaşdırılma dərinliyi32;
-seçim tezliyi və ya diskretləşdirmə tezliyi33.
2.6. İnformasiyanın saxlanması
Hiss üzvləri vasitəsi ilə əldə edilən informasiya yaddaşa köçürülür və orada toplanır. Lakin əldə edilmiş və biliyə çevrilmiş informasiyanı uzunmüddətli saxlamaq34 və nəsildən-nəslə ötürmək üçün müxtəlif daşıyıcılardan: DNK molekulundan (genetik informasiya), kağızdan (mətn və şəkil), maqnit lentindən (səs), foto və kino lentlərindən (qrafik), yaddaş mikrosxemlərindən, maqnit və lazer disklərindən (kompüterdəki proqram və verilənlər) və s. istifadə edilir.
Mütəxəssislərin fikrincə, müxtəlif daşıyıcılarda saxlanan informasiyanın illik həcmi 1 eksabayt (1018 bayt) təşkil edir. Bu informasiyanın 80%-i maqnit və optik daşıyıcılarda rəqəm formasında, 20%-i analoq daşıyıcılarda (kağızda, maqnit lentində, foto-kino lentlərində) saxlanır. 2000-ci ildə dünya üzrə adambaşına düşən saxlanan informasiyanın həcmi 250 Mbayt təşkil etmişdir ki, buna da hər biri 20 Qbaytlıq 85 milyon vinçester lazımdır.
İnformasiya daşıyıcılarının informasiya tutumu. Ən böyük yaddaş tutumu
olan daşıyıcı DNK molekuludur ki, bunun da 1 kub santimetrində
10 21
bit informasiya
yerləşir. Müasir yaddaş mikrosxemləri 1 kub santimetrdə
1010
bit informasiya saxlayır.
Buna seçim tezliyi də deyilir. Mümkün amplitudaların sayı seçim dəqiqliyi adlanır.
Səs siqnalının bir ölçmə kəmiyyətinə düşən bit-lərin sayı ilə ölçülür. Müasir səs kartları 16 bit kodlaşdırma dərinliyi ilə işləyir. Bu halda amplituda variantlarının sayı 65536 olur.
1 saniyədə səs siqnalının səviyyəsinin ölçülmələrinin sayıdır. 1 saniyədə 1 ölçmə 1 hertsə uyğundur. 1 saniyədə 8000-48000 herts ölçmə aparıla bilir. 8000 herts radio translyasiyaya, 48000 herts audio-CD səsləndirməsinə uyğundur.
34 İnformasiyanın saxlanması dedikdə, onun elə şəkildə qorunması nəzərdə tutulur ki, lazımi vaxtda onu lazımi şəkildə ötürmək mümkün olsun.
Yəni, müasir texnologiyalar bioloji təkamüldən xeyli geri qalır. Buna baxmayaraq kitaba nəzərən kompüterin daha mükəmməl daşıyıcı və informasiya mənbəyi olduğu sirr deyil. Hər bir maqnit diskində 600 səhifəlik kitab saxlamaq mümkündür. 1 Vinçesterdə bir kitabxana tutumu vardır.
İnformasiyanın saxlanmasının etibarlılığı və uzunmüddətliliyi.
İnformasiyanın saxlanmasının etibarlılığı və uzunmüddətliliyi böyük əhəmiyyət daşıyır. Ən etibarlı daşıyıcı DNK molekuludur. Analoq daşıyıcılara nisbətən diskret daşıyıcılar daha az etibarlıdır. Buna görə də maqnit və optik daşıyıcıların istismar və saxlanma qaydalarına ciddi əməl etmək lazımdır. Ən uzunmüddətli yaddaş da DNK molekuludur. Analoq daşıyıcılara nisbətən diskret daşıyıcılar daha az müddətlidir. Buna görə də diskret daşıyıcılardakı informasiyanı müəyyən müddət keçdikdən sonra təzələmək lazımdır.
İnformasiyanın müxtəlif növlərinin sıxılması (arxivləşdirilməsi)
İnformasiyanın diskret rəqəmsal təqdimatı adətən müəyyyən bolluğa (boşluğa) malik olur. Belə ki, tez-tez eyni bit sıraları təkaralanır. Bu isə informasiyanın həcmini artırır ki, bu da həm saxlama, həm də ötürmə baxımından həll edilməsi tələb olunaan problem sayılır. Buna görə də xüsusi sıxma metodları (alqoritmləri) işlənib hazırlan- mışdır ki, bunların köməyi ilə də informasiyanın həcmini əhəmiyyətli dərəcədə azaltmaq mümkün olur. Həm universal35, həm də ixtisaslaşdırılmış36 sıxma alqoritmləri möv- cuddur.
Sıxma alqoritmlərinin hamısı bit-lə işləyir.
Sıxma prosesinin əsas texniki xarakteistikaları və nəticələri aşağıdakılardan ibarətdir:
-sıxma dərəcəsi37;
-sıxma sürəti38;
-sıxma keyfiyyəti39.
Sıxma üsulları dönərli və dönməz olmaqla 2 qrupa bölünür.
Universal alqoritmlər informasiyaya sadəcə, bitlər sırası kimi baxır
Bunlar müəyyən tip (şəkil, mətn, səs, video) informasiyanı sıxmaq üçündür
Sıxılmamış həcmin sıxılmış həcmə nisbəti ilə ölçülür
Müəyyən informasiya həcminin sıxılmasına sərf edilən vaxtla ölçülür
Başqa alqoritmlə təkrar sıxarkən aşkara çıxan sıxılma dərəcəsi
Dönməz sıxma zamanı sıxılmış informasiya xarici görünüş etibarı ilə ilkin infor- masiya yığımına bənzəsə də, həcmcə kiçik olur. Bu alqoritmlər rastr şəkil fayllarını, səs və video faylları sıxmaq üçün tətbiq edilir.
Dönərli sıxma zamanı informasiyanın informativliyi, yəni informasion strukturu qorunub saxlanır.
Seriyalı kodlaşdırma üsulu ilə sıxma
Bu üsulda təkrar olunan elementlər üçün sayğac qoyulur. Məsələn, fərz edək ki, sıxılması tələb olunan informasiya: 44 44 44 11 11 11 11 01 33 ff 22 22 şəklindədir. Bu
üsulla sıxılmış informasiya: 03 44 04 11 00 03 01 33 ff 02 22 kimi olacaqdır. Göründüyü
kimi, 03 44 üç dənə 44 olduğunu, 04 11 isə dörd dənə 11 olduğunu göstərir. Əgər birinci bayt 00 şəklindədirsə, sayğac təkrar olunmayan baytları sayır ki, bizim misalda da bu, üç dənədir (01 33 ff). Buna görə 00 03 baytlarından sonra 01 33 ff gəlir, sonra isə 02 22 baytları, yəni iki dənə 22 gəlir.
Bu üsul rastr şəkilləri sıxmaq üçün münasibdir. Lakin bu üsul informasiyanı az sıxır.
Haffmen alqoritmi
Bu üsulda əvvəlcə bütün informasiya oxunur və təkrarlanan elementlər sayılır. Sonra bunlar üçün binar ağac qurulur.
Haffmen alqoritmi ilə sıxmaya misal cədvəldə verilmişdir.
Fərz edək ki, mətnə daxil olan simvolların təkrarlanması aşağıdakı kimidir:
Simvol
|
A
|
B
|
C
|
D
|
E
|
F
|
Təkrarlanma
|
10
|
20
|
30
|
5
|
25
|
10
|
Simvolları təkrarlanma tezliyinin azalması qaydasında çeşidləyək:
Simvol
|
C
|
E
|
B
|
F
|
A
|
D
|
Təkrarlanma
|
30
|
25
|
20
|
10
|
10
|
5
|
Bu cədvəl əsasında qurulmuş binar ağac aşağıdakı kimidir:
1
Göründüyü kimi, son iki elementi (A və D) birləşdirib təkrarlanma tezliyi 15 (5+10) olan bir ―düyün‖ alırıq. Sonra bu düyünü F-lə birləşdirib təkrarlanma tezliyi 25 (15+10) olan yeni bir ―düyün‖ alırıq. Sonra bu düyünü B ilə birləşdirib təkrarlanma tezliyi 45 (25+20) olan daha bir ―düyün‖ alırıq. Sonra C və E elementlərini birləşdirib təkrarlanma tezliyi 55 (30+25) olan yeni bir ―düyün‖ alırıq. Sonra isə bu düyünləri birləşdirib (45+55) binar aşacın kökünü alırıq.
Bu düyünlərin sol (yuxarı) qanadını 0-la, sağ (aşağı) qanadını 1-lə kodlaşdırırıq. Beləliklə:
C=00 (2 bit)
E=01 (2 bit)
B=10 (2 bit)
F=110 (3 bit)
A=1101 (4 bit)
D=1111 (4 bit) kimi kodlar alınır.
Sıxma zamanı bu simvollar yeni kodları ilə yadda saxlanır və açma zamanı əvvəlki kodları bərpa olunur.
Bundan əlavə, hesabi kodlaşdırma, Lempel-Ziv-Velç (LZW) alqoritmi, ikipilləli kodlaşdırma (Lempel-Ziv alqoritmi) kimi sıxma metodları mövcuddur.
Hal-hazırda PKPAK, ZİP, LHArc, LHA, ARJ, WinRAR kimi arxivator proqramları geniş tətbiq edilir.
|