Eötvös Loránd Tudományegyetem Könyvtártudományi Informatikai Tanszék Fülöp Géza Az információ

Download 8,26 Mb.
bet	8/47
Sana	09.06.2021
Hajmi	8,26 Mb.
	#14852

1 ... 4 5 6 7 8 9 10 11 ... 47

KÓDOK

CSATORNÁK

A közlemény, amint azt a hírközlés általános modelljéből leolvashatjuk, valamilyen csatornán jut el a címzetthez. A hírközlési csatorna olyan berendezés, amely képes a bemenetelnél információt felvenni és a kimenetelnél leadni. Fizikai valójukban a csatornák nagyon sokfélék lehetnek: a levegő, a telefonvezeték, az optikai üvegszál, az élőlények idegszálai, a könyv, a videolemez stb. Osztályozni is több szempontból lehet őket. A térbeli csatornák a tér valamelyik pontjából egy vagy több másik pontjába, az időbeli csatornák a T időponttól a (T + t) időpontba szállítják az információkat. Előbbiekre példa a telefonvezeték, utóbbiakra a videolemez. Természetesen ez a megkülönböztetés csak a lényegi jegyekre vonatkozik, mivel az információnak a térbeli csatornában is időre van szüksége, hogy célba jusson, a szóbeli csatornákon is lehet térben szállítani az információt.

A tér- és időbeli csatornákat szokás késleltetés nélkül és késleltetéssel működő csatornáknak is nevezni. Előbbiek maghatározott sebességgel, s ahogy nevük is mutatja, késleltetés nélkül szállítják az üzeneteket, utóbbiak pedig tetszőleges ideig tárolják, azaz késleltetik az üzenet továbbadását. Más szempontból beszélhetünk természetes és mesterséges csatornákról (idegrost és telefonkábel), analóg és digitális csatornákról (a hanghullámokat hordozó levegő, illetve a számítógép adatátvivő csatornái).

Az volna az eszményi, ha a csatorna kimeneteli oldalán mindig azt az információt kapnánk meg, amely a másik oldalán belépett, azaz a belépő x_i jelnek a kimenetelnél mindig y_j jel felelne meg, amely - bizonyos egyszerű esetekben - az x_i-től csak egy konstans szorzóval és időeltolással különbözik (a konstans a jel csillapodásából származik). Az ilyen - csak elméletben létező- ideális csatorna neve zajmentes csatorna. Sajnos a reális csatornák mindig zajosak, zaj minden olyan jelenség, amely a hírközlő csatornában “megtámadja” a hasznos információt, megcsonkítja, elnyomja, eltorzítja, legrosszabb esetben meg is semmisíti. Másképpen fogalmazva: zajos csatornánál a kilépő jel nem felel meg mindig a belépő jelnek, hamis jelek keverednek az igaziak közé. Zaj például az az elektromágneses rezgés, amely zavarja a rádióvételt, az utca zaja, amely elnyomja a beszélgetőtársunk hangját, a sajtóhiba. A zajokat két csoportra oszthatjuk. A rendszertorzítás azonos jel esetén mindig azonos, és elvileg teljesen kiküszöbölhető. A csatorna- vagy csőzaj független a jeltől, rendszertelen, statisztikus jellege van, és teljesen sohasem szüntethető meg. (Tulajdonképpen a zaj is információ, csak éppen nem az, amire szükségünk van, s nagyon sokszor a kódját sem ismerjük. Az is előfordulhat, hogy valamely jelenség zaj egy szempontból, s értékes információ egy másikból. Például a légköri elektromos jelenségek a rádióhallgató és a légkör fizikáját kutató tudós szempontjából.)

A zaj tehát bizonytalanná teszi a csatorna működését. A vevő sohasem lehet teljesen biztos benne, hogy jól értette-e az üzenetet, a vett jel megfelel-e a leadott jelelnek. Bizonyosság helyett az információtovábbításban is csak valószínűségekkel számolhatunk.

Jelöljük a forrás jelkészletét, a jelek (x₁,x₂...x_n) halmazát X-szel. Ebből a készletből állítja össze az üzenetet az adó, amelyben az x_i jel előfordulási valószínűsége p_i. A leadott jelsorozat jelenkénti átlagos információját, a forrás entrópiáját jelöljük H(X)-szel.

A csatornából kilépő jelek (y₁,y₂...y_n) halmaza legyen Y, a kilépő jelsorozat entrópiája pedig H(Y). A csatornán átjutó információt pedig jelöljük T(X,Y)-nal.

A kérdés így tevődik fel: ha a belépő jelek X halmazának valamely x_i eleme lép be a csatornába, mekkora lesz a valószínűsége annak, hogy a csatorna végén az Y halmaz y_i eleme fog megjelenni?

Ha a csatorna zajmentes, a csatorna másik végén mindig a belépő x_i jelnek megfelelő y_i fog megjelenni.

Ha a csatorna a legelterjedtebb egyszerű típushoz tartozik, amelyben a bemeneti jelsorozat jelei kölcsönösen egyértelmű megfeleltetésben vannak a kimeneti jelsorozat jeleivel, az átvitt információ, a belépő és a kilépő információ egyenlő egymással:

T(X,Y) = H(X) = H(Y).

Ha a csatorna zajos, az átvitt információ kevesebb lesz. A T(X,Y) csökkentését a hibák előfordulásának valószínűségével mérhetjük. A hiba azt jelenti, hogy a kimenő jelsorozatban nem a belépő x_i-nek megfelelő y_i-t találjuk. Ha p(y_jx_i)-vel jelöljük annak valószínűségét, hogy a kimenetelnél y_j lép ki a csatornából, amikor a belépőjel x_i volt /feltételes valószínűség), felírhatjuk a következő egyenlőséget:

Ez a kifejezés a kilépőjelek halmazának feltételes entrópiáját jelöli abban az esetben, ha a belépő jelekről rendelkezünk információval.

A belépő jelek halmazának, a forrásnak a feltételes entrópiáját pedig a kilépő jelek ismeretében a következő kifejezés adja meg:

Más szavakkal a H(Y|X) a kilépő jelek bizonytalanságának mértéke a belépő jelek ismeretében, a H(X|Y) a belépő jelek átlagos bizonytalanságának mértéke a kilépő jelek ismeretében.

Ha a csatorna zajmentes, biztos, hogy amikor a csatornába x_i lép be, akkor a csatorna másik végén y_j lép ki, tehát p(y_j|x_i)= 1 és

H(Y|X) = H(X|Y) = 0.

Ha pedig nincs információátvitel (a zaj teljesen megsemmisíti a hasznos jeleket), az x_i ismerete semmilyen információt nem nyújt az y_j-re vonatkozólag, és fordítva:

p(y_j|x_i)= p(y_j),

p(x_i|y_j) = p(x_i).

Ebben az esetben

H(Y|X) = H(Y)

H(X|Y) = H(X)

Zajos csatornán átvitt információ mennyiségét az alábbi képlet adja meg:

T(X,Y) = H(Y) - H(Y|X)

vagy

T(X,Y) = H(X) - H(X|Y).

A két kifejezés egyenértékű. Bizonyítását mellőzzük. Az érdeklődő olvasó megtalálja ezt többek között Reza “Bevezetés az információelméletbe” című könyvének harmadik fejezetében (Reza, 1966).

Ha tökéletes az átvitel, H(X|Y) = 0, akkor

T(X,Y) = H(Y) = H(X),

ha pedig a csatornán nem jut át az információ,

H(YX) = H(Y), illetve H(X|Y) = H(X)

és

T(X,Y) = 0.

A H(Y|X) és a H(X|Y) függvény tehát az információátvitel tökéletlenségének, az információveszteségnek a mértéke. Előbbi (angolul ambiguitynek nevezik) a csatornában levő zajra, hibára utal, utóbbi pedig (angolul equivocation) a többértelműség mértékét jelenti, vagyis hogy milyen pontosan tudjuk meghatározni az információ tartalmát a kimenet ismeretében.

A p(y_j|x_i) feltételes valószínűségek P(Y|X) mátrixát, amely azt mutatja meg, mekkora valószínűséggel számíthatunk a kimenetelnél y_j jelentkezésére, ha a bemenetelnél x_i lép be, a csatorna zajkarakterisztikájának nevezzük. Ezt a mátrixot szokták megadni a csatorna jellemzésére. A zajkarakterisztika tulajdonképpen az átmenet valószínűségének a mátrixa.

A hírközlés gazdaságossága szempontjából nagyon fontos kérdés, hogy az információ milyen sebességgel halad át a csatornán. Ha a zajmentes csatornában valamely x_i jel továbbításához t_i időre van szükség, akkor az átvitel sebessége

Ez a kifejezés tulajdonképpen az adás sebességét adja meg. Zajmentes csatorna esetén (amikor is a P(Y|X) mátrix négyzetes, azaz N = N’ és csak a főátló menti elemei különböznek 0-tól) V egyenlő az átvitel sebességével is.

A maximális átviteli sebességet a csatorna kapacitásának nevezzük:

A zajos csatorna kapacitása pedig:

A csatornán átjutó információmennyiség rendszerint nem éri el a maximumot, s így a csatorna kapacitásának egy része kihasználatlan marad. A kapacitás és a ténylegesen átvitt információ különbségének az arányát a csatorna redundanciájának nevezzük. (A csatorna redundanciája nem puszta műszaki jellemzője a csatornának. Amint a következő fejezetben látni fogjuk, függ a kódolástól is).

A hírközlési csatornákkal kapcsolatban ismerkedjünk meg még két fogalommal. A sávszélesség az a frekvenciasáv (rezgésszám tartomány), amelyen belül a csatorna a rezgéseket lényeges torzítás nélkül átviszi. A jel/zaj viszony, vagy zajnívó a hasznos jel és a zaj teljesítményének az aránya. Minél nagyobb a hasznos jelek energiája, annál biztosabb a vétel. Ha nagy utcazajban kis energiával suttogunk, nagy lesz az információveszteség.

Az elektrotechnikai hírtovábbító csatorna kapacitását ezeknek a mennyiségeknek a függvényében is kifejezhetjük. Ahhoz, hogy a csatorna kapacitása C legyen, az alábbi feltételeket kell biztosítani:

A képletben W a csatorna sávszélessége, P a hasznos jel teljesítménye, N a zaj teljesítménye, T az átviteli idő. Láthatjuk, hogy a zajos csatorna kapacitása, az átvihető információmennyiség a zaj mértékétől függ.

A távközlésnek, adatátvitelnek - talán úgy mondhatnánk - soha el nem érhető ideálja: maximális sebességgel, maximális pontossággal, megbízhatósággal maximális mennyiségű információt átvinni. A műszaki fejlődés egyre közelebb visz ehhez a célhoz, de a végeredményben egymással ellentétes követelményeket csak kompromisszumokkal lehet összeegyeztetni, s be kell érnünk azzal, hogy a vett információ alapján a leadott információt egy előre meghatározott biztonsági tényezővel rekonstruálni tudjuk. Erről a kérdésről a következő fejezetben lesz szó.

KÓDOK

Az információ ezer alakban jelenhet meg, ám minden csatorna csak jól meghatározott típusú, a csatornára nézve specifikus információkat tud továbbítani. Az üzenetet azért mindig olyan jelekké kell átalakítanunk, amelyek a rendelkezésünkre álló csatornán átvihetők. (Természetesen ha van rá lehetőség, fordítva is eljárhatunk, közleményünkhöz kiválasztjuk a megfelelő csatornát). Ez az azonban ritkábban fordul elő. A jelek átalakítását kódolásnak nevezzük. Ha egészen pontosak akarunk lenni, azt kell mondanunk, hogy a kommunikációban mindig átkódolást végzünk, sőt legtöbbször az üzenetet két-háromszor is át- és visszaalakítjuk. Ha például az információ forrása az ember, az első átkódolás akkor zajlik le, amikor a gondolatainkat, amelyek az agynak nevezett információfeldolgozó és -tároló berendezésben valamilyen formában el vannak raktározva, szabályos nyelvi formába öntjük. A második akkor, amikor beszédhanggá alakítjuk. Adott kommunikációs szituációban legtöbbször a kommunikációs láncnak csak egy szakaszát vizsgáljuk, s így teljes joggal beszélhetünk az illető szakaszra vonatkozó kódolásról.

Az információt a tároláshoz is át kell alakítani. (Végül is a tárolás azt jelenti, hogy az információt nem térbeli, hanem időbeli csatornára bízzuk). Nemcsak a csatorna, sokszor a címzett adottságai teszik szükségessé az üzenet átkódolását, főleg az ember - ember kommunikációban.

Kódolással az információátvitelben még két, egymással ellentétes célkitűzést lehet megvalósítani: a redundancia csökkentésével növelni lehet az átvitel sebességét, vagy éppen ellenkezőleg, a redundancia növelésével javítani lehet az átviteli biztonságot.

A csatornáról szólván, már beszéltünk a zajról, amely az üzenetet fenyegeti. A kódolásnál és dekódolásnál is fellép a zaj, becsúszó hibák az üzenetek érthetőségét veszélyeztetik. Ha például a kártya- vagy szalaglyukasztó gép hibásan perforálja egy betű kódját, az ember hibás jelet üt le, beszéd közben szót téveszt, az üzenet eltorzul. Vagy amikor egy szöveget egyik nyelvről egy másik nyelvre fordítunk, nagyon könnyen becsúszhat egy-egy leiterjakab. (Lásd Karinthy Herz-féle szalámiját). Ezek a hibák a rendszertorzítás kategóriájába tartoznak, s elméletileg teljesen kiküszöbölhetők.

Lássuk ezek után, mi is a kódolás?

A kódolás az az eljárás, amely egy nyelv véges ábécéjéből képzett szavakat kölcsönösen egyértelmű módon hozzárendel egy másik nyelv meghatározott szavaihoz. Másképp fogalmazva: a kód egy olyan leképzési előírás, amely egy jelkészletet egy másik jelkészletbe visz át, s a kódolás ennek az előírásnak a végrehajtása. A kódolással ellentétes eljárás a dekódolás.

A kód tehát két jelkészlet és egy leképzési utasítás. A legfontosabb éppen a legegyszerűbb, a bináris, két elemű kód: 1 és 0, vagy pont és vonás, vagy “van áram” és “nincs áram”, vagy “igen” és “nem”.

A kódolásnak az információátvitelben kettős célja van. Egyrészt az üzenetet a csatornán átvihető alakra kell hozni, másrészt ezt úgy kell végrehajtani, hogy az üzenet minél gazdaságosabban, minél rövidebb idő alatt és minél kevesebb veszteséggel jusson el a csatorna másik végébe. (Az adatfeldolgozásban a kódolásnak más céljai is vannak: az adatok azonosítása, tömörítése, szabványosítása, osztályozása, az emlékeztetés stb. Főleg az utóbbi időben vált nagyon időszerűvé az adatok tömörítése átkódolás révén).

Bár Shannon nevét általában az információmennyiség meghatározásával kapcsolatban szokták legtöbbször emlegetni, információelméleti munkáiban a kódolás elvi kérdéseit is tisztázta, sőt eljárást is dolgozott ki az optimális kódolásra. A shannoni tétel kimondja, hogy valamely meghatározott kódábécé esetén egy és csakis egy olyan ábrázolási mód van, amely adott mennyiségű információt a lehető legkevesebb jellel fejez ki. Ez az optimális kód. Ha az üzenetet több jellel fejezzük ki, redundánssá válik. Ez történik például, amikor egy olyan ábécét kell bináris kódra átírnunk, amelyben a betűk száma nem kettőnek egész számú hatványa. Egy 26 betűs ábécét csak 5 bináris számjeggyel írhatunk át (2⁴<26<2⁵). A látszólagos információmennyiség tehát 5 bit, holott egy betűhöz csak 4,65 bit tényleges információmennyiség tartozik. A parazita információk arányát csökkenthetjük, ha a betűket nem egyenként, hanem kettesével, hármasával stb. kódoljuk. Így azonban a kód egyre bonyolultabbá válik és nő a kódolás költsége. Amit nyertünk a réven, elveszítjük a vámon.

A csatornakapacitás egyik meghatározása: az információmennyiség, amelyet egy adott csatornán optimális kódolás mellett az időegység alatt át lehet vinni. Shannon azt is megállapította, hogy alkalmas kódolási eljárással zaj jelenlétében is megvalósítható tetszőlegesen kis hibavalószínűségű információátvitel, ha az átvitel sebessége kisebb a csatorna kapacitásánál.

A kódolásnál elsőrendű követelmény a dekódolhatóság. Ha a vevő nem tudja az üzenetet, nem lehet szó kommunikációról. A megfejtés akkor lehetséges, ha az üzenet egyértelműen dekódolható. Ennek szükséges - de nem elégséges - feltétele, hogy a különböző közleményekhez rendelt kódközlemények különbözőek legyenek.

A legegyszerűbb kódolási eljárás a betűnkénti kódolás: a forrásközlemény minden betűjéhez hozzárendeljük az illető betű kódját. Hiába különböznek azonban az egyes betűk kódjai egymástól, az üzenet attól még nem lesz egyértelműen dekódolható. Ha ugyanis a jeleket egymás után írjuk, a jelsorozatot többféleképpen is felbonthatjuk. A morze ábécé jeleiből összeállított alábbi kódszó kétféleképpen is értelmezhető:

így: vagy így:

e r e k f e n t

Ezen a bajon Morse úgy segített, hogy a betűk közé szünetet iktatott be. Az egyértelműséget azzal fizette meg, hogy hosszabbá tette az üzenetet. Baudot más megoldást választott: minden betűnek azonos hosszúságú kódjelet feleltetett meg. Így az üzenetet egyértelműen tagolni lehet, viszont ezzel a módszerrel is hosszabbá is válik.

A változó kódhossz sokkal gazdaságosabb, mivel lehetőség van arra, hogy figyelembe vegyük a forrásábécé jeleinek gyakoriságát, s a gyakrabban előforduló jeleket rövidebb, a ritkábban előfordulókat hosszabb kódjelekkel kódoljuk. Ezt tette Morse is: az angol nyelv betűgyakorisága alapján állította össze ábécéjét. A gazdaságosságnak van még egy feltétele: az, hogy a betűk minden elválasztás nélkül egyértelműen dekódolhatók legyenek. Ez a feltétel csak akkor teljesül, ha úgynevezett prefix tulajdonságú, irreducíbilis kódot alkalmazunk. Ilyen az a kód, amelyben a kódszók mind különböznek, s egyiket sem kaphatjuk meg a másikból kódjelek utánaírásával, azaz egyik kódszó sem folytatása a másiknak: az állandó kódhosszúságú kódok mindig irreducíbilisek, ha a kódszavak különböznek.

Változó hosszúságú irreducíbilis kódot legkönnyebben úgynevezett kódfa segítségével szerkeszthetünk. Fának nevezzük az olyan irányított gráfot, melynek egy kitüntetett szögpontjából, a kezdőpontból ágak indulnak ki. Ezek a későbbi szögpontokban ismét elágazhatnak, de újra nem találkozhatnak. Azokat a szögpontokat, amelyekből már nem indulnak ki élek, végpontoknak nevezzük. A kezdőpontot a végponttal összekötő ágak hosszát az őket alkotó élek száma adja meg.

Bináris prefix tulajdonságú kódot egy olyan fával szerkeszthetünk, amelynek kezdőpontjából és minden szögpontjából - amely nem végpont -, két ág indul ki. Az alsó ághoz rendeljük mindig a 0-t, a felsőhöz az 1-et. Osszuk a forrás jelkészletét két részhalmazra, az egyiket rendeljük a 0 ághoz, a másikat az 1 ághoz, s az eljárást folytassuk mindaddig, amíg a részhalmazok már csak egy-egy elemet tartalmaznak. Így minden végpont egy-egy kódszónak felel meg, s pontosan annyi végpontunk lesz, ahány kódszóra szükségünk lesz, azaz ahány jelből áll a forrásábécé. Minden kódfa prefix tulajdonságú kódot ábrázol, ha csak a végpontokhoz rendelünk kódszót.

Download 8,26 Mb.

1 ... 4 5 6 7 8 9 10 11 ... 47

Download 8,26 Mb.