• 3.23 Mesterséges intelligencia
  • 3.24 Optikai információtárolás
  • 3.241 CD-ROM lemezes adatbázisok
  • 3.242 Képi információk elektronikus feldolgozása
  • 3.243 Az optikai információs rendszerek könyvtári alkalmazása
  • 3.25 Hipertext, hipermédia
  • Online információterjesztés




    Download 6,4 Mb.
    bet11/21
    Sana25.03.2019
    Hajmi6,4 Mb.
    #4514
    1   ...   7   8   9   10   11   12   13   14   ...   21

    3.22 Online információterjesztés


    A harmadik generációs számítógépek működésének az információ megszervezé­sében és hozzáférhetővé tételében a korábbi módszereket kiváltó formája az online információ­terjesztés és -keresés. Ennek célja a “rögzített tudás hasznának növelése”, amelyet felhasz­náló­barát módon, interaktív üzemmódban ér el. Az online rendszerben a keresőkérdést természetes nyelven lehet megfogalmazni és ugyancsak közvetlenül értelmezhető formában kapja meg a kérdező a választ. Az online keresés azonban “sokkal több, mint a kézi keresés meggyorsítása” - más keresési stratégiát, kérdezési technikát és értékelési módszert kíván meg, mint a hagyományos katalógusokban, segédletekben való tájékozódás. R. Summit véle­mé­nye szerint: “Ha valaki nem tudja megtalálni, amire szüksége van, nem is tudja elolvas­ni.”132 - vagyis (némi túlzással) a számítógépes információkereső rendszerek használatának készsége mára az írni-olvasni tudás képességével egyenrangúvá vált.

    A mai online keresési technológia - oly sok máshoz hasonlóan - az amerikai űr­program mellékterméke. Az 50-es évek végén a szovjetekkel folytatott erőltetett versengésben az amerikai űrkutatási hivatalnál, a NASA-nál mintegy 200 000 kutatási jelentés gyűlt össze. Az ezekben való tájékozódás rendkívül fontos volt, ezért egy IBM 1401 típusú számítógép segítségével mágnesszalagos szekvenciális keresőrendszert dolgoztak ki, amely batch üzemben (második generációs gépről volt szó!) 22 óra alatt tudta “átnézni” az állományt. Summit a fejlesztés motivációjaként a lassúság mellett a bizonytalanságot is megemlíti: a kérdésben a tárolt információhoz képest egész kismértékű eltérés is téves találatokat hozott, és mert a keresést menet közben már nem lehetett módosítani, adott esetben az egész procedúrát meg kellett ismételni. A Lockheed cég 1964-ben állította üzembe a harmadik generációs számítógépek proto­típusának tekintett IBM 360/30 berendezést, amelyen kifejlesztettek az eddigiektől eltérő felépítésű információkereső rendszert, a DIALOG-ot. Az online üzem­módban 4-5 perc alatt végezték el az addig 22 órát igénybevevő keresést.

    A mai legnagyobb online információszolgáltató, az 1972 óta üzleti alapon álló DIALOG Infor­ma­tion Retrieval System 1989 végén több mint 330 adatbázis 190 millió tételét tette hozzá­férhetővé 97 ország mintegy 100 ezer, önálló jelszóval rendelkező felhasználója/közvetítője számára. Az adatbázisok több mint 10 ezer szakfolyóirat közleményeiről, 1 millió nemzetközi és 10 millió nemzeti cég adatairól, 14 millió szabadalomról, 8,75 millió vegyületről tájékoztatnak. Új keletű szolgáltatásként 800 folyóirat, könyv, konferenciaanyag stb. teljes szövegét is lehet olvasni. Az eddig kizárólag alfanumerikus adatokat közlő adatbázisok mellett 1988-tól a grafikus ábrázolás is megjelent: a TRADEMARKSCAN az USA-ban regisztrált védjegyek grafikus ábráit is tartalmazza. A képi információk online szolgáltatásába másodikként a HEILBRON adatbázis lépett be, ez 1989-től kezdve közöl kémiai ábrákat.133

    Az online szolgáltatások fejlesztése több irányból is kap inspirációt, illetve támo­gatást. Technikailag új minőséget eredményez az integrált szolgáltatású digitális háló­zat (ISDN = Integrated Services Digital Networks) kiépítése, amely a korai 300, majd a jelenleg Európában átlagosnak tekinthető 9 600 bit/sec gyorsasághoz képest 64 000 baudos sebességgel, zavarmentesen továbbítja az információkat. (Summit hasonlata szerint az ISDN a régi telefon­vonalas hálózathoz úgy viszonyul, mint egy távadat­feldolgozású, időosztásos számítógép a számolótáblához.) Az ISDN-t egyenesen a “kommunikációs álmok megvalósulásának” tartják, melynek következtében meg­szűnnek a modemek és velük együtt a zajos telefonvona­lak is. Az új távadat­feldolgozó rendszer azonban nemcsak jóval gyorsabb, de olcsóbb is lesz, így a jelen­leginél sokkal több teljes szövegű adatbázis szolgáltatása válik lehetővé.

    A forrásdokumentumok tárolása az eddigi informatív vagy jeladó tájékoztatás helyett újabb jelentős előrelépést hoz az információközvetítés terén. Ha az olvasó a keresés során megtalálja az őt érdeklő témát, nem kell a primer dokumentumok gyűjteményéhez (a könyvtárhoz vagy más dokumentum-szolgáltató céghez) fordulnia a kérésével és várnia az eredeti dokumen­tumra, hanem azonnal hozzájut a tartalmi információkhoz is. A forrásdokumentumok online közreadása úgy is elképzelhető, hogy retrospektív módon, megfelelő optikai leolvasó eljárásokkal beolvasnak meglévő szövegeket, de úgy is, hogy az új publikációkat számítógép közbeiktatásával készítik el és rögtön tárolják is a leírtakat.

    Az online szolgáltatások felfutását segíti a személyi számítógépek óriási mértékű elterjedése is. Miközben áruk erősen lefelé, kapacitásuk jelentősen fölfelé ível, jó minőségű interfészek és perifériák is megjelentek a piacon. A nagyfelbontású színes megjelenítővel, nyitott operációs rendszerrel és teljes képoldalt másoló nyomtatóval forgalomba kerülő konfigurációk egy újabb álom valóra válását ígérik: a hivatásos információközvetítők mellé belép a közvetlen felhasználók népes tábora. Mindemellett az online hálózathoz való közvetlen csatlakozást olyan új szoftverek is segítik, mint a DIALOGLINK, amely a személyi számítógépekhez kapcsolódó távközlési modult és a programcsomagot is tartalmazza.134

    Az online lekérdezés hatásfokát nemcsak a technikai feltételek javításával, de szoftver­fejlesztésekkel is igyekeznek növelni. Ezek közül elsőként említésre méltó a már működő közös parancsnyelv, a CCL (Common Command Language) kidolgozása, amely a felhasználót mentesíti az alól, hogy ismerje a kérdéses adatbázis nyelvezetét.

    Hazánkban 1988 óta működik az az országos Információs Infrastruktúra Fejlesztési (IIF) telekommunikációs hálózat, amelyen keresztül számos magyar adat­bázist szolgáltatnak online üzemmódban. Az IIF hálózatot úgy tervezték és alakították ki, hogy ezen keresztül az összes nagy európai és tengerentúli online szolgáltató elérhető legyen. A hazai telekommunikációs rendszer az adatbázis-lekérdezésen túl számos egyéb szolgáltatást nyújt, így többek közt elektronikus levelezőrendszert és faliújságot üzemeltet, fájl-transzfert biztosít stb. Az IIF felépítésének egyik érdekes sajátossága, hogy van egy központi szolgáltató host számítógép - mégpedig a Magyar Tudományos Akadémia Számítástechnikai Kutatóintézetében (MTA SZTAKI) -, amely számos adatbázis online elérését teszi lehetővé, de emellett jó néhány IIF-tagintézmény a saját számítógépén biztosítja az általa épített adatbázis(ok) elérését. Jellemző példa a kétféle megoldásra: az Országos Széchényi Könyvtár a nemzeti bibliográfiai rekordokat tartalmazó NEKTÁR rendszert a saját gépén, a külföldi folyóiratok központi katalógusát, a Nemzeti Periodika Adatbázist pedig a SZTAKI-ban lévő számítógépen teszi hozzáférhetővé.

    Az IIF hálózat felépítéséből adódóan a központi számítógépen lévő összes adatbázist egyetlen szoftver - korábban a CDS/ISIS, 1992-től pedig a BRS/Search - adatbázis-kezelővel, az egyes adatbázis-építők viszont saját szoftvereikkel - így például a Széchényi Könyvtár a NEKTÁR-t a DOBIS/LIBIS-szel - szolgáltatják.135 Ma még hazánkban az online elérésű adatbázisok túlnyomó többsége bibliográfiai jellegű - köztük az előzőekben említett NEKTÁR és NPA -, de újabban készülnek faktografikusak is; mint például a Ki kicsoda? adatbázis, amely szintén az IIF hálózaton keresztül érhető el.

    Az online szolgáltatások mellett, de gyakran ezektől teljesen függetlenül is használnak távmásoló berendezéseket. Működésük kissé leegyszerűsítve a következő: a telefonvonalhoz vagy ahhoz hasonló más kommunikációs csatornához kapcsolt berendezés a másolandó dokumentum egy-egy lapját fényérzékeny elektronikus készülékkel letapogatja, megkülön­böz­tetve a papír különböző fedettségű területeit. A gép ezeket a jeleket elektronikus impulzu­sokká (bitekké) kódolja és ezeket a kódokat a vonalon (csatornán) továbbítja. A fogadó félnél is működik egy hasonló berendezés, amelyet a kapott kódok vezérelnek és így pontról-pontra rekonstruálja a vonalon érkező “képet” (kézzel vagy géppel írt szöveget, ábrát, nyomtatott dokumentum-részletet stb.). Azokat a berendezéseket, amelyek bizonyos tűréshatárokon belül az eredetivel (közel) azonos minőség reprodukálására képesek, telefakszimile vagy egy­szerűsítve telefax készüléknek nevezik. Felbontóképességük általában 200 x 200 pont/inch (de ismeretesek 400 x 400-asok is), átviteli sebességük a minőségtől függően 1 oldal/perc-től (4 800 baud) 1 oldal/sec-ig (56 000 bit/sec) terjed. A könyvtári területen a távmásolásnak a kölcsönzési kérések, illetve dokumen­tummásolatok gyors továbbításában van nagy jelen­tősége.136 (Talán nem is kell külön hangsúlyozni, hogy a telefax készülékek képek továbbí­tására is alkalmasak, bár a jelenleg elterjedt 200 x 200-as felbontással inkább csak egyszerűbb vonalas ábrák reprodukálhatók elfogadható minőségben.) Az adatbázisokhoz kapcsolt elektronikus postai és távmásoló szolgáltatások mind arra utalnak, hogy az online információ­keresés a közeljövőben is az információs ipar egyik dinamikusan fejlődő ágazata lesz.


    3.23 Mesterséges intelligencia


    Az első fejezetben nagy vonalakban ismertetett neurológiai kutatások eredmé­nyeit jól hasznosítja a mesterséges intelligencia (artificial intelligence - AI). E dina­mikusan fejlődő új terület célja, hogy alkalmassá tegye a számítógépet az emberi intelligenciával megoldható feladatok ellátására. A mesterséges intelligencia - az in­formatikához hasonlóan - egyrészt tudomány, másrészt technológia. Ha a megismerés újfajta szemléletének tekintjük, a termé­szettudományok közé sorolható, de tekint­hetjük műszaki tudománynak is, amelynek feladata egy adott működés minél jobb minőségű létrehozása.137 A mesterséges intelligenciával kapcsolatos első kísérletek csak az 50-es évek végén kezdődtek; de 2-3 évtized alatt önálló alkalmazási területei alakultak ki: tudástechnológia és -ábrázolás, logikai elméletek alkalmazása, probléma-keresés és -megoldás, természetes és programnyelvek feldolgozása, tételbizonyítás, alakfelismerés, játékelmélet, szakértő rendszerek, robotika stb.

    A mesterséges intelligencia kulcsproblémájának a tudás ábrázolását tartják. A tudás kétféle lehet:

    - tényszerű: adatok, tények, know-what;

    - eljárási tudás: folyamat, know-how.

    A számítástechnikában eddig megszokott adatbankok és az AI tudásbankok közötti átmenet folyamatos. A tudásábrázoló rendszerek J. Kohlas szerint alaki és levezető rendszerek lehetnek. Az alaki rendszerek két nagy csoportja a kinyilatkoztató és az eljárási rendszerek.138

    A problémára különösen jellemző, a tényszerű tudást leíró kinyilatkoztató rend­szerekben a tudás kiegészítését a problémától független általános levezető mechaniz­musok teszik lehető­vé. A rendszer - éppen a problémától való függetlensége révén - kevéssé hatékony. Ezzel szemben az eljárási rendszerek az adott problémamegoldó folyamattal kapcsolatos know-how-t gyűjtik össze és ezt használják fel. Az eljárási rendszerek a kérdéses problémát tekintve ugyan hatékonyak, viszont nem általánosíthatóak, velük csak a szóban forgó specifikus probléma megoldása alakítható ki. A két megközelítést kombináló rendszerek - nagyobb hatékonyságuk és általánosabb alkalmazhatóságuk révén - sikeresnek ígérkeznek. E szintézis kialakítására, a tény-szerű és az eljárási tudás összekapcsolására irányuló kutatásaiban Minsky bevezette a frame (keret) fogalmát. Frames-nek azokat az általános struktúrákat nevezte, amelyek a tudás ábrázolásának megszervezését és a kapcsolatok kialakítását szolgálják. A frame “állványként” vagy “keretként” szolgál, amelyben meghatározott helyekre (“csomópontokra”) elrendezhető az adott tárggyal kapcsolatos összes tényszerű vagy eljárási tudásanyag.

    A levezető rendszerek elsősorban a logikai szabályokra építenek. Felhasználják a kijelentés- és állításlogika, illetve az elsőrendű logika szabályait. A levezető rend­szerek a problémát a ha ... akkor típusú kifejezésekkel kódolják. A kijelentéslogika szerint a ha ... akkor egy kijelentés, az állításlogika szerint mondat is lehet. A kijelentéslogika igaz vagy hamis premisszára alapul. A problémát tantétel (teoréma) formájában fogalmazza meg, így a probléma-megoldás analógiája a teorémabizonyítás lesz. A levezető rendszerben a problémát egyrészt egy adatsor (pl. kijelentések halmaza), másrészt a cél (pl. egy másik kijelentés) határozza meg. Az alkalmazható levezetési szabályokat - amelyekben a ha rész egyezik az adatokkal - egy interpretátor keresi meg. Amennyiben a rendszer megtalálja ezt a levezetési szabályt, csatolja az adatok akkor részét, és addig keres, amíg már nincs több alkalmazható szabály és a cél megegyezik az adatokkal. Ez a megoldás a szakértő rendszerek kedvelt kiindulópontja.139

    A szakértő rendszerek az emberi szakértelmet hivatottak reprezentálni, és így speciális szaktudást követelő feladatokat képesek megoldani. Tényszerű és eljárási tudást egyaránt tartalmaznak, mégpedig tények, szabályok és heurisztikák formájában. (A heurisztika minden olyan elv, szabály, következtetés, értékelés, amely egy bizonyos szituációban többnyire igen, de nem minden esetben működik.) A szakértő rendszerek két összetevője a tudásbázis és az általános következtető rendszer. A tudásbázis tartalmazza a tényeket, az eljárási rendszer a szabályokat és a heu­risztikákat. Ez utóbbi rendszer értelmezi a kérdést és sorolja az alkal­mazandó követ­keztetési szabályokat. (A szakértő rendszer tudására egy konkrét példa: egy 1 500 szabályt tartalmazó, a bakteriális megbetegedéseket tárgyaló rendszer “tudása” egy átlagos orvos szintjének felel meg.)140

    A szakértő rendszerek ígéretes lehetőséget jelentenek a könyvtári tevékenység valamennyi területe számára is. Eddig főleg a tájékoztató, referensz jellegű kérdések megválaszolására dolgoztak ki ilyen rendszereket. Fő előnyeik: az emlékezet, a követ­kezetesség és a tárgyila­gosság - itt mutatkoznak meg igazán. Thompson azonban fel­hívja a figyelmet arra, hogy ugyanilyen haszonnal járna a katalogizálás, az osztályozás és az oktatás/kutatás terén is a szakértő rendszerek alkalmazása.141

    A tudásábrázoláshoz szükséges adatbázis bonyolultan összetett, adatszerkezetét különböző listák és hierarchikusan strukturált jelképsorozatok alkotják. A mesterséges intelligencia számítógépes programjainak lényeges elemei a teorémabizonyítás, a mintakészítés és a rekurzió. Ez utóbbi egy algoritmus szerint ismétlődő lépésekből álló műveletsorozatot jelent; az eredmény egyben újabb műveletek kiindulópontja. Nagyon lényeges az ember és a gép közötti kommunikáció, ezt különböző eszközök és módszerek szolgálják (egér, nagyfelbon­tású grafika, ablaktechnika stb.). A mester­séges intelligencia klasszikus programnyelve a LISP, ezt McCarthy még 1960-ban fejlesztette ki. A List Processing listákat tartalmaz az adatokról és a procedúrákról (eljárásokról) is. Ez a programnyelv sok (talán túl sok) “nyelv­járásban” létezik, ezért most a “szabványos” formáját, a COMMON LISP-et igyekeznek elterjeszteni. A PROLOG újabb programnyelv, ez az állításlogika kijelentéseiből épül fel és inkább a tényszerű tudás deklarálására szolgál.142

    Más célra dolgozták ki az ún. fogalomalkotó programokat, közülük Langley BACON prog­ram­­ja néhány egyszerű fizikai-matematikai alapfogalom definíciójából indul ki. BACON “felfe­dezte” Kepler harmadik törvényét, illetve Snellius-Descartes, valamint Ohm és Kirchhoff törvényét. Lenat Automated Mathematics (AM) programja a kiinduló fogalom és formula alapján újabb formula generálása által matematikai fogalmak felfedezésére szolgál. A 115 szabályt tartalmazó program érdekesebb ered­ményei: meghatározta az egész számok fogalmát, megállapította a négy alapművelet és a prímszámok mibenlétét és “felfedezte” a számelmélet alaptételét, ti. hogy “minden szám egyértelműen előállítható prímszámok szorzataként”. Lenat AM-jét fejlesztette tovább az EURISKO program, amely tulajdonképpen “evolúciós” elven “bánik” a heurisztikákkal. Kiindulópontja az a megállapítás, hogy bizonyos heurisztikák nemcsak formulákkal, hanem a többi heurisztikával is dolgoznak, sajátos mód­szerével felülírja a kevésbé “életképes” heurisztikákat. A “programmutációk” ugyan már kevésbé voltak érthetőek, de az EURISKO kapcsán vetődött föl a kérdés: lehet, hogy az “igazi” gépi intelligencia emberi ésszel esetleg fölfoghatatlan? 143

    A computer vision, pattern recognition, image processing kifejezések tulaj­donképpen szinonimák: a mesterséges intelligencia egyik legfontosabb ágát, a számí­tógépes alakfelis­me­rést jelentik. E tárgykör egyik legnagyobb problémája a tárgy és a háttér megkülönböztetése. Az erre a célra alkalmazott egyik módszer a szegmentálás (részekre bontás), amely az egyes elemek átkapcsolódásai, de főleg az árnyékvetés miatt igen nehéz. Egyik megoldásként a sztereo-leképezést alkalmazzák, melynek lényege, hogy a tárgyról két különböző helyzetből készítenek felvételt és ezeket elemzik először kettő, majd három dimenzióban. A két­dimen­ziós értékelésnél a terü­lethatárok, a textúra és a fényintenzitás változásait mérik és ebből számítják ki az összes látható képpontot. A háromdimenziós elemzés során a felületek irányí­tottságáról szóló információkat gyűjtik. Egy másik eljárás szerint több kép össze­vetéséből mérik az ún. sztereoszkópikus mélységet. Van olyan kísérlet is, ahol a felületi irányítottságot a sztereoszkópikus mélységgel együtt mérik és ezt egészítik ki az intenzitás adatokkal. A háromdimenziós felületek vetületeinek számításából is érdekes módszer született: a térbeli modellt összevetik a háromdimenziós ábrázolással és kiszámítják, származhat-e a képen ábrázolt elrendezés a modell vetületeiből.

    A számítógépes alakfelismerésre többféle eljárást dolgoztak ki: a jellegzetességek detektá­lását, a textúra analízist, a felületi irányítottság becslését, a képösszevetést, a szegmentálást, a tulajdonságmérést, a távolságbecslést, a modellel való összevetést stb.144 A szegmentálás egyik módja a képet elemeire bontja és tulajdonságaik alapján (szürke-szint mérése, helyi textúra mérőszámok, szín stb.) clusterálja a képelemeket. Ismeretes olyan szegmentálás is, amely nem a képelemeket, hanem területeket vizsgál. A split and merge (feldarabolás és egyesítés) nevű módszer a képet homogén területekből állítja össze. A modellel való össze­vetés talán a legnehezebb művelet, pedig ennek jó megoldása vezethetne a legjobb ered­mé­nyre. Lényege, hogy a már ismert modellekhez (vö. Gregory vizuális mintáival) hasonlítja az alakzatot, és a hasonlóság fokából következtet a valóságos tárgyra. Az eljárásban hierarchikus model­leket, relációs struktúra-analízist, statisztikai következtetéseket stb. alkalmaznak.

    A számítógépes alakfelismerés egyik speciális alkalmazási területe a karakter-felismerés, amelyet a könyvtárakban régi katalóguscédulák automatikus feldolgo­zására, olvasói nyilván­tartásokra stb. alkalmaznak. A karakter-felismerési eljárások az előzőekben említettek közül összehasonlító, illetőleg statisztikai vagy strukturális módszereket követnek. A karakter-felismerés roppant egyszerű elvre épül: a jelek adott X halmazáról, amelynek elemei egyértelműen az X különböző osztályaiba sorolhatók, el kell dönteni, hogy az egyes jelek mely osztályba tartoznak. Egy osztály egy elemét egy karakter és annak formaváltozatai képviselik. A számítógépes algorit­mus két irányból közelíti meg a problémát:

    - egyrészt egy X-beli elemről el kell dönteni, melyik osztályba tartozik;

    - másrészt egy jelről fel kell ismerni, ha nem X-beli elemről van szó.

    Az információ feldolgozásához analóg-digitális átalakítókat, a digitalizált jelek értelmezésére pedig számítógépet használnak. A leolvasás többféle berendezéssel is megoldható, így tv-kamerával, lézeres letapogatással, CCD töltéscsatolt képbontóval. A CCD kamera felbontó­képessége 300 pont/inch - ez azt jelenti, hogy egy A/4-es oldalról 1 Mbyte-nyi, tehát 1 millió bináris információt készít. Talán nem is kell külön hangsúlyozni, hogy a hagyományos cédulakatalógusok retrospektív feldolgozása milyen nagy jelentőségű. Megfelelő berende­zésekkel és programokkal a MARC előírásoknak megfelelő rekordokat lehet előállítani, mégpedig a manuális feldolgozás költségeinek 10-50%-áért.145

    A mesterséges intelligencia problémamegoldó eljárásainak a szekvenciális fel­építésű számító­gépek szoros határokat szabnak. A probléma terjedelmével a számítási műveletek száma exponenciálisan nő, ezért a kereteket a párhuzamos feldolgozási lehetőségek számának növelésével igyekeznek növelni. Ezt a kérdést ma csak az al­goritmusok párhuzamossá tételével tudják megoldani, valódi párhuzamos algo­ritmusokat még nem sikerült kidolgozni (vö. párhuzamos processzorok az ötödik generációs számítógépeknél).


    3.24 Optikai információtárolás


    Az utóbbi néhány évben új információhordozó, az optikai lemez tört be minden eddiginél látványosabban a könyvtári-tájékoztatási szakterületre. Ezek a kiváló minőségű és hatalmas kapacitású lemezek hirtelen szó szerint is megfogható közel­ségbe hozták az eddig kissé elidegenedett, személytelenül misztikus adatbázisokat, de az optikai lemezeken váltak először a szövegekkel egyenrangúvá a képi információk is. Témánk szempontjából ennek az új médiumnak oly nagy a jelentősége, hogy ki­emelten fogunk vele foglalkozni.

    Az információközvetítés legújabb kori forradalma egy zseniálisan egyszerű elvre épül. Ha kellően kis szegmensekre bontjuk a feldolgozásra váró információ-halmazt, valamennyi eleméről megállapíthatunk egy adott kritérium szerint meglévő, illetve meg nem lévő tulajdonságot, amely egy adott logika szerint az igen vagy a nem egyértelmű megfeleltetése. Ez az ún. bináris elv vonul végig az egész számítás­technikán, amelynek kódolási alapelve a kettes számrendszerre épül, és ugyanezt a princípiumot érvényesíti az információrögzítésben is. A széles körben ismert mágneses adathordozókon ezt a bevonat apró részecskéinek mág­neses volta reprezentálja: egy szegmens mágneses vagy nem mágneses állapota az 1 illetve a 0 (igen - nem) állapotnak felel meg. Ugyanezt képviseli a dipólmomentumok irányának a különbsége is; ez az irány a mágneses erőtér megváltoztatásával megfordítható. Ezen az elven alapulnak a mindennapi életben elterjedt magnetofonszalagok vagy az egyre ismertebb mikro­szá­mítógépek lemezei, de a nagyszámítógépek mágnesszalagjai és -lemezei stb. is. A mágne­sezhetőség azonban önmagában hordozza alkalmazási korlátját is: a mágneses kölcsön­hatás miatt nem lehet egy adott érték alatt képezni a szegmenseket; az olvasási sebesség pedig nem lehet gyorsabb annál az időtartamnál, amelyet a mágnestekercsen átfolyó áram, illetve az irány­váltás ideje meghatároz. A szöveges információk tárolására különösen jó, hatékony segédeszközt jelentenek a különböző mágneses adathordozók: a szalagok, lemezek, dobok stb. Az írásjeleket nagyon könnyű a bináris kódokkal kifejezni, a számítógépes feldolgozás alapegységét jelentő 1 byte hosszal például a latin betűs íráskészletet maradék­talanul le lehet kódolni. A mágneses hordozók kapacitása azonban a képek digitalizálásához már kevésnek bizonyult: amíg egy A/4-es szövegoldal tárolási igénye 1 000-1 500 byte, addig egy ugyan­akkora színes kép digitalizált változata a felbontástól függően 400 000 - 4 000 000 byte helyet igényel.146

    A kutatók új módszereket és eljárásokat kerestek, így fordult az érdeklődés az optikai technológiák felé. Az első optikai képdigitalizáló és tároló rendszerek a 80-as évek elején jelentek meg Japánban, majd röviddel ezután az Egyesült Államokban.

    Az optikai tárolás az információrögzítésre a mágnesesség helyett a fényt használja, amelynek 10 mm hullámhossza lehetővé teszi, hogy két szomszédos bit között a távolság mikrométe­rekben legyen mérhető. A rendkívül kis tartományok fókuszálását a gyakorlatban megfelelő optikai rendszerrel és lézerfénnyel valósítják meg. A lézer olyan egyfrekvenciájú, monokro­ma­tikus elektromágneses sugárzás, amelynek egyáltalán nincs sávszélessége - ennek köszön­hetően mentes minden diffe­renciális diffrakciótól (szóródástól). A korszerű szabályozás­technikával a lézer­nyalábot olyan pontosan be lehet határolni, hogy az átvitel hűsége gyakorlatilag 100%-os, vesztesége pedig 0%-os.-6

    Az optikai rögzítést eleinte zenei és filmfelvételekre használták. A kísérleteket a 70-es években kezdték az analóg jelek digitális jelekké oda- és visszaalakításával. Az első 12 inch átmérőjű optikai lemez 1978-ban jelent meg, kb. 1 órás videofelvétellel. 1983-ban került piacra az első 12 cm átmérőjű optikai lemez 75 percnyi, kiváló minő­ségű zenei felvétellel. Nem sokkal ezután kezdték információtárolásra is használni a lézerlemeznek is nevezett új optikai médiumot.

    A mai optikai lemezek általában 3 anyagrétegből állnak: a legbelső kemény réteg biztosítja a fizikai szilárdságot, ezt borítja az információhordozó fényvisszaverő réteg, melyet kívülről védőbevonat óv a külső sérüléstől, szennyeződéstől. Információ­rögzítésre ma többnyire vékony tellurium-ötvözetet használnak, amelybe az adatbevitel előtt egyenletesen igen sekély, folyamatos barázdát vágnak. Az egyes hornyok távolsága 1,6 mm. Az információ felvitele kemény lézersugárral történik, amely a felületbe kis mélyedéseket, gödröket (piteket) éget. A 0 és az 1 biteket ezeknek a gödröknek a sík részbe való átmenetei hordozzák. A pitek mélysége 0,1 mm, szélessége 0,6 mm - ezzel a jelsűrűséggel négyzetmilliméterenként 1 millió bitet lehet tárolni. A leolvasás olyan lágy lézernyalábbal történik, amely már nem okoz felületi elválto­zást, csak visszaverődik a mélyedésekről. A visszavert kiolvasó lézersugarat egy fotodióda érzékeli, amelynek felülete négy zónára oszlik. A barázdából visszavert fényt egy prizmához hasonló optikai hasáb ugyancsak négy részre osztja, ezek összevetésével biztosítja a szabályozórendszer, hogy a kiolvasó sugárnyaláb 0,1 mm pontossággal mindig a barázdában maradjon. A lemezek leolva­sására két módszer terjedt el: ha a tárolási kapacitást a hozzáférési idő “rovására” kívánják növelni, állandó lineáris sebességgel, ha pedig gyorsabb hozzáférést akarnak biztosítani, állandó szögsebességgel forgatják a lemezeket.147

    Az optikai lemezek lejátszásához speciális leolvasó készülék szükséges. Az információ­tárolásra használt lemezek speciális szoftverrel együtt kerülnek forgalomba, így ezeket a lejátszókat számítógéphez csatlakoztatva lehet működtetni. A háztar­tásokban használt lézer-audiolemezek (közhasznú néven kompakt lemezek) lejátszó­jában egy digitális-analóg konverter található, ha ehelyett megfelelő interfészt (csat­lakozót) építenek be, ezek a lejátszók is csatlakoztathatók a számítógépekhez.

    Az optikai lemez gyűjtőnév, amely több - és egyre több - típust foglal magába. Kategorizálá­sukban és elnevezésükben a szakirodalom nem egységes, a leggyakrabban a felhasználás lehetőségei szerint különböztetik meg az egyes típusokat. Az egyik csoportba azok a lemezek tartoznak, amelyeket a felhasználó készen kap, tartalmát megváltoztatni nem tudja, így az iparilag előállított kész lemezeket csak leolvasni lehet. Angol nevük rövidítése alapján OROM vagy ROM (Optical Read Only Memory) néven ismertek, közéjük video és lézer lemezeket is sorolnak. Jelentőségénél fogva ezzel a típussal külön is foglalkozom. A második csoportba a WORM (Write Once Read Many) néven ismert, a felhasználó által írt lemezek tartoznak. A tartalmat később már nem lehet megváltoztatni, ezért hívják egyszer írható, sokszor olvasható lemeznek; ezeket főleg archiválási célokra használják. A felhasználó által aktua­lizálható, tehát törölhető (erasable) lemezek alkotják a harmadik csoportot, ezek egyelőre még kevésbé terjedtek el, mint az előző két típusba tartozók, bár várhatóan mind nagyobb jelentőségre tesznek majd szert.

    A különböző típusú optikai lemezek képesek különféle szöveget, numerikus adatokat, képeket (álló-, mozgókép, animáció), ábrákat, hangot külön-külön vagy együttesen, egy lemezre integrálva tárolni. Feltétlen előnyeik közé tartozik az információk magas színvonalú őrzése és reprodukálása, a rövid hozzáférési idő, a kompakt méret miatti kényelmes használat és a kiváló fizikai teherbírás. Mivel bármilyen típusú információ szolgáltatására képesek, széleskörű alkalmazhatóságukkal forradalmi utat nyitottak az ún. multimédia információ gyűjtésében és keresésében. A forgalmazott késztermékek természetesen nemcsak az eltérő típusú adatokat, de az ed­dig ismert legjobb, leghatékonyabb módszereket - így természetesen a közvetlen párbeszédes lekérdezési lehetőséget is - integrálják. Így jött létre egy új fogalom, az interaktív multimédia. A hipermédia kvázi-szinonimájaként terjedő fogalom magába foglalja azt a keresési módszert, amely az olvasót az emberi gondolkodást szimulálva, asszociatív, nem-hierarchikus, csapongó módon, szabadon hagyja böngészgetni a multimédia, tehát bármilyen típusú információk között. (A nem-szekvenciális keresést lehetővé tévő információ­bázisokról a 3.25 sz., Hipertext, hipermédia című fejezetben lesz szó.)

    3.241 CD-ROM lemezes adatbázisok


    Az egyes optikai lemezek más és más lehetőséget biztosítanak a multimédia információk tárolásához és kereséséhez. Közülük ma a legismertebb a CD-ROM (Compact Disk - Read Only Memory) rövidítéssel megnevezett kompakt lemez, amelyet - mint a nevéből látható - a felhasználó a rajta lévő adatokkal együtt, készen vásárol meg. A CD-ROM egy 12 cm átmérő­jű, 17 gramm súlyú, 550-650 Megabyte kapacitású lézerlemez, amelynek első példányai 1986-ban kerültek kereskedelmi for­galomba. Elképesztő tempójú terjedését sok kedvező tényező együttes hatásának köszönheti. (Míg 1986-ban mindössze 48, addig 1993-ban már több mint 3600 CD-ROM-on forgalmazott adatbázist tartott számon a CD-ROM Directory) Ez a médium rendelkezik mindazokkal az előnyökkel, amelyekkel az optikai lemezek általában, tehát magas színvonalon képes a szöveges és képi információk rövid időn belüli szolgál­tatására, használata kényelmes és biztonságos. Mindezeken felül a CD-ROM elterjedését segí­tette, hogy a könyvtárak és más hivatásos információközvetítőkből álló információs közösség a 80-as évek második felére már hozzászokott az online adat­bázisok interaktív lekér­de­zéséhez, amelyet azonban még ma is gátol a távadatátviteli hálózat időnkénti üzemzavara, a vonalak telítettsége, illetve a szolgáltató számító­központok esetleges hibája. Ehhez járul még a költségtényező is, amely - a CD-ROM lemezek meglehetősen magas ára ellenére - kedvezőbb lehet, ha gyakran használják az adatbázist, sok találatot nyomtatnak ki stb.

    A CD-ROM elterjedését nagyban segítette az a tény is, hogy már korai idő­szakától kezdve élvezte a szabványosítás előnyeit. Kezdetben a fizikai lemezszab­ványokban, majd a meghajtók és lejátszók kompatibilitásában egyeztek meg a gyártó cégek, mostanában pedig a szoftverre is kiterjedőben van az egységesítés. Két nagy előállító, a Wilson Company és a SilverPlatter például már több éve ugyanazt a menüt alkalmazza valamennyi termékénél.

    Az 1983-ban nyilvánosságra hozott CD-ROM szabvány az adattárolás fizikai formátumát rögzíti ugyan, de nem írja elő, milyen típusú információ milyen módon tárolható a lemezen. Nem határozták meg az információk logikai elhelyezését, az információ kódolását, a fájl-szerkezetek jelölését stb., így néhány éven belül meg­lehetős anarchia állt elő: a szoftver­fejlesztő cégek mind saját maguk által kifejlesztett formátumokat és rendszerprogramokat írtak a CD-ROM adatbázisokhoz. Ezt a helyzetet megszüntetendő, a 11 nagy CD-ROM előállító új formációt hozott létre, High Sierra Group néven; ennek keretében megállapodtak egy minden optikai rendszerhez illeszkedő tárolóeszköz, a CD-I (Compact Disk Interactive) kifej­lesztésében és abban, hogy azonnal megkezdik a logikai fájl-szerkezet szabvány kidolgozását is.

    A CD-I szabvány az adattárolás fizikai formátumán túlmenően pontosan megha­tározza a szükséges hardver konfigurációt, szoftver oldalról pedig előírja az eltérő típusú információk megkülönböztetésének, kódolásának és dekódolásának, illetve a CD-I lemezen kialakított logikai fájl-szerkezet kezelésének módját. Az önmagukat be­tölteni képes CD-I lemezeket tömegfogyasztásra szánják, ezt biztosítja a felhasz­nálóbarát keresőrendszer és a minden részletre kiterjedő kompatibilitás is.

    Hiába oly nagy a CD-lemezek tárolókapacitása, száznál több színes kép digitális rögzítéséhez még így sem elegendő. A multimédia információk tárolására ezért egy új megoldást fejlesztettek ki a DVI (Digital Video Interactive) nevű kommunikációs eszközzel. A korábbi sűrűséget 160-ad részre tömörítő eljárás bármilyen típusú multi­média információ rögzítésére és tárolására alkalmas.

    Visszatérve a mai CD-ROM adatbázisokhoz, megállapítható, hogy a ma kapható termékek túlnyomó többsége még mindig az online rendszerekhez hasonlít. Vannak tisztán referensz adatbázisok (pl. ERIC, Library literature), tartalmi kivonatokat is közlők (pl. LISA, Disser­tation Abstracts), teljes szövegű adatbázisok (pl. Bookshelf) és kézikönyvek (pl. Grolier’s American academic encyclopaedia).148 Vizsgálták azt is, milyen adattárakat, adatbázisokat érdemes CD-ROM hordozón kiadni. A lemezek ma­gas ára és viszonylag ritka aktualizálása miatt csak időtálló információkból álló, nagy adathalmazt érdemes erre a hordozóra vinni (az indexeléstől függően 200 000-350 000 oldal tartalma fér el egy 550 Mbyte-os lemezen). További könnyebbséget jelent, ha a meglévő adatbázis könnyen konvertálható, indexekkel bőven feltárt és jól szervezett információkból áll. Mindezek a jellemzők a kész adat­bázisok­nál, szótáraknál, encik­lopédiáknál adottak, ezért is olyan “könnyű” ezeket CD-ROM-on (is) kiadni.

    Mint az előzőekből látható, a CD-ROM-on - akárcsak a többi optikai lemezen - bármilyen digitális jel rögzíthető. Kapacitása miatt kiválóan alkalmas nagy bibli­ográfiai adatbázisok, terjedelmes szövegek és kisebb mennyiségű képi információ tárolására. 1993 végén abban a szerencsés helyzetben vagyunk, hogy mindhárom tí­pusra már magyar példát is bemutathatunk. Mind a három ismertetett magyar CD-ROM az ARCANUM Bt. fejlesztése.

    A bibliográfiai adatbázisok egyik jellemzője, hogy azonos struktúrájú rekor­dokból állnak. A rekordokból, illetve ezek mezőiből előzetesen megszerkesztik az indexeket a minél gyorsabb keresés támogatására. Az adatbázis készítője megha­tározza, milyen indexek készüljenek, ezekbe a rekordok mely mezői kerüljenek, és a mező tartalma szavanként vagy kifejezésként legyen visszakereshető. Természetesen azt is előre el kell dönteni, az indexekben milyen karakterek legyenek, mi történjék az ékezetes betűkkel stb. A teljes szövegű (full-text) adatbázis - mint a nevéből is kitűnik - az ún. forrásértékű információt, tehát az eredeti szöve­get teljes terjedelmében tárolja, ehhez járul a visszakeresést biztosító szoftver. A képeket is tartalmazó adatbázisban az információkat úgy tárolják, hogy egy speciális készülék az egyes oldalakat vízszintesen és függőlegesen apró szegmensekre bontva pontról pontra és sorról sorra letapogatva regisztrálja azt az adatot, hogy az adott képpont fehér-e vagy sem (vö. a 3.22 fejezetben leírtakkal). Tekintettel arra, hogy egy A/4-es oldalt igen sok szegmensre kell bontani ahhoz, hogy jó minőségű képet adjon vissza a rendszer, ennek az eljárásnak a tároló­kapacitás-igénye rendkívül nagy - annak ellenére, hogy speciális tömörítő eljárással dolgoz­nak. (Összehasonlításul: egy 20 000 bibliográfiai rekordot tartalmazó adatbázis “terjedelme” mindössze 20-25 MB, 3 000 fekete-fehér fakszimile oldalé pedig már 150 MB.)

    A bibliográfiai típusú CD-ROM-ra jó példa az Országos Széchényi Könyvtár első lézer­lemezes adatbázisa, a Nemzeti Periodika Adatbázis (NPA). A közel 30 000 bibliográfiai, 800 000 állományi és 1 000 könyvtári rekordot tartalmazó adatbázis (amely 1988 óta online üzemmódban is elérhető az IIF hálózaton keresztül) 1981-től kezdődően tartalmazza a hazai könyvtárakban meglévő külföldi időszaki kiadványok bibliográfiai adatait és azok lelőhelyeit. A tartalmi feltárást egy tezauruszból és osztályozási jelzetből álló rendszer, az Osztaurusz biztosítja. Számos szolgáltatás mellett a lemezen megtalálhatók a lelőhely-könyvtárak legfontosabb adatai, az egyes országok kódjai, az országkódok feloldása stb. Az adatbázis használatát többféle megjelenítési formátum segíti, a magyar nyelvűn kívül angol nyelvű verzió is készült. A CD-ROM-hoz felhasználói kézikönyv és kétnyelvű referenciakártya is tartozik.149

    A teljes szövegű adatbázisra példa a Biblia lézerlemezes kiadása. A Károli Gáspár szövege alapján készült CD-ROM 1992-ben jelent meg. Az adatbázis tartalma itt természetesen nem különálló rekordokban található, ezért itt a keresés is másképp folyik. A Biblia adatbázisban konkrét szóra, karakter- vagy szóláncra lehet keresni, megadhatjuk azt is, hogy egy kifejezés­ben a szavak egymáshoz viszonyítva milyen sorrendben álljanak. Háromféle helyettesítő karakter biztosítja a különféle írásmódú szavak biztos megtalálását: balról, jobbról, középről lehet 0 vagy 1, pontosan 1, illetve n számú karaktert helyettesíteni. Az adatbázis erőssége a teljes konkordancia feldolgozása.

    Harmadik példánk a grafikus anyagot és a szöveget fakszimileként tároló MSZHIR CD-ROM, amely az összes magyar szabvány bibliográfiai adatait és grafikus képét tartalmazza. Az 1993-ban megjelent első lézerlemezen mintegy 20 000 bibliográfiai rekord és kb. 500 szabvány 3 000 oldalnyi anyaga található meg teljes terjedelemben. A keresés a bibliográfiai adatok alapján történik, a kiválasztott szab­ványt funkcióbillentyűvel lehet megjeleníteni. A fakszi­mile oldalakat lehet lapozni, kicsinyíteni, nagyítani, nyomtatni stb. A lézernyomtatón kinyom­tatott oldalak minő­sége az eredeti szabványéval megegyezik - mint ahogy ez a 12. és 13. számú ábrákon a következő oldalakon látható.





    3.242 Képi információk elektronikus feldolgozása


    A szöveges információk bináris kódokra átalakítása egyszerű; visszakeresésükre úgy tűnik, megfelelő módszer az indexfájlok széleskörű alkalmazása (ld. online információkeresés). A képi adatok tárolása és visszakeresése azonban még mindig problematikus. Ennek számos oka van, melyek közül a legfontosabb a szöveges és a képi információk közötti alapvető különb­ség, amelyet az előzőekben megpróbáltam érzékeltetni. Egy szöveg fogalmi jelentése adott: a dekódolással egyidejűleg annak tartalma is nyilvánvalóvá válik - egy letapogatott kép jelen­tése azonban a dekódolás után nem látható azonnal.150 Arról is volt már szó, hogy a mai 3-4. generációs számítógépek hiába “tudnak” sokkal többet, mint elődeik, amelyeket akkor még nem is szándékoztak más feladatokra, mint számítási műveletek megoldására dolgoztatni - a szekvenciális működési elv révén nehezen birkóznak meg a nem-szekvenciális feladatokkal.

    További igen nagy gondot okoz a képanyag indexelése. Nincs olyan általánosan elfogadott konvenció, amely a képanyag katalogizálását, osztályozását, majd indexe­lését elősegítené. Voltak és vannak e téren próbálkozások (pl. a MARC formátum kiterjesztése151), de az igazi megoldás még várat magára. Véleményem szerint a képek osztályozását, indexelését az is nehezíti, hogy ugyanazzal a fogalmi készlettel, osztályozó/indexelő rendszerrel közelítünk hozzájuk, mint a szövegekhez. Adott eset­ben ezáltal éppen legjellemzőbb sajátosságuk, képiségük vész el, amikor verbális fogalmi síkra vetítjük le a vizuális fogalmi rendszerbe tartozó képi információkat. Meggyőződésem, hogy a kutatások ebben az irányban dinami­kusan fognak fejlődni, és az ötödik generációs számítógépekkel jelentős előrelépést fognak elérni a vizuális fogalmakkal való osztályozás/indexelés terén.

    A képek számítógépes feldolgozására két különböző technológia alakult ki: az egyik a számítógépes grafika, a másik a digitális képfeldolgozás. A számítógépes grafika szintetikus képeket generál számítógépes módszerekkel, a digitális képfel­dolgozás során pedig egy, már létező képet elemeznek és dolgoznak fel, vagyis inputként kész képet visznek a rendszerbe, ahol transzferálják egy másik képbe vagy a belőle származó szimbolikus leírásba. Az utóbbi időben e két hagyományos módszert együtt alkalmazzák: a meglévő digitális képi információt dolgozzák fel, és ebből generálnak új képeket a számítógépes grafika alkalmazásával. Ezt a tevékenységet elektronikus képelőállítás és -feldolgozás néven foglalhatjuk össze (image computing az amerikai, illetve electronic imaging az európai nyelvhasználatban). E tevékeny­ségkörbe valamennyi eddig ismert eljárás beletartozik a digitális képfeldolgozástól a számítógépes grafikán, megjelenítésen, látáson keresztül az alakzat-felismerésig.152 Termé­szetesen a felhasználónak közömbös, milyen technológiával, módszerrel készült az adatbázis, az ő számára csak az a kísérletileg igazolt tény a fontos, hogy a képeket is tartalmazó adatbázisokban sokkal könnyebb eligazodni, és sokkal jobban meg lehet találni az ún. rejtett információkat is, mint a csak szövegesekben.

    Az utóbbi évtizedben jelentősen fejlődött az adatbázis-építési technológia is. Kereskedelmi termékként kaphatók kész adatbázis-építő rendszerek is (DBMS = database management systems). A képi adatbázisok (IDB = image database) hardver és szoftver tervezése a mai K+F terület legfontosabb kérdése, amelybe az input eszközök (scanner és kamera), az információhordozók (optikai lemezek) fejlesztése éppúgy beletartozik, mint a visszakeresési módszerek (interaktív multimédia) javítása.



    Oberhauser, aki vizsgálta a ma létező képi adatbázisokat, megállapította, hogy ezek igen sokféle stílust és minőséget képviselnek, inkompatibilisek és nem minden­ben kedveznek a felhasználóknak. Ennek egyik fő oka a már említett általános képi indexelőrendszer hiánya, a másik pedig a ma létező rendszerek inhomogén technikai és metodikai színvonala.153 A tanul­mány megjelenése óta eltelt két évben a képi adat­bázisok száma ugyan látványosan megnőtt, de a számbeli gyarapodás inkább növelte, mint csökkentette a fent említett inkompatibilitást és inhomogenitást.

    3.243 Az optikai információs rendszerek könyvtári alkalmazása


    Új információs korszak hajnalán vagyunk. Eljövetelét ünnepelhetjük eufórikusan, szemlél­hetjük szkeptikusan, aggódhatunk is szeretett műfajunk, a könyv sorsáért magánemberként, de hivatásos információközvetítő szakemberként szembe kell néz­nünk az új kihívással, és - tetszik, nem tetszik - föl kell készülnünk az új médiumok fogadására.

    Az optikai információtároló rendszerek - beleértve a hardvert, a szoftvert és az alkalmazási módszereket - új horizontot nyitottak az információ gyűjtésében feldol­gozásában, keresé­sé­ben. A tendencia világos és egyértelmű: a szelekciótól a teljesség felé mutat. Ebbe az irányba fejlődnek a szöveges adatbázisok is: az egyszerű bib­liográfiai adatoktól a referátumokon át a teljes szövegű adatbázisok felé. Ugyanez tapasztalható a képi információk terén: a régi típusú feldolgozásban éppen csak jelezték, ha egy dokumentum illusztrációkat is tartalmazott (még akkor is, ha a szöveg volt tartalmilag alárendelt) - a multimédia típusú rendszerekben azonban már egyenrangúvá vált a kép a szöveggel, illetve a hanggal. Időközben a képi ábrázolás szerepe jelentősen megnőtt (most nem beszélve a köznapi élet vizuális dömpingjéről): olyan új technikák alakultak ki, amelyek döntően a képi ábrázolás lehetőségeivel élnek (pl. folyamatábra, elektromos kapcsolási rajz), és sok új eszköz készült, amelynek lényege a láthatóvá tevés (pl. computer-tomograph, endoszkóp, ipari röntgen stb.).

    A rejtettségtől a jeladáson át a teljességre törekvésnek magától értetődően kell érvényesülnie a képi információk terén is. A technikai fejlődés most jutott el arra a fokra, hogy a képeket is önálló és egyenrangú információs forrásként tudja kezelni. A képi adatbázisok szerencsésen egyesítik mindazt az előnyt, amelyet a mai technológiai fejlettségi színvonal lehetővé tesz: hatékonyan akkumulálják és kezelik a különféle adatok széles skáláját, és biztosítják a keresett adathoz az elképzelt formában való hozzáférést - az adat típusától, létezési módjától, a feldolgozás szintjétől, a keresőnyelvtől, az adat szerkezetétől függetlenül. E tényezők hatására már ma is robbanásszerűen jelennek meg a piacon olyan új típusú, multimédia információs bázisok, amelyek tartalmukban is újat nyújtanak, nemcsak egy meglévő adatbázis, adattár vagy kézikönyv más hordozón való kiadását jelentik.

    Oberhauser már hivatkozott elemzésében vizsgálta a multimédia információs rendszerek elterjedését, illetve az új média és az információs közösség viszonyát. Megállapítása szerint az igazi áttörés még nem történt meg, igen kevés könyvtár alkalmazza aktívan az új technológiát. Passzív alkalmazásra - tehát a kész adatbázisok vásárlására - már sok példa van, a könyvtárak a CD-ROM-on forgalmazott adatbázisokat igen nagy számban vásárolják.154 Ezeknek a kezelése sem különleges felkészültséget, sem nagy energia-befektetést nem igényel, különösen az online információkeresésben jártas könyvtárosoktól, olvasóktól. (Ne feledjük, hogy a fejlett országokban a felhasználók egy egyszerű egyetemi könyvtárban is online olvasói kataló­gusban keresik az információkat!) Mondhatni, divatba jött a CD-ROM, erre a hordozóra jut a legtöbb figyelem, a többi optikai médiumra azonban még nemigen koncentrálnak a könyvtárak.

    Oberhauser azt is megvizsgálta, hogyan viszonyulnak az új információhordo­zókhoz a könyvtárosok: kevesen és keveset tudnak róla, még kevesebben tudják aktívan használni az optikai információs rendszereket. Így látszik, a lelkesedők és a specialisták kis csapatát kivéve, az információs közösség még nem igazán jól tájékozott a multimédia kérdéskörében. Az igazsághoz az is hozzátartozik, hogy ma még nem lehet egy teljes körű referensz adattárat kiépíteni az optikai lemezekből. Könyvtári elterjedését nagyban elősegíti az is, hogy már találtak technikai megoldást a hálózatosításra: arra, hogy egyidejűleg több olvasó is tudja használni lokális háló­zatban a drága adatbázisokat.155

    Az aktív alkalmazásban a nagy nemzeti könyvtárak járnak az élen; ezek a kész produktumok tesztelésében is részt vesznek, illetve saját gyűjteményük egyes rész­leteit teszik át optikai hordozóra. Európában saját állományáról először a párizsi Sainte Genevieve egyetemi könyvtár adott ki optikai lemezt: ez a középkori illusztrációkat tartalmazó diagyűjtemény alapján készült. Az optikai információs rend­szerek könyvtári alkalmazásában - mint oly sok mindenben - az élenjáró a washingtoni Library of Congress, amely 1982-ben kezdte Optical Disk Pilot Project-jét. Az optikai lemezt mint tárolóeszközt a nyomtatott információk tárolására is kipróbálták, de egy komplex információs rendszer kiépítését is megkezdték a non-print project keretében. 1988-ig hat videolemezt készítettek, ezeken 150 ezer képet és a CBS televízió híradójának 10 évi anyagát tárolták. A felhasználó az olvasóteremben elhelyezett képernyőnél ülve külön kereshetett a képek és külön a szöveges infor­mációk között: ha egy szólánc alapján valószínűsíthető volt a releváns találat, az adott képet előhív­hatta a képernyőre. Fordított esetben a képek között böngészhetett, ekkor külön utasításra a kép adatait tudta előhívni a szöveges adatbázisból. Az elérési pontok: a kép címe, létrehozó­jának neve, létrejöttének ideje, a kép tárgyát jelölő szavak, copyright adatok, az eredeti kép lelőhelyadatai. A rendszerhez offline üzem­módba kapcsolt színes lézernyomtatón másolatot is lehetett rendelni.156

    A Library of Congress 1990-ben az előzőnél nagyobb szabású és ambiciózusabb programba kezdett. Az American Memory elnevezésű project keretében a könyvtár történelmi, kulturális, etnográfiai stb. gyűjteményeiben található könyveket, térké­peket, kéziratokat, hangfelvéte­leket, képanyagot dolgozzák fel egy integrált optikai rendszerbe, amelyet széleskörű terjesztésre szánnak az iskolák, de a magánszemélyek körében is. Az öt évre tervezett program keretében 15-20 összeállítást kívánnak megjelentetni, főleg a századforduló idejéből.

    Az American Memory egy-egy adatbázisának lejátszásához a következő konfi­guráció szük­séges: mikroszámítógép, két optikai lemez-lejátszó (CD-ROM és video­lemez), tv monitor, lemeztároló, fejhallgató. A bibliográfiai adatokat MARC rekor­dokban tárolják, ezeket számos speciális index és szövegrészlet egészíti ki. A kép­anyag kétféle hordozón: a digitalizált adatok a kompakt lemezeken, az analóg képjelek a videolemezeken találhatók. A digitalizáláshoz a ma rendelkezésre álló valamennyi módszert és eljárást alkalmazzák: az indexeket hagyo­má­nyos adatrögzítéssel, a szöve­geket a felhasználástól függően fakszimileként, géppel olvasható szabad szövegként vagy automatikus optikai karakterolvasó eljárással - illetve akár ezek együttesével viszik be a rendszerbe. Az állóképeket digitalizált formában, a mozgóképeket viszont analóg videolemezeken tárolják, mert erre a célra ez ma a legmegfelelőbb.

    Az American Memory főmenüje egy könyvtár alaprajza. Szellemes megoldással egy valósá­gos könyvtárat szimulálnak, ahol a tájékoztató központ szolgáltatja a rend­szer működéséről és a tartalmáról szóló információkat. Az olvasóteremben lehet keresni és bepillantani a kiválasztott dokumentumokba, a kiállítóterem a gyűjteményeket mutatja be. A műhely funkció kiválasztásával az olvasó tárolhatja a kiválasztott részleteket: a szöveget, képet és hangot, majd ezekből - szöveg- vagy kiad­ványszerkesztő programmal - rögtön elő is állíthat egy tetszés szerinti nyomdakész anyagot. A Library of Congress az American Memory programot egy nagyszabású terv első lépcsőjének tekinti. A végső cél a könyvtár jelentős gyűjte­ményeinek elektronikus formában való feldolgozása és terjesztése annak érdekében, hogy a hatal­mas és gazdag könyvtár állománya közkinccsé váljon az egész nemzet számára.157

    Az optikai információtároló eszközök könyvtári alkalmazásához azonban nem­csak a technikai feltételeket kell biztosítani. A képi információkat publikáló intézmé­nyeknek rövid időn belül meg kell egyezniük a copyright kérdésében, ugyanis ez a képanyagokat illetően ma még szinte teljesen megoldatlan. A múzeumok kiadásában megjelenő gyűjteményeknél még viszonylag egyszerűbb a helyzet, hiszen ők többnyire rendelkeznek a képek tulajdonjogával, de a könyvtárak már nehezen szerzik meg és legalább ilyen nehezen érvényesítik a képekkel kapcsolatos szerzői jogokat. Az elektronikus publikálással foglalkozó cégekkel közösen kell a terjesztéssel kap­csolatos problémákra megoldást találni.


    3.25 Hipertext, hipermédia


    Az utolsó évtizedben drámai változások zajlottak le az információtechnológia területén. Tanúi lehettünk a személyi számítógépek fantasztikus tömegű elterje­désének, az egész világot behálózó számítógépes hálózatok kialakulásának, az optikai lemez és más új információtároló eszközök születésének, a video- és képtechnika hihe­tetlen gyors fejlődésének, a számítógépes grafika elsöprő győzelmének és az adat­bázisok gombamód szaporodásának. A fejlődés olyan gyors és látványos volt, hogy lépést tartani is nehéz vele. Most, egy új évtized elején azonban a fejlődés újra nagy lendületet vett: a szinte messiásként várt ötödik generációs számítógépek fogadásának szellemi előkészületei is folynak a mesterséges intelligenciával és a hiper­médiával kapcsolatos kutatásokkal.

    Úgy tűnik, nemcsak a Gutenberg-galaxisnak, de a bináris elven működő szá­mítógépnek is vége. Az emberi észlelési-gondolkodási folyamatok kutatásának egyik óriási jelentőségű eredménye, hogy az ember nemcsak önmagát, de a számítógépet is kiszabadította a lineáris lépések béklyójából, amikor kitalált egy új rendszerezési elvet, a hipertextet és a főként alfanumerikus adatok közlése helyett a szöveget, gra­fikát, mozgóképet, hangot együtt szol­gáltató hipermédiát. Bízvást mondható, hogy a nem-lineáris kapcsolatrendszerre épülő hipertext és az eddigi gyakorlattól eltérően a nem kizárólag nyomtatott szöveget feldolgozó hipermédia forradalmasítja a könyvtári-információs szakterületet.

    Eddig az volt az általánosan elterjedt könyvtári szokás, hogy ha a megszokottól eltérő infor­máció­hordozókkal kerültek szembe, rögtön elválasztották ezeket a rendes dokumentumoktól, és valamilyen különgyűjteményként dolgozták fel a renitens audiovizuális és egyéb nem-hagyományos dokumentumokat. A szóban forgó új rende­zési elv az elkülönítés (szeparálás) helyett az integrálást kívánja megvalósítani.

    De mi is az a hipertext és hipermédia? A hipertext nem-szekvenciális olvasást és írást tesz lehetővé azáltal, hogy az emberi elméhez hasonlóan biztosítja a gondolatok és az információk szabad asszociációját, bátran alkalmazva az analógiákat, meta­forákat és hasonlatokat.

    Bár az írás kialakulása óriási történelmi jelentőségű volt, az írásbeliségnek is megvannak a maga korlátai. Az évszázadokon át megszokott írásrendszerek szigorú egymásutániságukkal (szekvencialitásukkal) szinte megfosztják az embert a rá oly jellemző asszociatív, heurisztikus gondolkodásmód követésétől. Már Szókratész is aggódott amiatt, hogy az írásbeli közlés kapacitása nem lesz elegendő az “igazság legfontosabb elveinek kifejezésére”. Rousseau pedig egyenesen azt jósolta, hogy a szabad és spontán kommunikáció hanyatlásának az első oka az írás lesz.158

    Az írásbeli közlés szigorú kötöttségén többféleképpen is próbálnak segíteni. A megszokott kézikönyvek például különböző lásd, lásd még típusú utalókkal, láb­jegyzetekkel, idézetekkel, hivatkozásokkal, ábrákkal és más illusztrációkkal igye­keznek az írás-olvasás merev lineari­tá­sát oldani. Egy számítógépes hipertext-rendszer leginkább egy jegyzetekkel, hivatkozásokkal gazdagon ellátott enciklopédiához lenne hasonlítható, amelyben bármilyen irányban lehet közlekedni, navigálni, a benne foglalt tudásanyag valamennyi kapcsolata végigjárható, még­pedig nem előre meg­határozott módon, hanem a felhasználó pillanatnyi szükségletei, érdeklődése, han­gulata alapján.

    A hipertext-alkalmazások - bármilyen sokrétű fogalmi kapcsolatrendszert építe­nek ki - csak alfanumerikus szövegeket és kisszámú digitális képet tudnak rendel­kezésre bocsátani. A mai számítógépes technológia azonban már lehetővé teszi, hogy bármilyen típusú információs forrást - legyen szó különböző szövegekről, adatokról, hangról, mozgóképekről, grafikáról - digitális kódok formájában tároljon és tegyen visszakereshetővé. A hipermédia (újabban inkább a multimédia elnevezést használják) éppen ezt a szintézist valósítja meg, amikor ugyanabból a felhasználói pozícióból teszi lehetővé az írás, kép és hang együttes elérését. A hipermédia igen bonyolult technológiára épül, régi és új megoldásokat egyaránt integrál. Ching-Chih Chen a mai multimédia-technológiát olyan puzzle játékhoz hasonlítja, amelynek darabkáiból a szemünk láttára alakul ki a kép.159

    A hipertext elnevezés Franklin D. Roosevelt egykori tudományos tanács­adójától, Vannevar Bush-tól származik. Az 1945-ben publikált As We May Think című munkájában ő veti föl először, hogy az információs túltermelés hamarosan milyen gondokat okoz majd. Memex névre keresztelte azt a tervét, amelyben leírta el­képzelését az egyes szövegközti kapcsolatok elektronikus géppel való biztosításáról. A Memexet soha nem fejlesztették ki, de az elgondo­lás a mai hipertext rendszerekben valóra válik. Húsz évvel később viszont Bush tervezete arra inspirálta D.C. Englebart-ot (az egér szülőatyját) és T. Nelson-t, hogy az eredeti ötletet kibővítve megalkossák az NLS (oNLine System) nevű rendszert. Az NLS a mai hipertext rendszerekből már sok mindent tartalmazott: az ablaktechnikát, az egeret, az elektronikus postát és a hipertext-megoldáshoz hasonló szöveg-kapcsolat rendszert. Bár munkájuk már a 60-as években napvilágra került, az akkori számítógépes tech­nológia még nem volt kellőképpen fejlett e profetikus látomások megvalósításához. Az ötletadó Bush tanulmánya alapján 1972-ben As We Will Think címmel Nelson ismertette az Online Konferencián a hipertext-koncepciót, de még mindig több mint egy évtized kellett ahhoz, hogy a számító­gépes technológia is eljusson arra a szintre, amely már lehetővé teszi az elképzelések valóra váltását.160

    Nem lehet eléggé hangsúlyozni a hipertext, de főleg a hipermédia korszakos je­lentőségét. A hosszú éveken át korszerűnek számító mágnesszalagos adatbázisok fő jelszava az információ­átadás volt - de az előre meghatározott algoritmus alapján működő, szigorúan szekvenciális struktúrájuk nem is tett mást lehetővé. A mai cél információátadás helyett tudásátadás, amely a klasszikus módszer, az adatbázisban való lépegetés helyett egy sokdimenziós információs hipertérben való szabad mozgást tesz lehetővé.161 Célja eléréséhez a hiperrendszernek rendkívül magas igényszintnek kell megfelelnie. A bonyolult rendszer három fő részre: a hardver-, a szoftver- és az információs rendszerre osztható. A hardvernek megfelelő tárkapa­citással, nagyfelbontású és kellően nagy méretű színes grafikus megjelenítővel, audio- és video-lejátszóval, ezen kívül interfészekkel (tasztatúra, egér, szenzoros képernyő stb.) kell rendelkeznie.

    A szoftver-rendszer rendkívül bonyolult, több alrendszerből áll. A hiperbázis-index a fa-struktúrát, a hiperbázis-térkép a képi összefüggéseket, a hiperbázis-kapcsolat a navigációs lehetőségeket, az általános rész az útbaigazításokat és a példákat tartalmazza. Mindehhez még az audio és a video szelekció is hozzátartozik.

    Az információs rendszer háromféle hordozón tárolja az anyagot. A videolemez fix adatokként tartalmazza a képeket, a hanganyagot, a szöveget és a grafikát, a CD-ROM szintén fix adatként a hangot, a képet, a szöveget valamint a grafikát. A mágnes­lemezen a változó adatok vannak, ezek elsősorban a hiperbázis-szövegek és a grafikus összeköttetések (kapcsolatok).

    A hiperrendszernek minden eddiginél magasabb szinten kell kiszolgálnia a fel­használó igényeit, akinek érdeklődése, koncepciója, tudásszintje szerint kell be- vagy kikapcsolnia bizonyos tudásterületeket, állományokat, szűrőket. Lehetővé kell tenni könyvjelzők elhelyezését, feljegyzések készítését és a navigálást ezek bármelyikéhez.

    Az első hiperrendszereket 1987-ben bocsátották a nagyközönség rendelkezésére. Azóta a legismertebb közülük a HyperCard lett - népszerűségét nem utolsó sorban annak köszönheti, hogy az új Apple/Macintosh gépekkel az alapszoftverrel együtt, mégpedig forrásnyelven is megkapják a vásárlók; ez utóbbi biztosítja a rendszer tetszés szerinti bővíthetőségét. A HyperCard egy képernyője egy kártyának felel meg, ez a kártya a szöveges vagy a képi információ hordozója. Egyes kártyákon az adatokat felül lehet írni, másokon nem. Az adatok, illetve információk több kártyán is azonosak lehetnek. Egy kártya egy objektumot jelent, de ez önmagában is több objektumból állhat. Minden képernyőn vannak nyomógombok, amelyek segítségével vagy az egérrel, vagy szenzoros érintkezéssel lehet navigálni. A rendszer program- és parancs­nyelve a HyperTalk, amelyhez C vagy Pascal nyelven saját programokat is írhat a felhasználó. A HyperCard arra is alkalmas, hogy a működő online vagy CD-ROM adatbázisokkal összekapcsolják.162

    A hipermédia alkalmazásának érdekes esete egy meglévő, sok képi információt tartalmazó adatbázis átszervezése az új technológiára. A PROJECT EMPEROR I az első kínai császár korát bemutató K+F feladatként 1984-ben indult, kimondottan az akkor újonnan fejlesztett videolemez-technológiára épült. A 2200 évvel ezelőtt uralkodott első kínai császár emlékét őrzi többek közt az az 1973-ban feltárt mintegy 7000 terrakotta szobor (közülük néhányat Budapesten is láthattunk), amely az egész huszadik század egyik legnagyszerűbb és legjelentősebb archeológiai lelete. Ching-Chih Chen, a program vezetője szavaival a PROJECT EMPEROR I arra hivatott, hogy áthidalja a Kelet és Nyugat, a múlt és a jelen, a humán szféra és a high tech között lévő szakadékot.

    A rendszer első változata 1985-ben készült el. Az első kínai császár című video­lemezek rögtön nagyon népszerűek lettek a kutatók, az egyetemi hallgatók, de a széles nagyközönség körében is. Az utóbbi 5-6 évben tapasztalt radikális fejlődés, amely megteremtette a mikroszámítógép, az optikai leolvasás és lejátszás, valamint a számítógépes grafika együttes alkalmazásának hibrid technológiáját, olyan fantasz­tikus mértékben meggyorsította a PROJECT EMPEROR I fejlesztését is, amelyről az 1983-84-es tervezéskor még álmodni sem mertek volna. A rendszer első változata az 1985-ben elérhető összes technológiai megoldást integrálta: MS DOS környezet, IBM PC, Macintosh és VAX mikro-, illetve Sun mini­számítógép hálózatba kapcsolva, valamint CD ROM- és videolemez-lejátszó biztosította a gépi hátteret. Ezt nagy­felbontású képdigitalizáló, képletapogató (scanner) és más készülékek egészítették ki. A két videolemez-, videofilm-, állókép- és hang-, valamint angol, illetve kínai szöveg­fájlból álló multimédia információbank a HyperCard rendszerben új, minden eddiginél hatékonyabb segítségre talált. A különböző technológiára alapuló tárakban lévő információk között valóban az emberi gondolkodásmód szerint lehet válogatni, közle­kedni. Ha a felhasználó egy kép részletét közelebbről kívánja megnézni, ha egy szö­veghez tartozó képre kíváncsi, ha a császári hadsereg katonáinak hajviseletét akarja összehasonlítani - egy gombnyomás az egéren és fél másodpercen belül a képernyőn van a kért anyag. De ha lapozgatás közben az első kínai császár korának kohá­szatára, építészetére, kézművességére vagy vallási szimbólumaira, közigazgatására kíváncsi, ugyancsak hasonló idő alatt át tud lépni ezekbe az alrendszerekbe, amelyeket vagy végiglapoz, elolvas, vagy csak a hozzájuk tartozó kép- és hanganyagot böngészi át... A döntés teljes egészében a felhasználóra van bízva - gyakorlatilag valamennyi, a tárgyat érintő kérdésére választ kap 1-2 másodpercen belül.163

    Mint a téma vezetője, Chen írja, a K+F minősítés lehetővé tette számukra, hogy bátran kipróbáljanak minden szellemi és technológiai lehetőséget. Semmire sem mondták azt, hogy lehetetlen vagy hogy túl nehéz, így aztán nem csoda, hogy a tervek elkészülte után kilenc hónappal már be is tudták mutatni a felhasználóknak a rendszer első, videolemezes változatát. A PROJECT EMPEROR I azonban nemcsak az új technológia alkalmazására szolgál, hanem egy új információgyűjtő és -szolgál­tató filozófiát is képvisel. Ezzel a programmal valósították meg első ízben, hogy a korábbi szokásoktól eltérően ne csak a nyomtatott információ­hordozók, hanem a mostanában feltűnt új eszközök, a videolemez, a CD ROM és társaik is a köny­vekhez és folyóiratokhoz hasonló rangot kapjanak a könyvtári gyűjteményekben. A PROJECT EMPEROR I sikere is hozzájárult ahhoz, hogy az Apple Computer cég Multimedia csoportja összegyűjtse és videolemezen piacra dobja Visual Almanach (Vizuális almanach) néven azt a multimédia információbankot, amely szinte az összes szak­terület képanyagát tartalmazza. Természetesen több ezer kép lesz az almanachban Az első kínai császár anyagából is. A HyperCard rendszerrel, Macintosh gépeken lekér­dezhető vizuális almanach rendkívül alacsony ára miatt valamennyi iskolába és köz­könyvtárba eljuthat az Egyesült Államokban.

    Időközben az első magyar multimédia adatbázisok is megjelentek; 1992-ben látott napvilágot a Politika. Magyarország 1944-1989 című, 640 Mbyte terjedelmű adat­bázis, amely 5 300 oldalnyi szöveget, 185 korabeli filmhíradó részletet, 22 zenei idézetet, 350 fotót és 69 diagramot tartalmaz. A feldolgozott művekről bibliográfiai leírásokat is tartalmaz a CD-ROM-on közreadott összeállítás. A budapesti Közgaz­daságtudományi, ill. a Műszaki Egyetem oktatóinak, Nyírő Andrásnak, Szakadát Istvánnak és társainak köszönhetően 1993-ban kiadták az első magyar irodalmi multi­média adatbázist Szerb Antal egyik írása, a Budapesti kalauz marslakók számára alapján. A színes és hangos filmbetétekkel, térképvázlatokkal, grafikákkal bőven illusztrált állomány - a Politika adatbázishoz hasonlóan - Microsoft Windows ope­rációs rendszer alatt érhető el.164 Biztosak lehetünk abban, hogy a közelgő budapesti világkiállítás óriási lendületet ad a hazai multimédia adatbázisok fejlesztésének; Ma­gyarország történeti, kulturális emlékei és mai eredményeink is megjelennek majd e korszerű információhordozókon.


    Download 6,4 Mb.
    1   ...   7   8   9   10   11   12   13   14   ...   21




    Download 6,4 Mb.