• Informatsiooni edastamise ja salvestamise hetke tipp - XML.
  • Süsteemide rajamine on produktiivsem.
  • Mitmeotstarbeline kasutus.
  • Elemendi tüübi deklaratsioon
  • Xml vorming ja tarkvara




    Download 52.87 Kb.
    Sana21.03.2017
    Hajmi52.87 Kb.

    Tartu Ülikooli Pärnu Kolledž

    Majandusteaduskond


    Karin Jõggis
    XML VORMING JA TARKVARA

    Referaat

    Juhendaja: Taavi Tamberg


    Tallinn 2005
    Sissejuhatus.
    Informatsiooni edastamine ja säilitamine on olnud elusorganismide elutähtis osa läbi aegade. Inimsool toimus algul info edastamine sõnas ja säilitamine ajus s.o. info kandjaks, vahendajaks ja säilitajaks oli inimene.

    Inimkultuuri üheks kõrgsaavutuseks loetakse kirja teket 3000 aastal e.m.a. kiilkirja näol.Kirja tekkega kadus vajadus vajadus infokandjana kasutada inimest.Andmed vabanesid inimesest kandes neid savitahvlile.Kõrvalproduktina võimaldas kiri infot edastada lühemalt ja kokkusurutumalt, kui mistahes muul moodusel( kas või näiteks kaljujoonis).Paberi(eellane papüürus) leiutamisega algas info paberkandjate ajasu. Info säilitamise ja edastamise maht kasvas hüppeliselt, kuid levik sõltus ümberkirjutajate oskustest ja hulgast.

    Guttenbergi leiutatud trükikunst jättis poole sajandiga töötuks suure ümber- kirjutajate armee, mis asendus hoopis teist tüüpi struktuuriga(toimetused, trükikojad).

    Arvutiajasu tõi kaasa digitaalinformaatika arengu ja praegu elame üle andmete paberist vabastamise protsessi. Esialgu sõltus digitaaldokument täielikult riistvarast, kuid paarikümne aastaga standardiseeriti arvutite riistvara niivõrd, et riistvara arvutist arvutisse kandmist saab praegu teha mõne näpuliigutusega.

    Möödunud sajandi kuuekümnendate viimastel aastatel tekkinud Internet on nüüdseks integreerinud kõik arvutivõrgud ja IP protokoll vabastas ühikonna võrkude diktaadist.

    Informatsiooni edastamise ja salvestamise hetke tipp - XML.


    Praegusel arenguetapil on käsil digitaalandmete vabastamine tarkvara sõltuvusest, arvutiprotsessidest ja andmebaasidest - see on SGML ja SMGL-st lähtuvad HTML ja XML.

    SGML (Standard Generalzed Markup Language) on sisuliselt metakeel, mille terminites saab defineerida teisi andmete sisu struktuuri ja esitluse keeli.
    SGML eelisteks loetakse:


    1. Süsteemide rajamine on produktiivsem. Dokumendi struktuuri probleemid eraldatakse sisu omadest. Struktuur kehtestatakse ühtne kõigile osalistele. Elektroonselt saabunud failid on koheselt ja automaatselt töödeldavad ning laaditavad kõigis osalevates asutustes.




    1. Mitmeotstarbeline kasutus. Dokumentidest saab erinevate rakenduste jaoks kergelt eraldada seda rakendust huvitavad tekstiosad.




    1. Andmete “pikaealisus”. SGML kasutaja ei pea pärast riistvara või tarkvara vahetust tegelema andmete ümbertöötlemisega. Andmed on alatiselt kasutatavad ja kättesaadavad. See teeb SGML formaadi eriti kasulikuks ja asendamatuks elektroonsetes arhiivides.




    1. Andmete integraalsus. Asutuses standartselt kasutatavad tekstiosad (kirjapäised, logod jms. info) on hallatavad keskselt. Need lülitatakse tekstidesse märgendusmehhanismidega.




    1. ülekantavus. SGML märgendusega tekstid on korraga kasutatavad eri tüüpi arvutisüsteemide kasutajatele.




    1. Paindlikkus. SGML tagab info kasutamise mistahes rakenduses ilma täiendava töötluseta. Näiteks WWW, andmebaasid, e-post, hüpermeedia ja hüpertekstsüsteemid, andmebaasi publitseerimine, CD-ROM väljund ja muu seesugune.


    Kuna SGLM on üsna mahukas, siis otsustati möödunud sajandi 90.-ndate alguses defineerida lihtne rahvavariant - HTML (Hyper Text Markup Language), mis peagi vallutas maailma ja tekkis ülemaailmne WWW-võrk.

    Sellest jäi aga veel väheks ning 10.02.1998.a. avaldas W3C Konsortsum dokumendi “Extensible Markup Language”- XML.
    XML- dokumendid koosnevad säilituskirjetest, mida nimetatakse üksusteks ning mis sisaldavad kas grammatiliselt parsitud või parsimata andmeid. Parsitud andmed koosnevad märkidest, kas märkandmete või märgistuse vormis. Märgistusega pannakse paika andmete paigutus dokumendis ja dokumendi loogilise struktuuri kirjeldus. XML-mehhanismidega seatakse piirangud dokumendi paigutusele ja loogilisele struktuurile. XML-dokumentide lugemiseks ja juurdepääsu tagamiseks dokumendi sisule ja struktuurile kasutatakse tarkvara moodulit XML-protsessorit. Eelduseks on, et see töötab teise tarkvara mooduli – rakenduse – huvides.
    XMLi projekteerimise eesmärkideks olid:

    1. XML on koheselt kasutatav Interneti kaudu.

    2. XML toetab laia valikut rakendusi.

    3. XML ühildub SGMLga

    4. Lihtne on kirjutada XML-dokumentide töötlemise programme.

    5. XML-dokumendid on loetavad ja loogiliselt selged tavainimesele.

    6. XML-projektid on kiiresti elluviidavad.

    7. XML on formaalne ja ja napisõnaline.

    8. XML-dokumente on lihtne luua.

    9. XML-dokumentide märgistuse kokkusurutus on minimaalse tähtsusega.

    XML-dokumentide kirjeldamiseks kasutatav terminoloogia on defineeritud käesoleva spetsifikatsiooni tekstis. Definitsioonide ülesehituses ja XML-protsessori tegevuse kirjeldamisel on kasutatud  järgnevas loetelus defineeritud  mõisteid.




    1. võib

    Dokumentide ja XML-protsessorite vastavus nõuetele on lubatud, kuid nad ei pruugi toimida kirjelduse kohaselt.


    1. peab

    Dokumentide ja XML-protsessorite käitumine peab vastama kirjeldatud nõudele; vastasel korral on tegemist vigaste dokumentide või protsessoritega.


    1. viga

    Näitab käesoleva spetsifikatsiooni reeglite rikkumist - tulemused on teadmata. Vastav tarkvara peab tuvastama ja teatama veast ning tohib selle vea ellimineerida.


    1. hukutav viga

    Viga, mille vastav XML-protsessor peab tuvastama ja teatama rakendusele. Peale kohtumist hukutava veaga võib protsessor jätkata andmetöötlust leidmaks järgmisi vigu.  Toetamaks vea parandamist, võib  protsessor töötlemata andmed teha kättesaadavaks rakendusele. Hukutava vea avastamisel peab protsessor koheselt katkestama normaalse töötluse.


    1. kasutaja valikul

    Vastav tarkvara võib või peab käituma vastavalt kirjeldusele;  kui tingimus on kehtestatud, siis peab kasutajale olema tagatud  vahendid kirjeldatud käitumise võimaldamiseks või keelamiseks.


    1. kehtivuse kitsendus

    Kõigile  kehtivatele) XML-dokumentidele rakenduv reegel. Siduva kitsenduse rikkumised on vead: valideeriv XML-protsessor peab  kasutaja valikul neist teavitama.


    1. trimmisuse kitsendus

    Trimmis XML-dokumentidele rakenduv reegel. Trimmisuse reegli rikkumine on hukutav viga.


    1. klapp

    Kaks võrreldavat stringi või nime peavad olema identsed. Mitme võimaliku esitusega märgid ISO/IEC 10646 järgi klapivad  ainult siis, kui nad on mõlemas stringis samas esituses. Kasutaja valikul võib protsessor sellised märgid teisendada mingile sarnasele kujule. Tõsttundetus pole lubatud.

    String klapib grammatilise produktsiooniga kui ta kuulub keelde, mis genereeris selle produktsiooni.

    Element klapib oma deklaratsiooniga kui  ta vastab kujule, mis on kirjeldatud piirangus “Kehtiv element”


    1. ühilduvus

    XML omadus, mis on toodud sisse üksnes  garanteerimaks XMLi ühildumist SGMLga.


    1. risttöödeldavus

    Mittesiduv soovitus, mis on toodud sisse XML-dokumentide  töötlemisvõimaluste suurendamiseks olemasolevate SGML protsessoritega, mis ennetavad dokumenti WebSGML Adaption Annex ISO 8879.

    Andmeobjektiks on XML-dokument, kui ta on trimmis käesolevas spetsifikatsioonis defineeritud kujul. Trimmis XML-dokument võib olla lisaks kehtiv, kui ta on vastavuses kindlate lisapiirangutega.

    Igal XML-dokumendil on loogiline ja füüsiline ülesehitus. Füüsiliselt  koosneb dokument kirjetest, mida kutsutakse üksusteks. Üksus võib viidata teistele üksustele põhjustades nende kaasamise dokumenti. Dokument algab juur- ehk dokumendiüksusega. Loogiliselt koosneb dokument deklaratsioonidest, elementidest, kommentaaridest, viitadest märkidele ja töötluseeskirjadest, mis on kõik üksikasjaliku märgistusega ära näidatud  dokumendis. Loogiline ja füüsiline struktuur peavad olema sisestatud õigesti vastavalt kirjeldusele “4.3.2. Trimmis  parsitud üksused”.
    XML-dokumendi elemendi elemendi struktuurile võib kehtivuse eesmärgil esitada piiranguid  kui kasutada elemendi tüübi deklaratsiooni  ja atribuutide loetelu. Elemendi tüübi deklaratsioon piirab elemendi sisu.
    Elemendi tüübi deklaratsioon  piirab sageli seda, millise elemendi tüüp esineb elemendi tütrena. XML-protsessor võib kasutaja valiku korral  väljastada hoiatuse, kui  deklaratsioonis mainitakse elemendi tüüpi, mille jaoks pole deklaratsiooni, kuid see ei ole viga.

    Elemendi tüübi deklaratsioon on kujul:


     

    Elemendi tüübi deklaratsioon


    [45] 

    elementdecl

    ::= 

    ''



    VC: Elemendi tüübi deklaratsiooni unikaalsus (Unique Element Type Declaration) ]

    [46] 

    contentspec

    ::= 

    'EMPTY' | 'ANY' | Mixed|children










    Kus Name määrab deklareeritava elemendi tüübi

    Kehtivuse piirang kehtestab elemendi tüübi deklaratsiooni unikaalsuse, st. et


    ühtegi elemendi tüüpi ei tohi deklareerida üle ühe korra.

    Näited elemendi tüübi deklaratsioonidest:  






    XML dokument võib sisaldada ühte või mitut säilituskirjet. Neid kutsutakse üksusteks; neil kõigil on sisu ja nad kõik on  (välja arvatud dokumendiüksus ja väline DTD) identifitseeritud nimega. Igal XML-dokumendil on üks üksus, mida kutsutakse dokumendiüksuseks, mis on XML-protsessorile stardipunktiks ja mis võib sisaldada kogu dokumendi. Üksused võivad olla kas parsitud või parsimata. Parsitud üksuste sisule viidatakse nagu tema asendustekstile (replacement text); seda teksti  (text) käsitletakse dokumendi lahutamatu osana.

    Parsimata üksus on  ressurss, mille sisuks võib ja võib ka mitte olla, tekst ja kui ta on tekst, siis ta võib olla mitte  XML-tekst. Igal parsimata üksusel on temaga assotsieeruv notatsioon, mis on identifitseeritav nimega. XML ei kitsenda parsimata üksuste sisu, välja arvatud nõue, et XML-protsessor teeb üksuste identifikaatorid ja notatsiooni kättesaadavaks rakendusele.

    Parsitud üksused saab välja kutsuda, kasutades üksuseviita; parsimata üksused atribuutide  ENTITY või ENTITIES  väärtustes esitatud nimede järgi.

    Üldüksused on üksused, mida kasutatakse dokumendi sisus. Selles spetsifikatsioonis on üldüksustele mõnikord viidatud  kvalifitseerimata terminiga üksus (entity), seda juhul  kui see ei tekita mitmemõttelisust.  Parameeterüksused on parsitud üksused kasutamiseks DTD-s. Need kaks üksuse tüüpi kasutavad erinevas vormis viitamist ja tuvastatakse erinevates kontekstides. Liiatigi haaravad nad erinevad nimeruumid; sama nimega parameeterüksus ja üldüksus on kaks eri üksust.

    Kohaldavad XML protsessoreid saab jagada kahte klassi: valideerivad ja mittevalideerivad. Kuid nad peavad ühtemoodi raporteerima dokumentüksuse ja mistahes teise parsitud üksuste lugemisel käesoleva spetsifikatsiooni trimmisuse piirangute rikkumistest.

    Valideerivad protsessorid peavad raporteerima DTD deklaratsioonides väljendatud piirangute eiramistest  ja käesolevas spetsifikatsioonis toodud kehtivuse piirangute teostamise ebaõnnestumistest. Et seda täita peavad valideerivad XML-protsessorid lugema ja töötlema kogu DTD ja kõik dokumendi poolt viidatud parsitud välisüksused.

    Mittevalideerivatel protsessorid peavad kontrollima ainult dokumentüksuse trimmisust, kaasa arvatud kogu sisemine DTD alamhulk. Kuna neil pole nõutav kontrollida seda, kas dokument kehtib, siis peavad nad töötlema kõiki sisemisest DTD alamhulgast sisseloetud  deklaratsioone ja deklaratsioone  igas sisseloetud parameeterüksuses, kuni selle parameeterüksuse viidani, mida nad ei  loe - see tähendab, et  nad peavad kasutama nendes deklaratsioonides peituvat teavet atribuutide väärtuste normaliseerimiseks, kaasama sisemiste üksuste asendustekstid  ja  atribuutide vaikeväärtused . Nad ei pea töötlema  (process) üksuse deklaratsioone, või atribuudiloetelu deklaratsioone, milleni jõutakse peale mitteloetava parameeterüksuse viita, kuna üksus võib  sisaldada ülekirjutatavaid deklaratsioone.


    XML on projekteeritud SGML alamhulgana, iga kehtiv XML-dokument peab olema ka vastav SGML-dokument.

    Kokkuvõte.
    XML on suunatud info kvaliteetsemale levitamisele Interneti kaudu.Teda on efektiivne kasutada, kui suure dokomentide hulga juures on vaja tarvitada struktuurielemente, sealjuures kiiret, lihtsat mittetekstiliste andmete vahetamist sõltumatute, mittefirmapõhiste vahenditega.

    Struktuurandmete infotöötlus on tunduvalt kergem ja odavam ning ei vaja SGML formaadile omast keerulist dokumendi defineerimist (DTD – Document Type Description)


    Download 52.87 Kb.

    Bosh sahifa
    Aloqalar

        Bosh sahifa


    Xml vorming ja tarkvara

    Download 52.87 Kb.