Originalus dokumentas yra čia. Normatyvinė vertsija yra tik anglų kalba. Šis dokumentas gali turėti klaidų.
Copyright © 1999-2003 W3C® (MIT, ERCIM, Keio), All Rights Reserved. W3C liability, trademark, document use and software licensing rules apply.
Sistematizuotiems duomenims
priklauso tokie dalykai kaip elektroninių sprendinių lentelės, adresų knygelės,
nustatymų parametrai, finansiniai pavedimai ir techniniai brėžiniai. XML yra
taisyklių rinkinys (galima laikyti jas nurodymais ar susitarimais) tekstams
formatams kurti, kurie leidžia sistematizuoti jūsų duomenis. XML nėra programinė
kalba ir jūs neprivalote būti programuotojas, norėdami ją naudoti ar jos
išmokti. XML palengvina užduotį kompiuteriui atvaizduoti duomenis, nuskaityti
duomenis ir įsitikinti, kad duomenų struktūra nėra dviprasmiška. XML išvengia
įprastų kalbos sandaros spąstų, yra išplečiama, nepriklauso nuo platformos ir
palaiko internacionalizaciją ir lokalizaciją. XML visiškai atitinka Unicode standartą.
Kaip ir HTML, XML naudoja tegus (žodžius, atskirtus '<' ir '>')
ir atributus (formoje pavadinimas="argumentas"). Kai HTML
nurodo ką reiškia kiekvienas žymuo ir atributas, ir dažnai kaip tekstas atrodys
naršyklėje, XML naudoja tegus tik atskirti duomenų dalis ir palieka duomenų
interpretavimą taikomajai programai, kuri juos nuskaito. Kitais žodžiais, jei
matote "<p>" XML byloje, nemanykite, kad tai paragrafas. Priklausomai nuo
konteksto, tai gali būti parametras, puslapis, p... (ir kas sako, jog tai turi
būti žodis su "p"?).
Programos, kuriomis kuriamos duomenų lenteles, adresų knygeles ir kiti
suskirstyti duomenys dažnai saugo duomenis diske, naudodami dvejetainį ar
tekstinį formatą. Vienas tekstinio formato privalumų yra tas, kad jis leidžia
žmonėms, jei būtina, pažvelgti į duomenis be programos, kuri juos pateikia;
blogiausiu atveju gali skaityti tekstinį formatą naudodamas savo mėgstamą
tekstinį redaktorių. Tekstiniai formatai taip pat leidžia programų kūrėjams
žymiai lengviau surasti ir pašalinti programos klaidas. Kaip ir HTML, XML bylos
yra tekstai, kurių žmonės skaityti neprivalo, tačiau gali, jei iškyla būtinybė.
Palyginti su HTML, XML bylų taisyklės suteikia mažiau variacijų. Užmirštas žymuo
arba atributas be kabučių padaro XML bylą nebetinkamą, kai HTML tokia praktika
dažnai plačiai sutinkama. Oficiali XML specifikacija neleidžia taikomosioms
programoms bandyti įspėti sugadintos XML bylos kūrėją; jeigu byla yra sugadinta,
taikomoji programa tiesiog sustos ir pateiks klaidą.
Kadangi XML yra tekstinis
formatas ir naudoja tegus atskirti duomenims, XML bylos beveik visada yra
didesnės nei palygintinų dvejetainių formatų. Tai buvo sąmoningas XML kūrėjų
sprendimas. Tekstinio formato privalumai yra ganėtini (žr. 3 punktą), ir
trūkumai paprastai gali būti kompensuoti. Disko vieta yra pigesnė nei turėtų, ir
archyvavimo programos kaip zip ir gzip gali labai gerai ir
labai greitai suspausti bylas. Be to, komunikacijos protokolai kaip modemo
protokolai ir HTTP/1.1,
esminis interneto protokolas, gali suspausti duomenis realiu laiku, sutaupydami
duomenų perdavimo kiekį taip pat efektyviai kaip ir dvejetainiai formatai.
XML 1.0 yra specifikacija,
kuri nurodo kokie "žymenys" ir "atributai" egzistuoja. Be XML 1.0, "XML šeima" yra
augantis modulių rinkinys, suteikiantis naudingas priemones vykdyti svarbias ir
dažnų kreipinių užduotis. XLink aprašo standartinį būdą kaip
į XML bylą įdėti nuorodas. XPointer yra kuriama sintaksė,
nurodanti kreipinius į XML bylos dalis. XPointer yra lyg URL, tačiau vietoj
kreipinio į dokumentus internete, ji kreipiasi į duomenų dalis XML dokumento
viduje. CSS, stiliaus
lentelių kalba, yra pritaikoma XML lygiai taip kaip ir HTML. XSL yra pažangi kalba stilių lentelėms
išreikšti. Ji remiasi XSLT,
transformacijos kalba, naudojama įtraukiant ar ištrinant tegus ir atributus.
DOM yra
standartinis funkcinių kreipinių rinkinys XML (ir HTML) byloms valdyti. XML Schemos 1 ir 2 padeda programų kūrėjams
tiksliai nurodyti jų pačių XML pagrindu sukurtų formatų duomenų struktūras. Yra
dar keletas kuriamų modulių ir priemonių. Apsilankykite W3C techninių pranešimų puslapyje.
XML kūrimas prasidėjo 1996 ir tapo W3C Rekomendacija nuo 1998 vasario mėn. Tai
gali sukelti jums įtarimų, jog tai nebrandi technologija. Iš tiesų technologija
nėra nauja. Prieš XML buvo SGML, sukurta ankstyvaisiais '80-aisiais, ISO
standartas nuo 1986, ir plačiai naudota dideliems dokumentavimo projektams .
HTML kūrėjai pradėjo 1990, į XML tiesiog paėmė geriausias SGML dalis, vedami
patirties su HTML, ir sukūrė kas mažiau galingą nei SGML, tačiau kur kas
taisyklingesnę ir paprastai naudojamą kalbą. Kai kurias evoliucijas, visgi,
sunku atskirti nuo revoliucijų... Ir turi būti pasakyta, kad SGML daugiausia
naudojama techninei dokumentacijai ir kur kas mažiau kitoms duomenų rūšims, kai
su XML yra visiškai priešingai.
Yra svarbus XML pritaikymas, taip pat tekstinis formatas: W3C XHTML, HTML
tesėjas. XHTML turi daug tokių pat elementų kaip ir HTML. Sintaksė buvo truputį
pakeista, kad atitiktų XML taisykles. Formatas, "XML pagrindu" paveldėjo XML
sintaksę ir kai kuriais atvejais ją draudžia (pvz., XHTML leidžia "<p>",
tačiau ne "<r>"); jis taip pat suteikia prasmę šiai sintaksei (XHTML sako,
jog "<p>" reiškia "paragrafą", o ne "parametrą", "puslapį", ar dar ką
nors).
XML leidžia nurodyti naują dokumento formatą derinant ir išnaudojant kitus
elementus. Kadangi du formatai, sukurti nepriklausomai gali turėti elementų ir
atributų tuo pačiu pavadinimu, turi būti atidus derinant šiuos abu formatus (ar
"<p>" reiškia "paragrafą" iš šio formato ar "parametrą" iš kito?). Norint
išvengti problemų derinant formatus, XML pateikia namespace (rezervuotų
pavadinimų) mechanizmą. XSL ir RDF yra geri XML pagrindo formatų, naudojančių
rezervuotus pavadinimus, pavyzdžiai. XML
Schema sukurta atkartoti šį moduliariškumo palaikymą, nurodant XML
dokumento struktūras, taip suteikiant galimybę derinti kelias schemas trečiai
sukurti, kuri apima sujungto dokumento struktūrą.
W3C Resource Description Framework (RDF,
Resurso Aprašymo Karkasas) yra XML tekstinis formatas, skirtams tokiems dalykams
kaip resurso aprašymas ir metaduomenų pritaikymai tokie kaip muzika,
grojaraštis, fotografijų kolekcijos ir bibliografijos. Pavyzdžiui, RDF gali
suteikti galimybę identifikuoti žmones internetiniame fotoalbume iš asmeninio
kontaktų sąrašo, tada jūsų el. pašto programa gali automatiškai išsiųsti
pranešimą tiems žmonėms, kad jų nuotraukos yra internete. Kaip ir HTML integravo
dokumentus, paveikslėlius, meniu sistemas ir formuoja pritaikymus naudojimui
tinkamam internetui atsirasti, taip RDF pateikia priemones integruoti dar
daugiau, padaryti Internetą daugiau Semantiniu Tinklu. Kaip žmonėms reikia
susitarimo dėl bendravime naudojamų žodžių reikšmės, taip kompiuteriai turi
žinoti susitarimo mechanizmus dėl prasmių sąlygų, kad efektyviai bendrautų.
Formalūs sąlygų aprašai tam tikroje srityje (apsipirkimas ar gamyba, pavyzdžiui)
vadinami ontologijomis ir yra būtina Semantinio Tinklo dalis. RDF, ontologijos,
ir prasmių atvaizdavimas, kad kompiuteriai padėtų žmonėms atlikti darbą yra Semantinio Tinklo Veiklos temos.
Pasirinkę XML kaip projekto pagrindą, jūs gaunate priėjimą prie didelės ir
augančios priemonių (viena jų jau gali daryti tai, ko jums reikia!) ir patyrusių
šioje technologijoje inžinierių bendrijos. Renkantis XML yra lyg renkantis SQL
duomenų bazei: jūs vis vien turite kurti savo nuosavą duomenų bazę, ir nuosavas
programas, ir procedūras, valdančias visa tai, tačiau egzistuoja daugybė
priemonių ir žmonių, pasiruošusių jums padėti. Ir kadangi XML yra
nelicencijuota, galite jos pagrindu kurti savo nuosavą programinę įrangą niekam
nieko nemokėdami. Didelis ir augantis palaikymas reiškia, jog nesate pririštas
prie vieno pardavėjo. XML nėra visada geriausias sprendimas, tačiau visada
vertas apsvarstymo.
Autorinės teisės © 1999-2003 W3C® (MIT, ERCIM, Keio), Visos teisės saugomos. Taikomos W3C teisinės atsakomybės, prekių ženklų, dokumentų naudojimo ir programinės įrangos licencijavimo taisyklės.