Korduma Kippuvad Küsimused umbes XML

Osa 1: Põhitõed
Üldine teave XML

XML on Laiendatav Märgistuskeel. See parandab funktsioonid Web, lastes teil leida oma teavet rohkem täpne, paindlik ja kohanemisvõimeline viisil.

See on laiendatav, sest see ei ole kindlaks määratud vormingus nagu HTML (mis on üks, ettemääratud markup language). Selle asemel, XML on metalanguage — kirjeldav keel teiste keelte—, mis võimaldab teil kujundada oma märgistuskeeli eri liiki dokumente. XML võivad seda teha, sest see on kirjutatud SGML, rahvusvaheline standard metalanguage teksti dokumendi xml (ISO 8879).

1.2: Mis on mark-up language?
Topelt-degressiivset meetodit, mis on mis dokumendis.

Märgistuskeel seeria sõnad ja sümbolid kirjeldada isikut või funktsiooni osad dokument (näiteks: “see on punkt”, “pealkiri”, “this list”, “see kiri arvu”, jne.). Programmid valite kasutada stiililehe muuta dokumendi väljund ekraan, printer, audio -, video -, Punktkirjas, või ringlussevõetud andmete vorming.

Mõned markup keeled (eriti need, mis szövegszerkesztõk) kirjeldavad ainult esinemised (see on kursiivis” või “vt julge”,”3mm ruumi kõigile”, jne.), Seega, need süsteemid saab kasutada ainult ekraanil, ja mitte kergesti taaskasutatavad.

XML on nn “önleíró”, sest nimi ja valige element tüüp esindama sisu (nt, jaotis, peatükk, link, jne.).

1.3: Mis on XML?
XML-identifitseerimise, edastamise ja säilitamise.

See on võimaldada SGML, et kätte saadud ja töödeldud internetis, see on nüüd võimalik HTML. XML on mõeldud lihtsam rakendamise ja koostalitluse nii SGML ja HTML.

(Bray, Paoli, Sperberg-McQueen, Maler ja Yergeau, 2004)

Vaatamata sellele, et esialgsed eksperimendid, brauseritel ei ole lubatud muud SGML, ainult HTML (kuigi seal olid plugins). Brauserid ka lubatud (tegelikult soovitatakse) autorid rikutud või murda HTML selleks, et teha see lihtsamaks. See võimaldas HTML-laialt levinud, kuid pidas arengut tagasi üle kümne aasta, mistõttu on võimatu, et programm usaldusväärselt. XML fikseerib, et kohustuslikuks jääda eeskirjade ja reeglite kehtestamisel palju lihtsam kui SGML.

Aga XML on mitte ainult web leheküljed: tegelikult see on väga harva kasutada oma veebilehti, sest brausereid, ikka ei anna usaldusväärset tuge vormindamine. Ühise kasutab XML hulka kuuluvad:

Teabe tuvastamine

Saate määrata oma kandidatuuri, nii et me ei saa anda mõtestatud nimed kõik oma andmeühikut.

Andmed on salvestatud

Kuna XML on kaasaskantav ja mitte-kaitstud, seda saab kasutada, et salvestada teavet, kogu platvormid. Kuna taga on rahvusvaheline standard, mis on kättesaadav ka ja processable formaadis.

Teave struktuur

XML struktuuride “pesa”, nii et neid saab kasutada, et laos ja mingit hierarhilist teave, eriti pikk, sügav, või keeruline dokument, mis määrab ja andmeallikad, mis muudab ta ideaalseks teabe-juhtimise back-end teenindavad Veeb. See on üks, kui kõige tavalisem web-rakendused, ümberkujundamine süsteemi, et teenida seda HTML-i.
Väljaanne

Algne eesmärk XML määratletud quote alguses see jagu. Ühendades eelmise kolme teemadel (identiteedi säilitamise ja struktuur) tähendab, et see on võimalik, et kõik hüvitised tugev dokumentide haldamise ja kontrolli (XML) ja avaldab Veebi (HTML), samuti paberi (PDF) ja teisi formaate (nt Braille kirja, heli, jne.) ühest allikast dokument, vastava stiili vahel.

Sõnumite ja andmete ülekandmine

XML on ka väga palju kasutatud umbes või kapseldatud teavet, et läbida erinevaid arvutisüsteemidele, mis muidu ei oleks võimalik suhelda, kuna omanik või salajane andmete vorming. Pakkudes lingua franca andmete identiteet ja struktuuri, XML on ühine “raamistik” muu protsessi side (sõnumid).

Veeb teenused

Hoone kõik need, nagu ka selle kasutamise brauserid, masina-processable andmeid vahetatakse vahel nõustudes süsteemid, kus enne ainult arusaadav, et inimesed (HTML). Ilm teenused, e-kaubanduse saidid, blogi kanalid, Ajax saite, ja tuhandeid muid andmevahetuse teenused nagu smart-telefoni rakendusi saab kasutada XML-andmete käitlemise ja edastamine, samuti brauseri või taotluse väljapaneku ja suhtlemist.

1.4: Mis on SGML?
Standard Generaliseerunud Markup Language, ISO 8879: 1986

SGML-Standard Generaliseerunud Markup Language (ISO 8879: 1986), rahvusvaheline standard, millega määratletakse, mark-up language struktuuri kirjutada eri elektroonilised dokumendid. Seal on SGML KKK David Megginson, et http://math.albany.edu:8800/hm/sgml/cts-faq.html; ja Robin kate XML veebilehtedega http://www.oasis-open.org/cover/general.html. Veidi valgust abi, proovige Joe inglise keeles “Ei ole SGML KKK” http://www.flightlab.com/~joe/sgml/faq-not.txt.

SGML on suur, tugev ja keeruline. See oli suur tööstus-ja ärisektori kasutada ligi kaks aastakümmet (ja ka täna mõnes kohas), ja meil on olulised teadmised ja tarkvara, mis kasvas üles koos, millest enamik on juba olemas XML-i.

XML on kerge cut-off versiooni SGML mis hoiab piisavalt funktsionaalsust, et muuta see kasulik, kuid eemaldab kõik lisavõimalused, mis tegi SGML liiga keerulised programmi, elektrooniline keskkond.

ISO standardid nagu SGML on reguleeritud Rahvusvahelise Organisatsiooni (international organization for Standardization, Genf, Šveits, ja hääletasid, või olemasolu esindajad iga riigi standardiorganisatsiooni asutused.

Kui teil on küsimusi rahvusvaheline standard, võtke ühendust riiklike standardite organisatsiooni poolt, selle riigi nimi, esindaja asjakohased ISO komitee või töörühma.

Kui teil on küsimus, on oma riigi esindused Genfis või tegevuse riigi standardiorganisatsiooni, võite võtta ühendust pädeva valitsusasutuse teie riigis või helista avaliku esindaja.

Esindatus riikides ISO suhtes ei ole käesoleva KKK. Palun ärge saatke päringuid toimetaja, kuidas ja miks riigi ISO esindajad on või ei hääletanud teatud standardile.

1.5: Mis on HTML?
Hypertext Markup Language, RFC 1866, keele veebi lehekülgedel.

HTML euroopa Hypertext Markup Language (algselt RFC 1866, nüüd HTML 4.01), mis alustas väike kohaldamise SGML Web tuli Tim Berners-Lee cernis aastal 1989-1990.

Algselt määratletud väga lihtne klassi aruanne-stiilis dokumentide peatüki pealkirjad, lõigud, loendid, tabelid ja skeemid, samuti mõned informatiivseid elemente, kuid väga vähe presentational elemendid (Flynn, 1995), ja mõned hüpertekst-ja multimeedia. Vt küsimus laiendamine HTML.

Praegune W3C soovitused XML version HTML, XHTML, ja rohkem mobiil – ja meedia-teadlik versioon HTML5. Seal on eraldi HTML-i ja XHTML-KKK eespool, Steven Pemberton, et http://www.w3.org/MarkUp/2004/xhtml-faq

1.6: On olemas XML, HTML-i versioon?
Jah, XHTML, W3C

W3C soovitus on XHTML, mis on “tööstuslikult HTML 4 XML 1.0” alla. See spetsifikatsioon määratleb HTML XML-rakendus ja pakub kolme DTDS vastavad need, mis on määratletud HTML-4. * (Range -, ülemineku-ja Frameset).

Semantika elemendid ja atribuudid on määratletud W3C Soovitus HTML-4. Nende semantika kasutati aluse tulevase venivusega, XHTML. Ühilduvus olemasolevate HTML brausereid saab järgmiselt: väike suunistes (vt W3C saidi).

1.7: Mis on HTML5?
Uue versiooni XHTML-to-use interactive ja mobiil keskkond.

Selleks, et XHTML, et rohkem on laialt kasutusel interaktiivne ja juhend keskkonna, W3C on arenenud vaatama XHTML nimetatakse HTML5, mis on üks eksponaat, seda parem toetust multimeedia-ja mobiilseadmed ja vähem raske dokumendi muster.

Seal on selgitus elliot oli Roostes Harold ja HTML5 KKK selle WHATWG.

HTML5 koos CSS3 on nüüd ühine standard, web development.

1.8: Nr XML, SGML, HTML-i ja kõik sama?
Ei, SGML-ja XML-meta-keel. HTML, XHTML ja HTML-rakenduste kõiki neid.

Ei ole päris; SGML on emakeel, ja seda on kasutatud, et kirjeldada tuhanded eri liiki dokumentide paljudes inimtegevuse valdkondades, kus transkriptsiooni vana iiri käsikirjad tehnilise dokumentatsiooni stealth pommitajad, ja patsientidele, meditsiini-ja kliinilisi andmeid noodid. SGML on väga suur ja keeruline, aga ega liigne kõige levinum office ‘ i rakendused.

XML on lühendatud versioon SGML, et oleks lihtsam hallata via web kasutajaliides, kergesti määratleda oma dokumendi liiki, ja lihtsam programmeerijad kirjutavad programme, et nendega tegeleda. See ei jäta kõik keerulised ja vähem kasutatavad seaded SGML vastutasuks kasu lihtsam-rakendusi kirjutada, lihtsam aru saada, ja paremini tarne-ja koostalitlusvõime üle interneti. Kuid see on siiski põhineb SGML-ja XML-failid on ikka töötlemine samal viisil nagu mis tahes muu SGML faili (vt küsimus XML-i tarkvara).

HTML, XHTML, HTML5 ainult need, XML rakendused kõige sagedamini kasutatav internetis.

Tehnilised lugejad leiavad, et oleks kasulikum mõelda XML-kui SGML– HTML-i asemel.

1.9: Kes vastutab selle eest, XML?
W3C

XML soovitus World Wide Web Consortium (W3C), ja arengu spetsifikatsioon järelevalve XML-i töörühma. Erilist Huvi Rühm kooptált toetajad ja teised spetsialistid, kirjutada märkusi ja arvamusi e-posti teel.

XML on avalik formaat: see ei ole varaliste arendada mis tahes ettevõte, kuigi liikmeks WG ja SIG esindatud ettevõtete kui ka teadus-ja kõrgkoolid. Kui v1.0 spetsifikatsioon on vastu võtnud W3C nagu soovitus, 10. veebruar, 1998.

1.10: Miks on XML selline oluline areng?
See välistab paindlik jätmine HTML ja keerukust SGML

See eemaldab kaks piirangud, mis hoidsid tagasi Veebi arengut:

1. sõltuvus ühtse, jäiga dokumendi liik (HTML) oli öelnud, et tuleb palju kuritarvitamist, ülesandeid, mida ta polnud kunagi ette nähtud;

2. keerukust täis SGML, mille süntaks, kasutades erinevaid võimas, kuid hard-to-programmi võimalusi.

XML võimaldab paindlikku arengut kasutaja määratud dokumendi tüüpi. See on jõuline, kaitstud, püsiv, ja kontrollitava faili vormingu säilitamine ja edastamine tekst ja andmed nii, ja Veebist; ja see eemaldab keerulisem võimalusi, SGML, mistõttu on lihtsam programm.

1.11: Miks mitte lihtsalt läbi laiendamine HTML?
HTML on juba liiga üle koormatud omanik add-ons.

HTML-olen tõmmatakse maha kümneid huvitav, kuid leiutisi, mis on vastuolus erinevate tootjate, sest see on lihtsalt viis, kuidas kirjeldavad andmed.

XML võimaldab grupid, inimesed või organisatsioonid, kellel on oma ainulaadse märgistusega, mis rakendused vahetada teavet domeeni (muusika -, keemia -, elektroonika -, mäe-jalgsi -, rahandus -, surfamine, nafta geoloogia, lingvistika, keetmine, küpsetamine, kudumine, tähe kartograafia, ajaloo -, inseneri -, küüliku-pidamine, matemaatika, sugupuu jne.)

HTML algselt ette kujutasin juba ka varem läve kasu, sest kirjelduse andmed, ja kuigi XHTML ja HTML5 jätkab mängivad olulist rolli sisu, mida nad esindavad, palju uusi rakendusi nõuavad tugevamaks ja paindlikumaks infrastruktuuri.

1.12: kas on Olemas XML asendada HTML?
No.

Ei XML ise ei asenda HTML. Selle asemel, alternatiivina, mis võimaldab teil määrata oma seeria kandidaat elemente. HTML jääb eeldatavalt kasutatakse laialdaselt internetis, ja praegune versioon HTML (XHTML ja HTML5) XML-i süntaksit.

XML on mõeldud kirjutamise tarkvara, mis on palju lihtsam kui SGML, mis on täpselt algse HTML põhines.

1.13: Miks kasutada XML-i?
See on tugev, vastupidav, saab manipuleerida, ning vabas vormis informatsiooni identifitseerimine, säilitamine ja edasiandmine.

Siin on mõned põhjused, et XML on kasutatud (ei ole tähtsuse järjekorras). Mitte kõik need kehtivad teie vajadustele, ja seal võib olla ka muid põhjuseid ei ole siin mainitud (kui jah, siis palun andke toimetusele teada!).

XML-oskab kirjeldada ja identifitseerida teabe täpselt ja üheselt mõistetavalt, nii et arvuti saab programmeerida, et “mõista” andmeid (noh, vähemalt manipuleerida, kui saab aru).

XML võimaldab dokumentide kogum, mis on kõik sama tüüpi peaks olema loodud ja käsitlemine järjepidevalt ja ilma struktuurseid vigu, sest see pakub standardiseeritud viisil, et kirjutada neile ette, kontrollimise, või jätta/lase teatud liiki dokumendi struktuuri. [Pange tähele, et see on absoluutselt midagi pistmist vormindamine, välimuse või tegelik tekst või andmed dokumendi, lihtsalt struktuuri neid. Kui soovite stiilid ja vormindus, Kuidas kontrollida vormingut XML ?.]

XML on tugev ja vastupidav vorm info säilitamine ja edastamine. Tugev, sest see põhineb tõestatud standard, ja nii tuleb katsetada ja kontrollida; vastupidav (püsivad), kuna ta kasutab plain text) vormingus, mis on pikem kui standard binaarne.

XML on ühine süntaks sõnumite süsteemide vahel teabe vahetamise taotlused. Varem iga sõnumside süsteem oli oma vorm ja kõike muud oli, mis tegi võimalikuks süsteemide vahel sõnumid asjatult segane, keeruline ja kallis. Kui kõik on sama süntaksit see teeb kirjutamise nende süsteemid palju kiirem ja usaldusväärsem.

XML-tasuta. Mitte ainult on tasuta (free as beer), kuid tasuta õigusabi koormus (free as speech). See ei kuulu kellelegi, nii et see ei saa olla kaaperdatud või piraat. Ja sa ei pea maksma tasu kasutada (saab muidugi kasutada kommerts tarkvara, et sellega tegeleda, sest palju häid põhjuseid, aga kui sa ei maksa XML ise).

XML-andmeid saab manipuleerida programmiliselt (masina juhtimine), nii et XML-dokumentides on pieced koos erinevatest allikatest, või saab lahti võtta ja uuesti kasutada mitmel moel. Neid on võimalik konverteerida mis tahes muus vormis, ei ole andmete kadu.

XML, kasutades eraldi vorm (välimus) sisu. XML-fail, mis sisaldab dokumenti teave (tekst, andmed), ning määrab nende struktuuri: oma vormindamine ja muud töötlemise vajadus on tuvastatud, eraldi stiililehe või töötlemise süsteem. Kahe kombineeritud nende kulude aeg kohaldada soovitud vormindamine teksti ja andmete kindlaks oma struktuuri (asukoht, ametikoht, auaste, et, või midagi muud).

Mis tahes disaini eesmärgid, mis on loetletud XML-kirjeldus.

1.14: Kust leida rohkem teavet XML?
Online ja offline vahendid

Online, seal on XML-kirjeldus ja sellega seotud dokumentatsiooni W3C; Robin Kate on XML-katke lehed on põhjalik nimekiri online viide materjalid ja lingid tarkvara; ja kokkuvõtte ja lühendatud alates Tim Bray; ja tuhandeid viide paiksetest saasteallikatest, sisestades “xml” Google või mõne muu otsingumootori.

Offline vahendeid, vt loetelu raamatud, artiklid ja tarkvara XML-in Robin Kate XML kaas lehekülgi (artiklid ja raamatud). Sait on alati esimene sadam, arhiivinduse allikatest.

Juurdepääs eksperdid, eriti nõustamine ja koolitus, vaata XML-Gildi, mille liikmed moodustavad konsortsiumi mõned parimad sõltumatu XML-konsultandid maailmas.

Järgmised sündmused, mis mulle öeldi umbes, palun kirjutage mulle, kui teil kohtuda teistega: seal on palju muud XML sündmustest üle maailma ja enamik neist on teatavaks meililistide ja uudisgruppide.

1.15: Kui ma lisada rakendamine ja arendamine XML?
Meililistide, Usenet uudistegrupid, veebipõhine teadetetahvel-lauad ja IRC kanalid

Peamised online-tugi meedia on web foorumites ja meililistides. Usenet uudistegrupi XML-keeles, kuid on harva kasutatakse nüüd, kuigi vaadates neid Google i Grupid ilmub palju kasulikku teavet. Kui IRC võrgu kasutatakse ka teatud määral, ja kõige üksikute XML-projektid ja programmid on oma teema-konkreetne teadetetahvlid, veebilehed. Samuti on olemas teadmata arv seotud küsimus-vastuste foorum saite, mis on findable, kasutades otsingumootoreid.

Off-line toetus, vaadake Kust ma leian täiendavat informatsiooni XML? Andmed konverentside ja töötlemise suvel.

Kõige aktiivsemad interneti foorum tundub, et StackOverflow: kummaline, tundub, et seal on mingeid konkreetseid StackExchange XML-i kodulehel, samuti on muud teemad (nt lateks). Kui W3Schools XML Foorum (mingit seost W3C), tundub, et viimasel ajal liikluses, nagu DevShed ja CodingForums. Google i otsing omakorda üles paljud teised väiksem liiklus.

Peamine grupis on comp.text.xml kuigi see on palju vähem kasutada, kui varem. Küsige oma Interneti-teenuse pakkuja ligipääs Usenetti, või web interface, nagu otsingumootoriga arhiiv Google i poolt reserveeritud. Kui teie brauseris või e-posti ei anna uudiste lugemise võimalus, paigaldada üks, et ei või (parem) kasutada standalone uudistelugeja.

Comp.teksti.sgml iseendale, kõigil praktilistel eesmärkidel ei kasutata enam. Microsoft-konkreetsed uudiserühmad oli järgult kasuks veebipõhised foorumid, mida Microsoft ise.

Üldine eesmärk meililistiga avalik arutelu XML-L: tellimiseks külastage veebisaiti ja klõpsake linki, et liituda.

Need tarkvara arendamise komponendid XML on xml-dev meililisti. Te saate sisse logida saadetud 1-line kiri xml-dev-request@lists.xml.org öeldes lihtsalt tellida. Pange tähele, et see list on inimesed aktiivselt kaasatud ressursside arendamiseks XML-i. Mitte üldist teavet XML (XML loetelu eespool).

Kui XSL loend arutada, XSL (nii XSLT ja XSL: FO). Üksikasjad selle kohta, kuidas tellida, vt http://www.mulberrytech.com/xsl/xsl-list.

Seal on pikk nimekiri teistes foorumites, meililistides ja foorumid Robin Kate saidil http://xml.coverpages.org/lists.html.

1.16: Mis vahe on XML-i ja C-või C++ Java?
C ja Java kirjutus-ja programmid; XML-info salvestamine.

C ja C++ (ja teistes keeltes nagu FORTRAN või Pascal või Visual Basic, või Java või sadu rohkem) on programmeerimiskeeled, millega saab määrata, arvutused, tegevused ja otsused tuleks teha, et:

mod curconfig[if left(date,6) = "01-Apr", 
    t.put "April Fool!", 
    f.put days('31102011','DDMMYYYY') -
          days(sdate,'DDMMYYYY')
    " more shopping days to Samhain"];

XML spetsifikatsioon keel, millega saab planeerida kirjeldus režiimid teave (tekst või andmed), tavaliselt säilitamise, edastamise või töötlemisega programm. Ma ei ütle midagi selle kohta, mida teha andmetega (kuigi sinu valitud elementide nimed, et eesmärk, mida):

<part num="DA42" models="LS AR DF HG KJ" update="2001-11-22">
  <name>Camshaft end bearing retention circlip</name>
  <image drawing="RR98-dh37" type="SVG" x="476" y="226"/>
  <maker xml:id="RQ778">Ringtown Fasteners Ltd</maker>
  <notes>An <tool xml:id="GH25"/>angle-nosed insertion tool</tool> is 
    required for the removal and replacement of this part.</notes>
</part>

Oma XML-faili (sh HTML) ei tee midagi. See on andmed kujul, mis lihtsalt istub seal, kuni sa käivitada programmi, mis teeb midagi. Vt ka küsimus, kuidas joosta või teha XML-i vormingus faile.

XSLT2 ja XSL:FO
Vesi on muddied asjaolu, et kõige populaarsem ümberkujundamise töötlemise keeles (XSLT2 ja XSL:FO) on tegelikult kirjutatud XML-süntaks, sest nad on deklaratiivne, mitte menetlustähtajad. Sellistel erijuhtudel, siis võib öelda, et ‘käivita’ XML-faili, töötab töötlemise rakendus nagu Saxon, kuhu on koondatud direktiivides sätestatud failid Java bytecode töödelda XML dokumente. Selles mõttes, sa võiksid võrrelda neid teiste programmeerimiskeelte, aga sa oleks võrrelda keele rajatised, mis ei ole XML-süntaks, milles nad on kirjutatud.

William Hammond kirjutab:

(artikkel <i7ll1362ib.fsf@hilbert.math.albany.edu>)

SGML on kategooria “dokumendi tüübid”, mille seadistatav jagatud süntaks, millest enamik (nagu klassikaline HTML) ei saa koostatud toota käivitatava programmi. XML on alamkategooria SGML, mille süntaktilist piiranguid. Näiteks XML sõnavara dokumendi tüüp on alati suur-ja väiketähti, samal ajal kui SGML see võib olla tõstutundlik) või tõstutundetu. Nii, näiteks, klassikaline HTML on SGML dokumendi liik ja XHTML+MathML on XML-dokumendi tüüp.

Kuigi mõned dokumendi tüübid vastavad dokumendi markup keeled, muude dokumentide tüübid (nagu CTAN kataloogi kirje) on lihtsalt struktureeritud andmete[…]

Ma kahtlen tõsiselt, aga see, et arvuti keelt nagu C on mõistlikkuse mõttes võrdväärne SGML dokumendi liik.

Jagu 2: Olemasolevad kasutajad

(sealhulgas igaüks, kes kasutab brauseri)

2.1: Mida ma peaksin tegema, et kasutada XML-i?
Loe: kasuta iga moodne brauser; luua: kasutada XML-i redaktorit.

Keskmine kasutaja Interneti, siis ei ole midagi, lihtsalt veebibrauserit, mis töötab koos XML (vt küsimus veebibrauserites). Mäletad uus XML-sellega seotud rajatiste, valmistoodetena või rakendada ajal (vt W3C veebisaiti), nii et mõned uued funktsioonid ei tööta brauseris veel.

Saate kasutada XML-vastavus brauseri me vaatame mõned stabiilne XML materjali, nagu Jon Bosak on Shakespeare mängib molekuli eksperimendid Keemilise Markup Language (CML). Siin on mõned näited, mis on loetletud vahendid http://xml.coverpages.org/xml.html#examples leiad XML (eriti varjus XHTML) on kehtestada kohtades, kus nad ei riku vanemate brauseritega.

Kui te soovite alustada ettevalmistusi oma XML-failid, ma näen probleemi Autorite ja osaliselt arendajad ” Osa, eriti küsimus XML-i Redaktorit.

2.2: Mida tähendab XML näeb (sees)?
Teravanurgeliste sulgudes, nagu HTML

Põhistruktuur XML on sarnane teiste rakenduste SGML, sealhulgas HTML. Põhilised komponendid on näidatud järgmises näites. A XML dokument algab vabatahtlik Prolog, mis on kaks (valikuline) osad:

1. XML-deklaratsiooni:

<?xml version="1.0" encoding="utf-8"?>

See määrab ära, kas XML dokument, mis on UTF-8 iseloomu repertuaari (vaikimisi, teised on olemas, kuid toetus on ainult volitatud UTF-8);

2. Dokumendi Tüübi Deklaratsioon kui DTD:

<!DOCTYPE report SYSTEM "http://sales.acme.corp/dtds/salesrep.dtd">

mis tuvastab dokumendi liik (siin, “aruanne”), ja ütleb, et kui Dokumendi Tüübi Kirjeldus (DTD) on salvestatud;
Kui Prolog pärast Dokument, Näiteks:

1. Root element, mis on äärepoolseimate (top level) element (start-tag pluss lõpp-tag), mis ümbritseb kõike muud: näited allpool root elemendid vestlus, titlepage;
2. Struktureeritud mix kirjeldav või üksikasjalikumaid elemente, lisades tähemärkide andmete sisu (teksti), kuid soovi korral kõik atribuudid (‘nimi=”väärtus”‘ paari), sees mõned start-silte.

XML-dokumentides on ka väga lihtne, lihtsalt varjatud markup enda disain:

<?xml version="1.0" standalone="yes"?>
<conversation>
  <greeting>Hello, world!</greeting>
  <response>Stop the planet, I want to get off!</response>
</conversation>

Või see võib olla keerulisem, Schema või DTD, äkki on see sisemine osa (kohaliku DTD muutused [nurksulgudes] jooksul Dokumendi Tüübi Deklaratsioon (majandus) ENTITY deklaratsiooni allpool); ning kuitahes keerukate pesastatud struktuur:

<?xml version="1.0" encoding="iso-8859-1"?>
<!DOCTYPE titlepage 
  SYSTEM "http://www.foo.bar/dtds/typo.dtd" 
[<!ENTITY % active.links "INCLUDE">]>
<titlepage xml:id="BG12273624">
  <white-space type="vertical" amount="36"/>
  <title font="Baskerville" alignment="centered" 
   size="24/30">Hello, world!</title>
  <white-space type="vertical" amount="12"/>
	  <!-- In some copies the following 
           decoration is hand-colored, presumably 
           by the author -->
  <image location="http://www.foo.bar/fleuron.eps" 
   type="URI" alignment="centered"/>
  <white-space type="vertical" amount="24"/>
  <author font="Baskerville" size="18/22" 
   style="italic">Vitam capias</author>
  <white-space type="vertical" role="filler"/>
</titlepage>

Või nad võiksid olla kuskil: palju sõltub sellest, kuidas sa tahad, et määrata dokumendi liik (või kelle kasutate ja mida te kasutate seda. Andmebaas loodud või programmi genereeritud XML dokumendid, mida kasutatakse e-kaubandus on tavaliselt vormindamata kuna masin tarbimine, mis ei ole ette nähtud, et lugeda, kuid võib kasutada väga pika nimed või väärtused, mitme koondamise, mõnikord nr märk andmete sisu ja väärtust omadused:

<?xml version="1.0"?>
<ORDER-UPDATE AUTHMD5="4baf7d7cff5faa3ce67acf66ccda8248"
 ORDER-UPDATE-ISSUE="193E22C2-EAF3-11D9-9736-CAFC705A30B3"
 ORDER-UPDATE-DATE="2005-07-01T15:34:22.46"
 ORDER-UPDATE-DESTINATION="6B197E02-EAF3-11D9-85D5-997710D9978F"
 ORDER-UPDATE-ORDERNO="8316ADEA-EAF3-11D9-9955-D289ECBC99F3">
  <ORDER-UPDATE-DELTA-MODIFICATION-DETAIL ORDER-UPDATE-XML:ID="BAC352437484">
    <ORDER-UPDATE-DELTA-MODIFICATION-VALUE ORDER-UPDATE-ITEM="56"
     ORDER-UPDATE-QUANTITY="2000"/>
  </ORDER-UPDATE-DELTA-MODIFICATION-DETAIL>
</ORDER-UPDATE> 

2.3: kasutada XML-i asemel HTML?
Jah, kui sa pead, usaldusväärsus, täpsus, vastupidavus.

XML võimaldab autorite ja teenusepakkujate kujundada oma dokument märgistusega, selle asemel, et piiratud HTML. Dokumendi tüüpi spetsiaalselt kohandatud rakendus, nii tülikas fudging ja poodlefaking, mis toimub HTML muutub minevikku: oma markup saab alati öelda, mida see tähendab. Triviaalne näide:

<date YYYY-MM-DD="2005-12-26">last Monday</date>
  • Teabe sisu saab rikkamaks, lihtsam kasutada, sest kirjeldav ja hypertext ühendab võimeid XML on palju suurem kui olemasolevate HTML.
  • XML on võimalik pakkuda rohkem ja paremaid võimalusi brauseri esitusviisi, loeng, XSLT abil, või CSS style sheets);
  • Eemaldab palju alusvara keeruline SGML-format-HTML (mis viis neid ignoreeritakse ja katki) lisaks veel paindlik mudel, nii kirjalikult programmid hakkama XML on palju lihtsam kui sama vana, katki HTML.
  • Teave muutub kättesaadavaks, korduvkasutatav, sest paindlikum märgistuskeel XML saab kasutada mis tahes XML-tarkvara, mitte ainult konkreetsete tootjate, nagu on muutunud olukorda HTML.
  • XML-i vormingus faile saab kasutada ka väljaspool Internetti, olemasoleva dokumendi menetlemise keskkondades (nt kirjastused).

Kui andmed on ajutine, või täiesti staatiline, unreferenced, või väga lühike, lihtne, kuid see ei ole tõenäoline, et teil on vaja uuendada HTML, mida vajate.

2.4: Keegi saatis mulle XML-faili. Kuidas ma saan seda lugeda?
Avatud XML-brauseri või XML-i redaktorit.

Kui faili on selles, või kehtiv XML, vaid avatud iga XML vastab brauseri (vt Mida ma pean tegema, et kasutada XML? Kus ma saan XML-brauser?). See kuvab faili vormindatud vaade, mis näitab märgistus a-vormingus, mis võimaldab klapi või paljastama pesastatud hierarhias (kliki väike pluss ja miinus sümbolid), mis vähemalt lase sul loe midagi.

Kui fail sisaldab linki XSLT või CSS stiililehe (laaditabeli oli ette nähtud, või interneti-kättesaadav), siis brauser peaks formaadis faili saab lugeda viisil (kuid hoolt, et brauser, vormindamise, ei ole usaldusväärne).

Kui soovid redigeerida faili, teil on vaja XML i redaktorit (vt XML-Toimetaja). Kui sa ei ole kogenud piisavalt, koos teravanurgeliste-bracket markup, ei püüa muuta XML-failid, mis ei ole XML-i redaktorit.

2.5: Kuidas saan kontrollida vormingut XML?
CSS või XSLT2 stiililehe.

HTML vaikimisi stiilid ehitatud brauser, kuna sildid HTML oli eelnevalt määratletud, või sisseehitatud brauser. See on ikka tõsi, XHTML, HTML5, teatud määral. Muud XML, kus sa saad määrata oma sildid, veebibrauserid ei ole oodata, et teada saada, või ei tea ette, milliseid nimesid kasutada ja mida need tähendavad, nii et teil on vaja stiililehe kui soovite kuvada vormindatud teksti.

Brauserid, mis lugeda XML aktsepteerib kasutada CSS stiililehe minimaalne, kuid võimalik on kasutada ka võimsam XSLT stiililehe keeles muuta oma XML, HTML i mis brauserid, muidugi, ma juba tean, kuidas kuvada (ja et HTML saab ikkagi kasutada CSS stiililehe). Seega, dokumendihalduse eeliseid kasutades XML, kuid ma ei pea muretsema oma lugejatele, kellel on vaja XML brauseris.

See ümberkujundamine on enamasti dokumendi omanik server, ainult HTML igatahes, võibolla sa tead, et see oli XML algselt. Kuid see on ka võimalik kasutada (üsna piiratud) sisseehitatud XSLT trafo 1.0, mõned brauserid, server ettevõtjate nüüd kasutada Saxon CE, mille alla laadida brauseri versiooni XSLT2.

Mike Brown kirjutab:

XSLT on XML dokumendi töötlemine keele, mis kasutab allikas-kood, mis on kirjutatud XML-i. Kui XSLT dokument, mis kinnitab, reeglid, XSLT protsessor kasutada tõlgendamisel sisu XML-dokument. Need eeskirjad öelda XSLT protsessor, kuidas luua uus XML-andmete struktuuri, kuidas andmed on paisatud nagu XML-dokument, kui HTML dokumendi, tekstina või äkki mõni muu vorm.

See ümberkujundamine on võimalik teha kas brauseris või server, enne, kui fail on saadetud. Muutus brauser offload töötlemise serverist, kuid võivad kehtestada brauseri sõltuvusi, mida mõned lugejad jätta. Ümberkujundamine server muudab protsessi brauseri-sõltumatu, kuid kohad raskemad töötlemise load serveris.

Nagu kõik süsteemi, kus faile saab vaadata juhuslikult suvalise kasutajad, autor ei tea, millised vahendid (näiteks fondid), et süsteemi kasutaja, nii et sama ravi on vajalik, kuna HTML fonte. Elada stiilis leht on XML fail, eraldi töötlemine, brauser, sisaldavad stiililehe deklaratsioonid:

 
<?xml-stylesheet href="foo.xsl" type="text/xsl"?> 
<?xml-stylesheet href="foo.css" type="text/css"?>

(asendada URI, laaditabelit, muidugi). Vt http://www.w3.org/TR/xml-stylesheet/ details. Kuhjuvate Stiililehe Spetsifikatsioon (CSS) on lihtne süntaks tava stiile, elemendid, ja rakendada kõige veebilehitsejat.

Dave Pawson ütleb põhjalik XSL KKK http://www.dpawson.co.uk/xsl/ raamat (Pawson, 2002) [Rebane raamat] on kättesaadav O’Reilly. XSL kasutab XML-i süntaksit (XSL stiililehe on lihtsalt XML-faili), samuti laialdast toetust mitu suurt brauseri müüjad (vt küsimused brauseritega muud tarkvara). XSL kahel maitsed:

  • XSL, mis on puhas vormindamine keel, kirjutamine Formindatud Objektid (FO) faili, mis vajab tekst vormindamistööriista nagu FOP, XEP, või teised, et luua printable (PDF) väljund (vt ka Alternatiive XSL:FO). Praegu ma ei tea ühtegi brauserit, mis toetaks otseselt XSL muutes PDF;
  • XSLT (T Transformation), mis on keel, et täpsustada muundumine, XML, HTML-i, kas sees või brauseri serveris enne saatmist. Saate ka määrata, muundumine, üks sõnavara XML teise XML polegi (mis võib olla mistahes formaadis, sealhulgas RTF, LATEX).

Kõik praegused versioonid Microsoft Internet Explorer, Firefox, Chrome, Mozilla, Safari, Opera käepide XSLT 1.0 brauseris. Hoiduge aegunud brauserid nagu MSIE5.5, mis on vaja mõned post-installation operatsiooni eemaldada kaua-vananenud WD-xsl ja asendada see praegune XSL-protsessor.

WYSIWYG jaoks XSL
Seal olid katsed toota pseudo WYSIWYG redaktorid luua XSL[T] stiili vahel, kuid need on enamasti piiratud lihtne sisendi elemendid toodangu elemente (nt DocBook para et HTML lehekülge). Midagi väljaspool seda ilmselt ei ole, sest lõpmatu keerukust, mida inimesed tahavad, et teave. Kui teil on juurdepääs ACM andmebaas, vt paberi Pietriga, Vion-Dury, ja Quint kohta VX, ACM DocEng’01 (Atlanta) Korras.

Luua HTML-serveris
Seal on kasvav kasutamine server-side töötlejad nagu Kookon ja teised, mida saab kasutada, et luua, talletada ja hallata oma andmeid XML teenida, kuid see auto-HTML ega muud vormingut, mis võimaldab väljund, mida võivad kasutada kõik brauseritega. XSLT on ka laialdaselt kasutatakse, et muuta XML vormingus SGML sisend, et muud süsteemid (näiteks selleks, et muuta XML arvesse LATEX, trükkimine).

Alternatiive XSL:FO
Selle asemel, et toota PDF-via FO protsessor, seda on võimalik kasutada XSLT2 muuta XML LATEX, ladumiseks PDF (nagu on trükitud versioon on see KKK, DocBook LATEX). See on eeliseks on võimalus kasutada LATEKS on ulatuslik raamatukogu kirjutada vormindamine moodulid (‘paketid), mis väldib ratta-muuda praegu vaja XSL:FO.

Teise võimalusena David Carlisle  xmltex loeb XML otse, mis on veel üks praktiline, kui eksperimentaalne lahendus on wrap XML-i. A kasutamine TEX süsteem, mis võib võtta XML-failidena backend protsessor XSL:FO, serialised kui XML-i. Sebastian Rahtz piltz on PassiveTEX kasutab xmltex, et seda saavutada.

Kui TEX juures http://www.tex.ac.uk/faq. Silmaril väidab, online-versioon Peter Flynn on raamat, LATEX, Vormindamine Teabe, mille mõned näited XSLT2 ümberkujundamine (Flynn, 2014).

SGML süsteemid sarnased stiililehe mehhanism: kõige levinum oli FOSI (Formaaditud Väljund Spetsifikatsioon Näiteks), mis on standard kaitse-ja industrial engineering applications, eriti kui Arbortext toimetaja (Vilunud, siis Epic, see võib olla ka midagi muud, järgmisel nädalal); DynaText/DynaWeb stiililehe kasutada SGML kirjastamine, et web; ja Synex stiililehe kasutada brauserid, mis põhinevad Synex mootori (nt Panorama, kelle stiil pind osaliselt vastu Xm), teadmisi, mille disainerid püsib selles DocZilla brauser.

2.6: Kus ma saan XML-brauser?
Kõik kaasaegsed brauserid toetavad XML

Praeguse olemasoleva brauseri tugi XML (August 1-2014):

  • Praegune versioon Microsoft Internet Explorer, Firefox, Safari, Chrome, Mozilla ja Opera kõik tunduda, et toetada XML koos CSS ja/või XSLT 1.0 stiili vahel. Toimetajad tervitavad täiendav teave.
  • Ärge kasutage Netscape (kõik versioonid), Internet Explorer 6 või varem, või mis tahes varasemad versioonid Mozilla kui te soovite XML-i tugi: või ei ole, või on lootusetult katki. Update kaasaegne brauser niipea kui võimalik.

Ülejäänud nimekiri on ajaloolist huvi ainult.

  • Microsoft Internet Explorer 5.0, 5.5 käepide XML -, töötlemis-see vaikimisi sisseehitatud stiililehe kirjutatud Microsoft-konkreetne, vananenud eelkäija XSLT nimega XSL (mitte segi ajada päris XSLT). Väljund stiililehe puhul DHTML-i, mis, kui kuvatakse brauseris, näitab värvitud, süntaksi esile versiooni XML-dokument, kokkuklapitavad seisukohti. Kui XML-dokumendi viited laaditabelit, et stiililehe kasutatakse selle asemel piires MSIE on puudulik rakendamine CSS. MSIE 5.0, 5.5 võib kasutada ka laaditabelid teises vananenud formaadis, mida nimetatakse WD-xsl, mida tuleks vältida. Need versioonid on võimalik laiendada, et toetada tõelisi XSLT: vt MSXML KKK.
    MSIE 6.0 ja hiljem kasutada tegelikke XSLT 1.0, aga seda saab kasutada nii vananenud süntaks.
  • Mozilla Firefox 0.9 üles, Netscape 6 ja 7 (ei ole Netscape 5), ja Galeon on kõik XML-i tugi XSLT, CSS. Üldiselt, Firefox on võimsam kui MSIE, mis on parem, standardite järgimist.
    Mul on kasutaja aru, et Netscape 4.6 ja 4.8 toetab XML-i, kuid puudub sõltumatu kontroll.
  • Autorid endise MultiDoc Pro SGML brauser, CITECT (mille mootori kasutati ka Panorama ja muud brauserid) ühendanud jõud Mozilla toota multi-kõik brauseri DocZilla, mis lugesin, HTML, XML, SGML, XSLT, CSS style sheets). See jooksis all Windows ja Linux oli vabastada 1.0 ajal saadaval. See oli kaugel ambitsioonikas brauseri projekti toetas väga tugev markup-käsitsemise teadmised.

Vähem teavet, XML võimalusi, Mac OS X Safari brauser, mis põhineb KHTML mootor, mida kasutatakse Konqueroris. Konqueror ise ei tundu, et toetada XML või XSLT (vähemalt KDE all Fedora Core, näiteks), kuid Safari 1.3.2 (v312.6) OS 10.3 osalist toetust XML-i, kuid ei au välise DTD muudetud sisemine osa (tänu John Haynie-test).

Mike Brown kirjutab:

Mõiste “lugemas”, mis on peamiselt tingitud HTML semantika, jah. HTML-dokument, seal on osad teksti nimetatakse ankrud, mis on asetatud link, viited teistele dokumentidele, mis võivad olla kauged võrgus või faili süsteem. HTML-dokument, mis annab signaali, et veebibrauseri kohta, kuidas dokumenti tuleks kuvada või millist käitumist oodatakse brauseri, kui kasutaja on suhtlemine. HTML spetsifikatsioon pakub paljusid soovitused ja nõuded brauser, mis on spetsiifilised tähendused palju erinevaid näiteid markup, nagu asjaolu, et <img> elementi viitab pilti, mis tuleb laadida brauseri ja sulatatud inline kõrvalasuvate teksti.

Erinevalt HTML, XML on sellist omane semantika. Ei ole ettenähtud meetodit, muutes XML dokumente. Nii, mis see tähendab, et “browse”, et XML on tõlgendamise küsimus. Näiteks XML-dokument, milles kirjeldatakse omadustega masina osa ei kanna mingit teavet selle kohta, millist teavet tuleb esitada kasutaja. Rakendus on tasuta, kasuta andmeid, et luua pilt osa, luua vormindatud teksti loetletakse teave, kuvada XML-dokumendi xml ilus värvilahendus, või reorganiseerimiseks andmete formaati salvestamine andmebaasi, edastamine võrgu kaudu või sisendit, et mõne teise programmi.

Siiski, hoolimata sellest, et XML-dokumendid, ainult kirjeldus, andmed, failid, siis on võimalik, et “sirvi” need selles mõttes, muutes neid laaditabelid. Stiil leht on eraldiseisev dokument, mis näpunäiteid ja algoritmid muutes või muuta andmeid XML-dokument. HTML-kasutajad võib olla tuttav cascading style sheets (CSS). CSS style sheet keel on üldine ja piisavalt võimas suhtes, mis on XML dokumendid, kuigi see on suunatud suunas visuaalne renderdamine dokument ei võimalda keerukas töötlemine dokumendi andmed. Kokkusurumise XML dokument, mis on CSS laaditabelit, see on võimalik laadida XML dokument, mis on CSS-teadlik, brauserist ja brauseri võib anda mingi renderdamist, isegi kui brauseri igatahes ma ei tea, kuidas lugeda protsessi XML dokumente. Siiski, mitte kõik brauserid laeb XML-dokumendi õigesti, ei ole vaja tunda XML-märgistust, mis seob dokumendi laaditabelit, siis sa ei saa eeldada, et XML dokumente saab avada, vaid veebibrauser.

Keerulisem ja võimas stiililehe keel on XSLT, teisendused osa Extensible Stiililehe Keel, mida saab kasutada, et muuta XML muid formaate, sealhulgas HTML, muul kujul XML-vormingus või lihttekstina. Kui väljund on see ümberkujundamine on HTML-i, seda saab vaadata brauseri nagu mis tahes muu HTML-dokument.

Määral tuge XML, style sheets, veebibrauserites väga erinev. Kuigi laadimis-ja renderdamine XML-brauser, mõnel juhul on olemas võimalus, et see ei ole üldiselt toetanud. See on põhjus, miks palju XML-sisu veebis on tõlgitud HTML-i serveris. See on genereeritud HTML-brauser. Enamik Microsofti veebisaiti, näiteks, on olemas nagu XML-vormingus, mis teisendatakse HTML sõita. Brauser ei tea, mis vahe on.

Vaata märkused tarkvara autorite ja XML arendajatele, üksikasjalikku loetelu XML leheküljed SGML veebilehel http://xml.coverpages.org/.

2.7: Kuidas täita või joosta XML-faili?
Ole mõistlik küsimus. XML on andmete vormingut, ei ole programmeerimiskeel.

Ei, see ei ole. XML ise ei ole programmeerimiskeel, nii normaalne XML dokumendid ei ‘run” või “execute’. XML on markup specification language, XML failid on lihtsalt andmed: nad istuvad seal, kuni sa käivitada programmi, mis kuvab neid (näiteks veebilehitseja), või halba tööd nendega (nagu a converter, mis kirjutab andmete teises formaadis või andmebaasis, mis loeb andmeid), või muudab neid (nagu ka toimetaja).

Kui soovite vaadata või kuvamine XML-faili, avatud XML redaktorit või XML-brauser.

XSLT2, XSL:FO
Vesi on muddied asjaolu, et kõige populaarsem ümberkujundamise töötlemise keeles (XSLT2, XSL:FO) on tegelikult kirjutatud XML-süntaks, sest see on deklaratiivne, mitte menetlustähtajad. Need erijuhud, võib öelda, et ‘käivita’ XML-faili, töötab töötlemise rakendus nagu Saxon, kuhu on koondatud direktiivides määratud faile, Java bytecode optimeerijad, mis töötleb XML dokumente. Selles mõttes, saate võrrelda neid teiste programmeerimiskeelte, kuid see oleks võrrelda keel, ei ole XML-süntaks, mis see oli kirjutatud.

2.8: seal on muutus, SGML või HTML XML?
Ei, kui sa ei taha.

Ei, olemasolevad HTML-rakendusi, tarkvara jätkab koostööd olemasolevad failid. Nüüd väga vähe SGML vasakule, aga mis jätkab koostööd olemasoleva tarkvara. Aga nagu mis tahes tõhustatud rajatis, kui soovite vaadata või alla laadida ja kasutada XML-faile, siis on vaja kasutada XML-teadlik tarkvara. Palju rohkem on välja töötatud XML-i kui see kunagi oli, SGML, nii et peaaegu kõik praegused jõupingutused on keskendunud XML, XHTML, HTML5).

2.9: Kas ma saan kasutada XML-standard office i rakendusi?
Jah, kasuta MS-Office,Libre Office, Open Office, Open Office, WordPerfect, või teised.

Jah, kõige office tootlikkuse’ suites juba seda teha, ja seejärel salvestage dokument, mille style sheets, pildid, jne, Zip faili:

  • Libre Office, OpenOffice, NeoOffice (Mac), et salvestada failid XML vaikimisi aastaid (.odt, .osoonikihti kahandavad ained .odp-faili tüüp kõik Zip-failid). Pakendid on sisuliselt variant, rakendused, OpenOffice sisaldab tekstitöötlus -, arvutustabel, esitlus tarkvara, vektor, joonistus programmi, ja nad jagavad seotud Skeeme. Office Document Format (ODF) oli esimene ametlik Rahvusvaheline Standard (ISO/IEC 26300) office ‘ i dokumente. Kõiki neid saab lugeda ja kirjutada Microsoft Office ‘ i faile.
  • Corel WordPerfect suite tarnitud täieõiguslik XML editor aastaid (mis ei ole ka täielik SGML). Saate salvestada vormingus väljundi, nagu Microsoft Word .doc fail, kuid ei kasuta oma stiililehe tehnoloogia formaadis dokumente, ei XSLT2 või CSS. See on ka säästa oma (WordPerfect) dokumendi vormingut XML esindus.
  • Kui AbiWord sõna protsessor (kõik platvormid), avada ja redigeerida Wordi, OpenOffice dokument, kuid see võib ka salvestada neid DocBook XML või LATEKS-vormingus (kuigi see ei anna native XML toimetamine), mis teeb sellest suurepärase converter.
  • Microsoft Office 2003 tingimusel “Salvesta As…XML” kõik osad suite välja arvatud juhul, Powerpoint, kasutades sõna ml, mis esindavad väljanägemist dokument, kuigi see on vajalik, et säilitada stiilis nimed, kui neid kasutada.
    Office 2007, 2010, ja hiljem kõik save as native XML-dokumendid (.docx, .xlsx,.txt faili tüüpi, mis on Zip-failid). Kasutage Office Open XML (OOXML, sarnaseid, kuid mitteseotud sõna ml), mis on Microsofti samaväärne ODF. See on paralleelne ISO standardile.
    Word 2003 tarnitud tõeline XML editor, toetades teiste W3C Schemas samuti oma (kuid mitte Dtds), samuti on sätestatud meetodit, mille siduv element tüüpi Sõna nimega stiile (nagu Microsofti varem toote SGML Autor Sõna).
  • Vältida Microsofti “teosed” pakett, kui see on vastuolus XML, ja kõiki muid Office i tarkvara.
  • Puuduvad andmed Lotus office i tooteid.

Täpsemalt jaotises XML-i failivormingutes Office Dokumentide XML-kaas lehekülgi, mis kirjeldab lühidalt ja punktid, täiendav teave: GNOME Office, KOffice, Microsoft XDocs, OASIS TC for Open Office XML Faili Formaat 1DOK.org Projekti OpenOffice.org XML-Vormingus.

Jagu 3 : Autorite

3.1: mul on vaja teada HTML-i või SGML enne kui ma teada XML?
Ei, kuid kasulik.

Sa ei vaja mingeid eelteadmisi, aga kasulik, sest palju XML-mõistete, terminoloogia, praktika läbi kahe aastakümne kogemus SGML (süsteemid, mis oli enne seda).

Olema teadlik, et teades, et HTML ei ole sama, mis “mõista XML”. Kuigi HTML oli kirjutatud kui SGML taotluse, brauserid ignoreerida seda kõige rohkem (mis on, miks nii paljud kasulikud asjad ei tööta), siis lihtsalt sellepärast, et me ei tee midagi teatud viisil HTML-brauseritega, ei tähenda, et sobiva SGML või XML.

Kõige praktilistel eesmärkidel te ei vaja mingeid teadmisi SGML või HTML: ainult siis, kui te kavatsete delving arvesse sisekontrolli dokumendi liik.

3.2: Kuidas XML-käepide white-space dokumendid?
Ąvé hoida. See on kohaldamise otsustada, mida teha temaga.

Kõik valge-ruumi, sealhulgas linebreaks (Mac CR, Win CR/LF, Unix LF), TAB märke, nagu ka füüsiline kaart, ja mõningaid struktuurseid elemente, kui puudub tekst ei ilmu, surnud parser muutmata kujul taotlus (brauser, vormindamistööriista, viewer, teisendi, jne.). Analüüsi määratakse kindlaks, millises kontekstis white-space (elemendi sisu, iseloomu andmete sisu või segatud sisu), kui see teave on kättesaadav, nt, DTD või Schema. See tähendab, et avaldus on kohustus otsustada, mida teha sellise koha, mitte analüütik.

See on üks väheseid radikaalseid muutusi SGML, kus kõik valge-ruumi ja sisu visata parser, enne sulgemist taotluse. Miks? järgnev on põhjus, miks.

On kaks erinevat tüüpi:

  • tähtsusetu valge ruumi (kerge vabaneda white-space), mis tekib vahel struktuursed elemendid element sisu. See on ruum, mis tekib, kui ainult teised elemendid on lubatud, kui tekstis ei esine. See on tavaliselt automaatselt, kui toimetaja või käsitsi, lepingu, et aidata visuaalne selgus märgise, sageli midagi pistmist kaugus näete, kui dokument on töödeldud või vormindatud. XML, ja see koht saab olema läbinud taotlusele (SGML on pressitud, nii et kõik lisaruumi vana-stiilis HTML-dokumente ja ei muretse);
  • oluline white-space, mis toimub sees elemente, mis võivad sisaldada ainult teksti (märk andmete sisu, nagu HTML jaotis) või text ja markup segatud (nt, punktid). XML-i, see on koht teie jaoks, app on täpselt nagu SGML.

Mõlemal juhul, kui rakendus on töö juhtimiseks ruumi õigesti (XSLT2, näiteks, on riba-ruumi korraldus kindlaks määrata, kuidas hakkama). Analüüs on seetõttu, et teavitada taotluse, et white-space juhtus element sisaldus, kui see on avastatud, tuleb hävitada. (Kasutajad SGML on tunnistada, et see teave ei ole ESIS, kuid Grove.)

Eespool toodud näide, taotluse saab päris-trükkimine linebreaks, klapid, ruumide elementide vahel, samuti nende varjatud peatüki pealkiri. Seda funktsiooni rakenduse ei analüüsi, et otsustada, mis tüüpi valge tühikut tilk, mida säilitada. Paljud XML rakendused konfigureerida seaded programmeerijad või kasutajatele on õigus kontrollida, kuidas selline valge-space käitlemine.

Peter Flynn kirjutab:

Miks?
Selles SGML, DTD on kohustuslik, nagu alati. A analüüsi, seega sa alati tead juba ette, et white-space juhtus element sisu (ja seega peab olema eemaldatud) või segatud sisu või laadi andmete (mis tuleb säilitada). XML võimaldab töötlemine ilma DTD või Schema, kus saab öelda, kas ruumi peaks olema kõrvaldatud või mitte, siis üldine reegel kehtib kõigi white-space tuleb esitada taotlus.

3.3: Millist osa XML-dokument on tõstutundlik?
Kõik, nii märgistus ja teksti.

Iga XML-dokument on tõstutundlik. See on oluliselt erinev sellest, HTML-i ja kõige muu SGML rakendustes, kus vaikimisi oli ignoreerida juhul. See võimaldas, märgistus mitte-ladina-tähestiku keeles, et vältida probleeme juhul-tagaistme kirjalikult süsteemid, mis on oma olemuselt kinnitas mulle.

  • Elemendi tüüp nimed on tõstutundlikud: peate järgima mis iganes kombinatsioon ülemine – või alumine-juhul, kui soovite kasutada määratleda need (või esimest kasutamist või DTD-ga või Schema). Nii et ei saa öelda, <BODY>…</body>: ülem – ja alam-juhul peavad vastama; seega <Img/>, <IMG/>, <img/> on kolme erinevat tüüpi elemente;
  • Hästi moodustunud XML dokumendid DTD, esimene esinemine elemendi tüübi nimi määratleb korpus;
  • Atribuutide nimed on ka suur-ja väiketähti, näiteks kahe laius atribuute <PIC width=”7in”/> <PIC WIDTH=”6in”/> (kui sama fail) on eraldi atribuudid, sest muul juhul, laius WIDTH;
  • Atribuudi väärtused on ka suur-ja väiketähti. CDATA väärtused (nt xlink:href=”MyFile.SGML”) alati on olnud, kuid NIMI tüüpi (ID, IDREF atribuute ja token nimekirja atribuudid) on nüüd suur-ja väiketähti liiga;
  • Kõik üld-ja parameeter üksus, nimed (eg &Aacute;) andmete sisu (teksti), on tõstutundlik, nagu alati.

3.4: Kuidas ma saan muuta andmed XML formaadis?
Kirjutage, või kasutada converter keel, mida mõistab XML

Kui allikas faili formaat on midagi ühtne, äratuntav struktuur, isegi lihtne joon -või puruneb vahekaugus on tavaliselt võimalik kirjutada mustri sobitamine rutiini, palju keeles isoleerida teavet selliste proovide väljund selle kategooria ümber.

XSLT2 on muster-sobitamine süntaks teeme täpselt, teistele töötlejatele, nagu Omnimark pakuvad sarnaseid teenuseid. Konverteerimist võivad luua ka ajutine “pooleldi” vormingus, mis on teise ümberkujundamise kasutatakse, et luua lõplik XML-vormingus.

Kui teie allikas faile teada formaati (CSV, näiteks), siis võib olemasolevate rutiin saab alla laadida või osta mis võib luua XML-vormingus. Teise XML-XML conversion saab kasutada, et luua lõplik vorm nõutav.

Andmebaasi haldamise süsteemi sisseehitatud “eksport-XML” rutiinne, mille saate luua sarnane “pooleldi” vormingus ning hilisema muutmise (vt Kuidas ma saan XML sisse või andmebaasi? üks näide).

Kui andmed on täiesti vormindamata või halvasti, või ebajärjekindlalt vormindatud, et automatiseeritud muutmine on võimatu, tuleb muuta käsitsi XML-vormingus. Sõna protsessor dokumendid on klassikaline näide. On ettevõtteid, mis on spetsialiseerunud seda tüüpi töö, eriti vaikse ookeani ümber Velje, kes on aastakümnete pikkune kogemus, mis tegelevad igasuguste imelik, imeline vorm, et saada täielik XML tagasi.

Kahes vormingus tihti küsitakse, allikas paremini toetatud:

LATEX

Hästi formuleeritud LATEX dokumendid (need, kes ei kasuta homebrew makrod, eriti need, kasutades lihtsaid TEX või vananenud käsud) võib moodustada, kasutades TEX4ht pakett. Kirjutamise ajal (2015) see ei ole toetatud, kuna varane surm autor, kuid täiesti töökorras.

TEX4ht saab teisendada HTML ja ODF (OpenOffice ‘i formaadis) erinevatel viisidel, nii et tulemuseks faili saab avada OpenOffice’ i ja salvestatud .docx faili. Seal on käsurea valikud, et oowriter programmi (või lowriter kui Libre Office), mis võimaldab kirjutada mass muutmine.

Muud valikud on saadaval üksikud toimetajad ja online teenuste (nt blogid, foorumid, mis toetab LATEX vormindamine veebilehe). Neid saab kasutada ka muutmist.

Microsoft Word

Word (.docx) fail on Zip fail, mis sisaldab XML-dokumentide ja nendega seotud pildid ja stiili lehed. Vaikimisi Wordi dokumente, lihtsalt lõikes (w:p elemendid). Metaandmed dokumendi struktuuri on ette nähtud fondi, kaugus teavet, mida saab usaldusväärselt tõlgendada mees punkt muutmine on väga raske.

Aga, kui nime stiile (sisseehitatud stiilis menüü, või autori loodud) kasutatakse järjepidevalt, see on võimalik kirjutada XSLT2 skripti, et see sobiks neile, nii väljund-to-use XML-märgistust.

Mõned toimetajad ( XMLMind, AbiWord) ja muud süsteemid pakuvad muutmise Sõna, nii puhtalt visuaalne (HTML-vormingus, imiteerib välimus originaal, ‘semantilise sõnavara nagu DocBook või DITA, vormindamine.

Kui XSLT2 marsruut kehtib ka OpenOffice/LibreOffice, mis on ka salvestatud XML i Zip-faili. Märgistus on erinev, kuid saab ümber, samal joonel.

3.5: Kuidas saab olemasolevat HTML faile töö XML?
Või panna neid XHTML/HTML5, või kasutada erinevaid dokumendi liik.

Või teisendada vastavaks uue dokumendi liik (koos või ilma DTD või Schema) ja kirjutage stiililehe minna nendega; või neid muuta ei vasta XHTML või HTML5.

Teil võib tekkida vajadus muuta olemasolevat HTML XML failid, sest see ei võimalda lõppu-tag minimeerimine (puuduvad </p> jne.), noteerimata atribuudi väärtused, nagu ka mitmed teised SGML otseteed, mis on tavaliselt kasutatakse HTML. Paljud HTML-authoring tools juba toota peaaegu (aga mitte päris) hästi arenenud XML, peame tagama, et lõpp-silte kasutatakse, on atribuudi väärtused on noteeritud, jne. — aga paljud ei ole.

Sul võib olla võimalik teisendada HTML, XHTML, kasutades Dave Ragger HTML Korralik programmi (HTML5 versioon ka olemas), mis on puhta jube jama pseudo-markup jäänud ebapiisav HTML toimetajad, ja isegi eraldi mõned vormindamist, et laaditabelit, kuid tavaliselt on ikka veel mõnede käsitsi muutmine.

Kõige kaasaegne website design programmid, sealhulgas DreamWeaver, ikka ei tooda midagi, kui hästi vormindatud HTML, suures osas, sest nende eesmärk on, et lehti vaadata, selle asemel, et nimetamist. Veebilehe disain programm, HTML-lehed, ainult hoidla teave on ohtlik, kulukas viga. Kui teile töö tagasi, aga, et info disain õigus XML-esimene, ja siis eksportiva lehe disaini välja website design programmi on ilmselt vähem oluline, et HTML on jama, sest brauserid on väga andestav.

Konverteeriva kehtiv HTML, XHTML

Kui HTML failid on kehtiv (täielik ametlik kinnitamine kasutades SGML analüüsi vastu avaldatud Dtds, mitte lihtsalt süntaksi kontroll), siis proovige, et kinnitada neile, XHTML koos XML-parser. Kui teil on olnud luua puhas HTML ilma varjatud vormindamine siis see protsess peaks öökima ainult mittevastavusi ülemine suur-element, atribuut nimed, ja elemendid, nagu img, pluss mitte-standard elemendi tüüp nimed, kui te neid kasutada. Lihtne käsitsi toimetamine või lühike skript peaks olema piisav, et kõik need muudatused.

Kui teie HTML seaduslikult kasutab lõppu-tag tegevusetuse ja noteerimata atribuudi väärtused, see võib olla fikseeritud automaatselt normaliseerimine programmi nagu sgmlnorm (alates OpenSP pakett, mis on osa OpenJade), või sgml-normaliseerida funktsiooni toimetaja, nagu Emacs/psgml (ärge pange maha nimed, nii XML).

Kui teil on palju kehti HTML-faile, kirjutada skript, programmeerimise keel, mis mõistab SGML märgistust (näiteks Omnimark, SGMLC, või üks populaarsemaid skripti keelte (nt Perl, Python, Tcl jne.), kasutada SGML/XML-raamatukogud); või isegi kasuta toimetaja makrod, kui sa tead, mida sa teed.

Kui HTML on vigane või vale, proovige HTML Tidy programm eespool. Kui see ei lahenda neid, ma kardan, et sa pead kirjutama midagi erilist, kasutades allpool kirjeldatud menetlust, või käsitsi redigeerimise või kopeeri-ja-aseta veebilehitsejat.

Konverteeriva uue dokumendi liik

Kui sa tahad liikuda failid HTML eri DTD kokku, palju native XML-Dtd-tööstus-ja modular XML versioonide populaarne Dtds nagu TEI (kirjandus, ajaloo-ja keelelise dokumendid) ja DocBook (arvuti dokumentatsiooni) või DITA (tehniline dokumentatsioon) valida. Seal olid eri kohtades, võta uus XML Dtds, aga see on teine kirjutada harva.

Saab muidugi lihtsalt minu enda märgistus: nii kaua, kui see on mõistlik luua hästi arenenud faili, siis peaks olema võimalik kirjutada CSS või XSLT stiililehe dokument kuvatakse brauseris.

Konverteeriva vigane HTML-hästi arenenud, XHTML

Kui teie failid on vigased HTML (95% Internetis) saab teisendada hästi arenenud DTDless failid järgmiselt:

  1. asendada DOCTYPE deklaratsiooni XML-deklaratsiooni <?xml version=”1.0″ encoding=”UTF-8″?> (või kasuta sobiv märkide kodeering).
  2. Kui ei ole DOCTYPE deklaratsiooni, ainult ees XML-i deklaratsiooni. Kas nii, XML-deklaratsiooni, kui sa kasutada seda liini 1 dokumendi.
  3. Muuta TÜHJAD elemendid (nt igal BAAS, ISINDEX, LINK, META, järgmise sa pane päises ja igas VALDKONNAS, ATOPARA, AUDIOSCOPE, BASEFONT, BR, VALIDA, KOLONEL, RAAM, kõrge esindaja, IMG, KEYGEN, VASAKULE, piirata, tekst,, ÜLE, SÄTTE, PAREMALE, SPACER, SPOT, TAB, keha dokument), nii et lõpuks /> näiteks <img src=”mypic.gif” alt=”Pilt”/>;
  4. Iga kirje tüüp, atribuutide nimed, nimed väiketähti;
    Veenduge, et olete õigesti sobitatud selgesõnalise lõppu-sildid kõik mitte-
  5. TÜHJAD elemendid; eg iga <para> peab olema </para> jne.;
  6. Escape kõik <, & mitte-märgistust (ie sõnasõnaline tekst) tegelased nagu &lt; või &amp; ja (ei tohtinud olla midagi isoleeritud < märki, et alustada, muide!);
  7. Tagada, et kõik atribuutide väärtused on otsitavad hinnapakkumisi (väärtused on varjatud tsitaadid peavad olema jutumärkides, või vastupidi, kui teil on vaja mõlemad, kasuta &quot; märk üksus, viitenumber);
  8. Tagada, et kõik skripti uri-sid, mis on ja kui väli eraldaja muutunud kasuta &amp; või semikooloni asemel.
  9. Veenduge, et skripte (nt Javascript), mis on < ja & märgid (matemaatiline vähem kui testid, tõeväärtus, Loogiline JA tingimisi) või konkreetsete CDATA Märgitud Lõigud, või (kui brauser töötlejad aktsepteeri neid) muutunud kasuta &lt; või &amp; või semikoolon, vastavalt.

Olema teadlik, et aegunud HTML brauser ei aktsepteeri XML-stiilis TÜHI elemente, millel on tagumisel kärpida, nii et eespool nimetatud muudatused ei tohi olla tahapoole ühilduvad. Teine võimalus on lisada näiv lõppu-silt, et kõik TÜHJAD elemendid, nii <img src=”foo.gif”/> <img src=”foo.gif”></img>. See on kehtiv XML, kuid sa pead olema võimeline tagama, et keegi ei pane mingit teksti sisu sees neid elemente. Tühiku enne sulgemist slash TÜHJAD elemendid (nt <img src=”foo.gif” />) võib ka loll vanemate brauseritega nõustuda XHTML HTML-i.

Kui vastasite Jah, sellele küsimusele Nimekirja kehtetu HTML alusel, et säästa ennast palju leina, määrates nende probleemide esimene, enne kui keegi teine. Ilmselt juba väga lähedal, millel on hästi arenenud faile.

Vastavusmärgis, mis on syntactically õige, kuid semantiliselt mõttetu või kehtetu, tuleks muuta enne konversiooni. Näiteid vale pikivahe, seadmed, nagu korduvalt tühi punktid või linebreaks, tühjad tabelid, nähtamatu kaugus gif-id jne. XML kasutab style sheets, CSS3 tähendab, et sa ei vaja neid.

Kahjuks, seal on palju tööd teha, kui failid on vigased: see on põhjus, miks paljud Webmasters nüüd nõudma, et ainult kehtivaid või ka-tekkis-faile kasutatakse (et miks sa pead tegema disainerid sama tegema), et vältida asjatut käsitsi, hooldus-ja ümberõppe kulud hiljem.

Meelespea kehtetu HTML

Kui teie HTML-faile ei kuulu sellesse kategooriasse (HTML loodud kõige WYSIWYG-redaktorid on tavaliselt vigane), siis kindlasti peab olema ümber käsitsi, kuigi juhul, kui kahjustused on regulaarselt ja hoolikalt ehitatud, failid on tõepoolest peaaegu hästi arenenud kirjutada programmi või skripti teha, nagu eespool kirjeldatud. Veider asi, mida võib vaadata sisaldama järgmist:

  • Failid sisaldavad xml süntaksi vigu? Näiteks, kas on olemas mõni puuduv nurk sulgudesse längkriipsud selle asemel, et edasi lõikamine lõppu-sildid, või elemendid, mis pesitseb valesti (nt <B>alates <I>sees üks element</B>, kuid lõppeb väljaspool</I>)?
  • On olemas elemendid puuduvad lõppu-sildid, et ei saa järeldada, (pl) sgmlnorm?
  • Seal on URI (nt href või srcs), mis on Microsoft Windowsi stiilis längkriipsud selle asemel, et normaalse edasi lõigatud?
  • Failid sisaldavad markup, mis on vastuolus HTML Dtds, nagu pealkirjad või nimekirjade sees punktid, loendiüksusi väljaspool loetelu keskkondades, header, elemendid, nagu base enne esimest html, jne? (teise lohakas toimetaja trikk)
  • Failide kasutamine kujuteldava elemendid, mis ei ole kõigile teada DTD HTML? (suur osa neist on kasutanud oma markup süsteemide masquerading nagu HTML). Kuigi see on lihtne muuta, et DTDless hästi arenenud faili (sest teil ei ole vaja kindlaks määrata elementide eelnevalt), omanik või brauseri-konkreetsed laiendid ei ole kunagi ametlikult määratletud, nii et see on sageli võimatu, et töötada välja sisuliselt kui elemendi tüüpe saab kasutada.
  • On olemas kehtetu (mitte XML-märgid) failid? Otsima eriti native Apple Mac Rooma-8 märki, mille hooletu disainerid; mis tahes ebaseadusliku Windows märgid (32 tähemärki koma kood 128-159 kaasa arvatud) on lisatud, mis on Microsofti toimetaja; ASCII kontrollida tähemärki 0-31 (v.a need, mis lubatud, nagu TAB, CR, LF). Need tuleb ümber õige tähemärki UTF-8 (või muuks otstarbeks).
    Failid sisaldavad kehtetu (vana Mosaiik/Netscape-style) kommentaare? Kommentaarid on vaja vaadata

    <!-- like this -->

    topelt rida kummaski otsas, ja ei ole muud kahe (eriti mitte mitu) read.

3.6: Kuidas teisendada XML teiste failivorminguid?
Kirjutada konversiooni keeles, saate aru, XML

Kuigi see võib olla, et kirjutada konverteerimise rutiin leiutas oma XML-i parser ei ole soovitatav, välja arvatud juhul, kui harjutus on mõeldud õpilastele andmetöötlus. Kõigis peamistes keeltes XML-raamatukogude teha kõik raske tõste-analüüs (kinnitamine, kui see on vajalik).

Sa peaksid teadma, mida XML-dokumendi enne alustamist: ei ole võlukepp, mis automaatselt järeldada, mida asjad tähendavad, kus fail asub. Kui olete teinud mõned XML-failid nullist, siis on vaja leida looja, või dokumentatsiooni neid. Esimese 2-3 read faili võib aimugi, millist tüüpi XML-i. Sa peaaegu kindlasti on koopia DTD või Skeemi, mille fail on loodud.

Programmitöö valikud on järgmised:

  • Kasutada keele mõeldud ülesanne. XSLT2 võimalused käitlemise XML ehitatud algusest, eraldi protsessor on saadaval kõik platvormid. Paljud XML-toimetajad on koopia XSLT (2, loodetavasti) ehitatud, nii et nad pakuvad integreeritud arengu keskkonna muutmine, ümberkorraldamine. XSLT2 ümberkujundamise joosta jooksul server paketi, nagu Apache Cocoon.
  • Kasutada XML-töötlemise või pipelined operatsiooni pakett. Need on (tavaliselt) kaubanduslikke tooteid, mis on ulatuslik dokument, haldamine, dokumentide andmebaasi, dokumendi muutmine, redigeerimise funktsioonid, see on tihti osa palju suurema ettevõtte teave lahendus, XSLT2 või oma in-house süsteemid. Kaks kõige populaarsem neist, MarkLogic, OmniMark.
  • Kasutada traditsiooniline compilable keeles. Java või C (või üks paljudest versioonidest) oleks ühine; Pascal, FORTRAN, või COBOL on harvad need päevad, aga XML-raamatukogud on olemas nende jaoks). PÕHILINE, keegi?
  • Kasutades skriptimise keelt. Perl, Python, Tcl, VBscript, või isegi Powershelli kõik populaarsed XML-raamatukogud, ka neile; Python on ka hea maine.
  • Koos XML-utilities standard kest. Siin on varajane näide XML-või CSV-rutiinne, mis kasutab onsgmls ESIS, awk, vormindada. Sarnased protsessid, välja LTXML2 toolkit.
  • On allalaaditav (mõnikord tasuta) programme, väites, et “lihtne” on XML-muundurid. Toimetaja sooviks kuulda soovitusi või hoiatusi

Protsessi konverteeriva XML muud formaadid on mõnikord viidatud kui alla-ümber”, sest see võib tähendada vältimatu teabe kadu (tavaliselt metaandmed) kui eesmärk formaat lihtsalt ei esinda.

3.7: Kui XML on lihtsalt osa SGML, kas võin kasutada olemasolevaid SGML-vahendid?
Jah, kui nad on kuni kuupäeva

Jah, kui sul kasutada up-to-date SGML tarkvara, mis teab WebSGML Kohandused, TC, ISO 8879 (funktsioone, mida on vaja, et toetada XML, nagu versioon vormis TÜHJAD elemendid; mõned aspektid SGML Deklaratsiooni, nagu NAMECASE üldine NR; mitu atribuuti token nimekirja, deklaratsioonid jne.).

Teine võimalus on, et SGML DTD lase sul luua täielikult normaliseeritud SGML-faili, kuid üks, mis ei kasuta tühjad elemendid; ja seejärel eemaldada DocType deklaratsiooni, nii et see muutub hästi arenenud DTDless XML-faili. Kõige SGML tööriistu nüüd hakkama XML-failid, siis tuleb täpsustada, võimalus vahetada kahe standarditele. (vt näpunäited, Mida XML tarkvara on olemas?).

Kui väga erilised põhjused, ilmselt plaanis võtta SGML-XML niikuinii.

3.8: ma olen harjunud autor, esitluse HTML. Ma tean, et XML-lihtsalt?
Jah

Väga lihtne, kuid isegi pärast ligi 20 aastat on veel vaja rohkem õpetused, lihtsamad tööriistad, rohkem avatud näiteid XML dokumente. “Hästi vormitud’ XML-dokumentides võib tunduda HTML, välja arvatud väike, aga väga oluline punkti süntaks.

Suur praktiline erinevus on see, et XML-järgida reegleid. HTML brauserid võimaldavad teil teenida neid isegi surmavalt katki või naeruväärselt korrumpeerunud HTML-i, kuna see ei ole ametlik analüüs, kuid ainult elid purunenud bitti asemel. XML-failid peaks olema täiesti õige, või lihtsalt ei tööta. Üks lahendamata probleem on see, et mõned brauserid, väites, XML nõuetele vastavus on ka katki, mõned brauserid toetama XSLT töötlemine, CSS stiil on ikka kahtlane paremini. Proovige sinu nimekirjas tõeline hotel veebilehtedele.

3.9: XML kasutada mitte ladina tähtedega?
Jah, see on vaikimisi

Jah, XML Spetsifikatsioon ütleb selgesõnaliselt XML kasutab ISO 10646, rahvusvaheline standard, iseloomu repertuaari, mis hõlmab enamiku tuntud keeled. Unicode on identne repertuaar ning kaks standardeid jälgida teineteist. Spec ütleb (2.2): “Kõik XML-protsessorid peab aktsepteerima UTF-8, UTF-16 kodeeringus ISO 10646…”. Seal on Unicode-KKK http://www.unicode.org/faq/ näide arvukad tähed, sümbolid, http://www.cogsci.ed.ac.uk/~richard/unicode-sample-3-2.html.

Kuigi XML-tarkvara võimaldab teil sisestada mis tahes Unicode ‘ i märk dokumenti, lugejad, lihtsalt tegelased, kui arvuti on sobiv font! Mitte kõik fondid, font faile täielikult Unicode i repertuaaris (need, mis on suur).

UTF-8 kodeeringus Unicode-i 8-bitised sümbolid: esimene 128 on sama, ASCII, ning kõrg, et tegelased on kodeerimiseks kasutatakse teiste Unicode i seeria vahel 2 ja 6 baiti. Kui UTF-8 iga-kaheksa kujul, mis on seega sama, mis ISO 646 IRV (ASCII), nii et saate jätkata ASCII inglise või muus keeles kasutades ladina tähestikku ilma eristada (kaunistamiseks). Pane tähele, et UTF-8 on vastuolus ISO-8859-1 (ISO-Latin-1) pärast koodi punkti 127 koma (lõpus on ASCII).

UTF-16 Unicode i kodeering 16-bitised sümbolid, mis võimaldab esindada 16 masinad. UTF-16 on vastuolus ASCII, sest ta kasutab kaks 8-bitist baiti / märki (neli baiti ülevalt U+FFFF).

Peter Flynn kirjutab:

Kodeering spetsifikatsioon võib viidata mis tahes märgistik, kui teie tarkvara toetab, aga XML-Spetsifikatsioon nõuab üksnes, et taotlusi toetuse UTF-8, UTF-16. Mõned ühise kodeeringuid toetab tarkvara sisaldab:

US-ASCII
Tegelased TAB, LF, CR, ruum ja trükimärke 33 126 (koma), ainult (kõik muud kontrolli tegelased on keelatud XML).

ISO-8859-1
(Lääne-Euroopa ja ladina-1) ASCII pluss koodid 128 kuni 255 (koma). Hõlmab enamiku (kuid mitte kõigi) lääne-Euroopa silbis.

ISO-8859-2 15
Need teised lennukid ISO-8859 katta ülejäänud ja erinevaid ladina-põhine tähestiku, ning muud sümbolid.

“Selle transformatsiooni” ülejäänud on aegunud varud
Mõned programmid võivad toetada ka erinevad vananenud ‘selle transformatsiooni, nagu näiteks IBM-850, Microsoft Windows-1252, Apple Macintosh Roman-8, DEC Multinational muud non standard kodeeringut, kuid need on tavaliselt mitte kaasaskantavad, ja seda tuleks vältida, kui võimalik.

Levinud lääne-Euroopas kasutada ISO-8859-1, nii et enamus ühise silbis saab kasutada ühe baidi ja iseloomu üksuse viiteid või numbriline üksuste kõikide teiste tähtedega. See on eelis, et selliseid faile saab avada peaaegu iga-baidised toimetaja. Puuduseks on, et numbriline üksused ei meeldetuletus, iseloomu üksused peavad olema deklareeritud DTD või sisemine osa, aga kui see on haruldane, ei pruugi see olla tõsine probleem.

Bertilo Wennergren kirjutab:

UTF-16 on kodeering, mis esindab iga Unicode i märk, esimesel tasapinnal (esimene 64 märk) Unicode on 16-bitine unit tegelikkuses kaks baiti iga märk. Nii on tahapoole ühilduvad, kas ASCII või Latin-1. UTF-16 saab kasutada ka täiendavalt 1 miljon tähemärki mehhanismi tuntakse surrogaat paari (kaks 16-bitist ühikut iga märk).

“…mehhanisme, signalisatsioon, millest kaks on kasutusel, ja et teised kodeeringud mängu, [ … ] arutelu märkide kodeering”. XML Spetsifikatsioon kirjeldab, kuidas määrata oma XML-fail, mis on kodeeritud märgistik, mida sa kasutad.

Sest olenemata konkreetsest kodeering, mida kasutatakse, iga märk ISO 10646 märgistik võib nimetatud koma või kuueteistkümnendsüsteemis samaväärse natuke string,’:, seega pole vahet mis märk määrata teile isiklikult kasutada, ja alati lugeda üksikute märkide mujalt kodeeritud repertuaari kasutades &#dddd; (kümnendkoha märgi kood) või &#xHHHH; (kuueteistkümnendsüsteemis märk, kood, algustähega). Terminoloogia võib olla segane, kuna numbrid: vt ISO 10646 Mõiste Sõnastik. Rick Jelliffe on XML-ise ISO iseloomu üksus seab. Mike Brown informatsiooni kodeerimine http://skew.org/xml/tutorial/ see on väga kasulik selgitus vajadust õige kodeering. Seal on suurepärane veebipõhine andmebaas, märgid, märgid palju kodeeringud, eesti Keele Instituut server http://www.eki.ee/letter/.

3.10: Mis on DTD, kus ma saan seda?
Kirjeldus dokumendi struktuuri. Ma võin kirjutada, või alla laadida.

DTD on kirjeldus XML-deklaratsiooni süntaks teatud tüüpi või klassi dokument. Kindlaks määrata, millised nimed kasutada eri tüüpi objekte, kus sa võib-olla, kuidas nad kokku sobivad.  Schema on sama asi XML-Dokumendi Süntaksi, nii et seda on võimalik lugeda XML-dokumendi; Quot võimaldab ulatuslikumat andmed-kirjutades.

Näiteks, kui sa tahad olla liiki dokumendiga, et oleks võimalik kirjeldada Loetelu, milles on esemed, vastav osa oma DTD võib sisaldada midagi sellist:

<!ELEMENT List (Item)+> 
<!ELEMENT Item (#PCDATA)> 

See määrab loendi element, tüüp, mis sisaldavad ühte või mitut elementi (plussmärk); ja määrab elemente, nagu näiteks element tüüpi, ainult teksti (Sõelutud Iseloomu Andmete või PCDATA). Valideerijad loe DTD, enne kui nad lugeda dokumendi teada, kus iga elemendi tüüp peaks tulema, mida nad sisaldavad, kuidas iga seotud muud, rakendused, mida pead teadma, see eelnevalt (protsessorid, brauserid, toimetajad, otsingumootorid, navigators, ja andmebaasid), saab seada endale korralikult. Eespool toodud näide aitab teil luua, nagu see:

<List>
  <Item>Chocolate</Item>
  <Item>Music</Item>
  <Item>Surfing</Item>
</List> 

Nagu selgitas, Et see ei ole XML-käepide white-space dokumendid?, treppimise näites on ainult loetavuse muutmise ajal: te ei pea XML-i. Lihtsalt kirjutatud nii:

<List><Item>Chocolate</Item><Item>Music</Item><Item>Surfing</Item></List>

A DTD seega pakub rakendused, ette teate, millised nimed ja struktuure saab kasutada konkreetse dokumendi tüüp. Kasutada DTD, mille kinnitamisel toimetaja tähendab, et saate olla kindel, et dokumente, mis on antud tüübi ehitatakse ja nimega järjekindlalt, vastab viisil.

A Dtd ei ole vaja töötlemine hästi arenenud dokumendid, kuid see on vajalik, kui sa tahad ära XML on eriline omadus tüüpi nagu sisseehitatud ID/IDREF cross-reference mehhanism; või kasutada vaikimisi määratud atribuutide väärtused; või viited välisele, mitte-XML-failid (“Märkused”), näiteks pilte, või kui sa lihtsalt tahad, et kontrollida dokumendi kehtivust enne töötlemist.

Tuhanded DTD juba olemas erinevates valdkondades (vt SGML/XML kaas lehekülgi indeks). Palju neid saab alla laadida ja kasutada vabalt, kuid on piiratud teatud tegevusalade või kaitstud; aga sa võid ka kirjutada oma (vt küsimus, luua oma DTD. Vana SGML Dtds tuleb ümber XML kasutada XML-süsteemid: loe küsimus ümberarvestamiseks SGML DTD XML; kuid kõige populaarsem SGML DTD on juba olemas XML kujul.

Natuke XML toimetamine, kasutades koostatud binaarne formaat DTD toodetud oma juhtimise rutiin võimaldab luua ühe isiku, organisatsiooni eest vastutavad muudatused, levitada ainult unmodifiable (binaarne koostatud) versiooni kasutajatele.

Alternatiivide a DTD erinevad vormid  Schema. Need pakuvad laiaulatuslikumat kinnitamise funktsioone kui DTD, sealhulgas iseloomu andmete sisu kinnitamist.

3.11: XML-las ma moodustavad oma kategooria?
Jah, kuid nad ei ole nn kategoorias. Nad element tüüpi.

XML võimaldab nimi oma toote tüübid. Kui te arvate, etiketid, elemendid on sama, mis on juba tõsine probleem: lugege ülejäänud seda küsimust põhjalikult.

Sama kehtib, kui olete mõelnud nii “väljad” (vt Kuidas ma saan XML sisse või andmebaasi?). Vale paradigma, vale keel.

Bob DuCharme kirjutab:

Ärge ajage mõiste “tag” mõistega “element”. Ei ole asendatav. Element sisaldab tavaliselt kaks eri tüüpi liikmeid: start-tag-ja lõpp-tag, teksti või rohkem markup nende vahel.

XML-i, et otsustada, elemendid, mida soovite dokumenti ja näitavad element piirid, kasutades asjakohaseid algus ja lõpp-silte neid objekte. Kõik !ELEMENT… deklaratsioon määratleb tüüpi element kasutamiseks mõeldud dokument, mis vastab DTD. Me nimetame seda tüüpi element on element tüüp”. Just nagu DTD HTML sisaldab H1, P tüüpi elementidest, teie dokument on värv või hind element tüüpi, või midagi muud, mida tahad.

Normaalne (mitte-tühi) elemendid koosnevad start-tag, element, sisu ja lõpp-tag. <color>punane</color> täis, näiteks värvilised element. <color> see on alles algus-tag element, mis näitab, kus see algab; see ei ole aku.

Tühjad elemendid on eriline juhtum, et olla esindatud või paari algus – ja lõpp-sildid, midagi nende vahel (nt <jaemüügi hind=”123″></hind>) või tühi element start-silt, mis on sulgemise slash öelda parser ‘ärge minge otsin lõppu-tag sobitada see” (eg <jaemüügi hind=”123″/>).

3.12: Kuidas ma saan luua oma dokumendi liik?
Analüüsida klassi dokumentide ja kirjutage DTD või Schema

Dokumendi tüübid tavaliselt vaja ametliku kirjeldus, kas DTD või Schema. Samas on võimalik, et protsess hästi arenenud XML dokumentide ilma selliste kirjeldus, püüame luua neid, ilma et üks probleem. A DTD või Skeemi. kasutada XML-i redaktorit või API-liides, juhend ja kontrolli ehitus dokumendi, veendudes, et vajalikud elemendid sobivad kohad.

Luua oma dokumendi liik seega algab analüüs klassi dokumente, mida te soovite, et kodeerida: aruanded, arved, kirjad, konfiguratsiooni failid, krediitkaardi kontrollinõuetest, romaane, näidendeid, teesid, või mis iganes. Pärast seda, kui olete struktuuri õige, siis koodi kirjutada, et väljendada seda ametlikult, kasutades DTD või Skeemi süntaks.

Kui soovite luua DTD, sa pead õppima, XML-Deklaratsiooni Süntaks (väga lihtne: deklaratsiooni märksõnad algavad <! selle asemel, et lihtsalt avatud nurgaga kronsteini ja deklaratsioonid on moodustatud ka erineb veidi). Siin on näide DTD kaubanduskeskused loetelu põhineb fragment varem kasutatud:

<!ELEMENT Shopping-List (Item)+>
<!ELEMENT Item (#PCDATA)>

Ta ütleb, et seal peab olema element nimega Shopping-List ja peaks sisaldama elemente nimetatakse Punkt: seal peab olema vähemalt üks Punkt (plussmärk), kuid seal võib olla rohkem kui üks. Ta ütleb ka, et Objekt, element võib sisaldada ainult tõlgendada iseloomu andmeid (PCDATA, st tekst: enam markup).

Kuna pole ühtki muud asjaolu, mis sisaldab Shopping-List, element, me eeldame, et ” root element, mis ümbritseb kõike muud dokumenti. Nüüd ta saab kasutada, et luua XML fail: anna oma redaktor deklaratsioonid:

<?xml version="1.0"?> 
<!DOCTYPE Shopping-List SYSTEM "shoplist.dtd">

(eeldades, et sa pane DTD, et fail). Nüüd toimetaja ja luua faile näidise järgi:

<Shopping-List>
  <Item>Chocolate</Item>
  <Item>Sugar</Item>
  <Item>Butter</Item>
</Shopping-List>

On võimalik arendada keeruline ja võimas DTDS koos taktitunne, kuid oluline kasutamine, sa peaksid rohkem teada dokument, süsteemide analüüsi ja dokumendi tüüp. Vaata, näiteks, Maler el Andaloussi (1995): see oli kirjutatud SGML aga ehk 95% – kohaldada XML, XML on palju lihtsam kui täis SGML — vaata piirangute loetelu, mis näitab, mida on raiutud.

Muide, DTD faili kunagi DOCTYPE Deklaratsioon: see juhtub ainult XML-dokument, näiteks (see, mida viited DTD). A DTD-fail pole XML-i Deklaratsiooni ülaosas. Kahjuks on veel tarkvara ümber, mis lisab ühe või mõlemad.

3.13: root element tüüp, selgesõnaliselt teatanud, et DTD?
Ei, Dokumendi Tüübi Deklaratsioon.

Käesolev dokument on Dokumendi Tüübi Deklaratsioon, mitte DTD.

Bob DuCharme kirjutab:

Dokumendi Liik Deklaratsiooni:

<!DOCTYPE chapter SYSTEM "docbookx.dtd">

punkti peatükk, millest osa on elemendi tüübi deklareeritud määratud DTD tuleks kasutada root element. Ma usun, et kõrgeima taseme element DocBook on seatud, kuid mul on raske ette kujutada, et keegi luua dokument, mis kujutavad raamatud. Me oleme vabad kasutada, komplekt, raamatu, peatüki, artikli, või para) kui dokument element kehtiv dokument, et DocBook.

[Töö, et mõned ąvé teha, on määrata, mille elemendi tüüp DTD ei leitud sisu mudeli mis tahes muu elemendi tüüp: need on mahaarvamise teel, peaministri kandidaadid vaikimisi root element. (PF)]

Hea Asi, sest see suurendab paindlikkust DTD kasutada. See on sel põhjusel, et XML (SGML) on laenatud end nii hästi, et elektrooniline kirjastamine süsteemid, kus erinevad elemendid on omavahel segatud sobitada, et luua erinevaid dokumente, iga, mis vastavad sama DTD.

Ma olen näinud skeemi ettepanekud, mis täpsustavad, et skeemi element tüübid võiks dokumendi juur-element, kuid pärast kiire pilk punktis 3.3. Osa 1. W3C Schema Soovitus samuti RELAX NG skeemi jaoks RELAX, ma ei usu, et mõni neist lase teil seda teha. Ma võib olla vale.

3.14: Et ma olen kuulnud, et alternatiivide DTDS. Mis on Schema?
Nagu DTD on kontrollida, sisu ja struktuuri.

W3C XML Schema soovituses nähakse ette vahendid, millega määratakse kindlaks ametlike andmete kirjutades ja kinnitamine elemendi sisu poolest andmete liigid, dokumendi tüüp disainerid võib pakkuda kriteeriumide kontrollimiseks andmete sisu elemente, nagu ka märgise. Skeem on kirjutatud XML-Dokumendi Süntaksi, nagu XML dokumendid, vältides vajalikud töötlemise tarkvara on võimalik lugeda XML-deklaratsiooni Süntaks (kasutatakse DTDS).

Seal on eraldi Schema http://schema.org/docs/faq.html mõiste “sõnavara” on mõnikord kasutatakse viidata DTD või Schema koos. Schema eesmärk on e-kaubanduse, andmete haldamine, andmebaasi-stiilis rakendusi, kus iseloomu andmete sisu nõuab valideerimist, kus rangemad andmete kontrolli on vaja, kui on võimalik DTD k; või kui tugev andmeid kirjutades on vaja. Need on tavaliselt tarbetu traditsiooniline teksti dokumendi avaldamine rakendustes, kus Dtds kasutatakse edasi.

Erinevalt DTD, Schema ei ole võimalik kindlaks määrata, XML-Dokumendi Tüübi Deklaratsioon. Neid saab Nimeruumi, kus Schema-teadlik tarkvara tuleks valida selle, kuid see ei ole kohustuslik:

<?xml version="1.0"?>
<invoice xml:id="abc123"
         xmlns="http://example.org/ns/books/"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://acme.wilycoyote.org/xsd/invoice.xsd">
...
</invoice>

Sageli tuleb määrata Schema töötlemise tarkvara, mis tuleb eraldi registreerida, mille Schema on kasutatud, mille abil XML-dokument, näiteks.

Seevastu keerukust W3C Schema mudel, Relax NG on kerge, lihtne-to-use XML-keel on välja töötanud James Clark (vt http://relaxng.org/) arengut, võõrustas OASIS. See võimaldab, sarnaselt rikas väljendit kasutada XML-laadset süntaksit, aga pakub rohkem lihtsustatud süntaksit, mida on hõlpsam kasutada neile, kes kasutavad DTD.

Autorid, kirjastajad tähele, et inglise keeles mitmuses Schema: kasutada individuaalseid tollimaksumäärasid mitmuses on foible kallis semi-haritud; kasutada vana (kreeka) mitmuse schema oli tarbetu didacticism.

Kirjanikud tuleks ka märkida, et mitmuses, DTD on Dtds: puudub ülakoma — vt Truss (2003).

Bob DuCharme kirjutab:

Paljud XML-arendajad olid rahul süntaks markup deklaratsioonid kirjeldatud XML-spec kahel põhjusel. Esimene oli tunda, et kui XML-dokumendid, mis olid nii head kirjeldus struktureeritud informatsiooni, siis kirjeldus dokumendi liik enda struktuur (schema), et XML-dokumendi asemel kirjaliku oma süntaksi. Lisaks ühtsemaks, see muudab lihtsamaks muuta ja manipuleerida skeemi regulaarselt dokumendi manipuleerimise vahendeid. Teiseks, oli tunda, et traditsiooniline DTD märke ei võimalda dokumendi liik disainerid võivad kehtestada piisavalt piirangud andmed, näiteks, võime öelda, et teatud osa tüüp, seal on alati positiivne täisarv väärtus, et ei saa olla tühi või on loetelu võimalikest valikutest. See lihtsustab tarkvara arendamine, kasutades, et andmeid, kuna arendaja on vähem tõrkekontroll koodi kirjutada.

Peter Flynn kirjutab:

A DTD ainult määrav element struktuuri XML-faili, väga piiratud summa üle kontrolli atribuutide väärtused. See annab nimed, elemendid, atribuudid ja üksused, mida saab kasutada, et kokku sobivad. Dtds on mõeldud kasutamiseks koos traditsioonilise teksti dokumente, ei ole kandiline või tabeli andmed, nii et mõiste andmetüübid, ei ole asjakohane: tekst on lihtsalt teksti. Kui vaja, täpsustage numbriline vahemikud või määrata piirangud või kontrolli iseloomu andmed (tekst) sisu, DTD ja halb seade.

3.15: Kuidas XML mõjutada minu dokument lingid?
XML-linke on palju tugevam, kuid ei ole veel rakendatud brauserid

Ühendab võimeid XML-süsteemid on potentsiaalselt palju võimsam kui HTML, nii et sa pead olema võimeline palju rohkem neid. Olemasolevate href stiilis lingid on endiselt kasutatavad, kuid uus tehnoloogia, siduda õpitu põhjal arendamine teiste standardite puhul hüpertekst, nagu TEI, HyTime, mis hallata kahesuunaline ja multi-seosed, samuti seosed kogu element või span teksti (piires teie enda või muud dokumendid), selle asemel, et ühe punkti. Need funktsioonid on nüüd saadaval SGML kasutajad aastat, nii suur, kogemusi ja teadmisi, et neid kasutada. Praegu on ainult Mozilla Firefox rakendab XLink.

Sidumine on XML-Kirjeldus (XLink) ja XML-laiendatud Osuti Spetsifikatsioon (XPointer) dokumendid, mis sisaldavad andmeid. On XLink saab URI, või TEI-stiilis laiendatud Pointer (XPointer), või nii. URI enda eeldame, et ressurss; kui XPointer järeldub, see võib eeldada, et sub-ressurss, et URI; XPointer enda eeldatakse, et kehtivad aktiivse dokumendi (kõik täpselt nii, nagu HTML).

On XLink saab kasutada #, ?, või |. # es ? sama mis HTML-rakendusi; | – alam-allika võib leida kasutades linki allikale, kuid meetod, see on jäetud taotlus. On XPointer lihtsalt järgige #.

Kui TEI laiendatud Osuti Märge (ENP) on palju võimsam kui fragment aadress lõppu mõned Urid, sest see võimaldab määrata asukohta lingi lõppu, kasutades dokumendi struktuuri, samuti (või lisaks) teada, fikseeritud punkte, nagu Id-d. Näiteks seotud teise esinemise ning sõna “XPointer” kaks lõigetes tagasi saaks viidatakse URI (siin näidatud koos linebreaks, ruumid selgus: tegelikult, muidugi, see on lihtsalt pikk string):

http://xml.silmaril.ie/faq.xml#ID(hypertext)
    .child(1,#element,'answer')
    .child(2,#element,'para')
    .child(1,#element,'link')

See tähendab, et esimene link elemendi piires teise lõigu piires vastus elemendi, mille ID on “hüpertekst” (see küsimus). Loota objektide alguses see küsimus (mis on ID “hüpertekst”) XML-allikas:

  1. esimese lapse objekt on element, mis sisaldavad küsimus (quandaentry);
  2. teise lapse objekt on vastus (vastus element);
  3. selles osa, teine lõik;
  4. leia esimene link element.

Eva Maler selgitas suhe XLink, XPointer järgmiselt:

XLink reguleerib, kuidas saate lisada linke XML-dokument, kus seos võib olla punkt, et midagi (nt GIF-failina); XPointer reguleerib fragment identifikaator võib olla URL, kui lingitud XML-dokument, kõikjal (näiteks HTML-faili).

[Või tõepoolest XML-faili, URI a kirja, jne.]

David Megginson toodetud xpointer funktsiooni Emacs/psgml, mis on järeldada, on XPointer igal asukoht XML-dokument. XML Spy on sarnane funktsioon.

3.16: kas ma kodeerida matemaatika XML-i kasutamine?
Jah, kasutamise MathML.

Matemaatika on lubatud juhul, kui dokument tüüpi te kasutate ette nähtud matemaatika ja kasutajate brauseril on vana. Matemaatika ühendus on välja töötanud MathML Soovitust W3C, mis on native XML rakendamine sobib manustamine teiste DTD ja Schema.

See on ka võimalik, et on XML-killud teiste DTD nagu ISO 12083 Matemaatika, või OpenMath, või omal. Brauserid, mis ekraani matemaatika varjatud SGML eksisteerinud aastaid (nt DynaText, Panorama, Multidoc Pro), nagu ka rohkem populaarsed brauserid on nüüd rendering MathML. David Carlisle toodetud komplekti stiili vahel karjääriteenuste MathML brausereid. Seda on võimalik kasutada ka XSLT teisendada XML matemaatika markup, et LATEX eest prindi (PDF) renderdamise või kasutada XSL:FO.

Palun pange tähele, et XML-ise ei ole programmeerimiskeel, nii mõisteid nagu aritmeetika “kas” – avaldusi (kui siis teine loogika) ei tõlgendata tavalises XML-dokumente.

3.17: Kuidas XML-käepide metaandmed?
Nii, nagu soovite.

Kuna XML võimaldab teil määrata oma markup language, saate täiel määral ära kasutada laiendatud hypertext omadused XML (vt küsimuse Sidemete kohta), et poe või lingi metaandmete mis tahes vormingus (nt ISO 11179, kui Teema Kaardid Avaldatakse Teema, Dublin Core, Warwick Raames, või Resource Description Framework (RDF), või isegi Platvorm Interneti Sisu Valiku (PICS)).

Ei ole etteantud elementide XML, kuna see on arhitektuur, mis ei ole taotluse, nii et see ei ole osa XML s tööd, et täpsustada, kuidas või kui autoreid peaks või ei peaks rakendama metaandmed. Seega võib vabalt kasutada mis tahes sobivat meetodit. Brauseri tegijad on ka oma arhitektuuriliste soovituste või meetodite soovitatav.

Id-te toota, HTML5 i XML, pange tähele, et HTML5 ei kasuta Dublin Core, kuna HTML ei (vt http://www.w3.org/TR/html5/document-metadata.html), aga seal on registreerimise mehhanism kõiki faile, mida eelnevalt määratletud, metaandmete nimi.

3.18: Kuidas ma saan kasutada graafika XML?
Viide neid HTML, või kasutada XLink. Või embed SVG.

Graafika on traditsiooniliselt lihtsalt lingid, mis juhtub olema pildi faili, lõpuks, mitte tekstilõik. Seega võivad nad rakendada mistahes viisil toetatud XLink, ja XPointer standardid (vt Kuidas XML mõjutada minu dokument lingid?), sealhulgas sarnane süntaks olemasolevad HTML-i pildid. Nad on ka viidatud XML-i kasutamine on ehitatud, ja üksuse mehhanismi sarnaselt standard SGML, kui väline unparsed üksused.

Siiski Scalable Vector Graphics (XML kirjeldus vector graphics) võimaldab kasutada XML-juhtida vektorgraafika objektidel otse XML-faili. See annab tohutu jõu, et integratsiooni kaasaskantav graafika, eriti interaktiivseid või animeeritud järjestusi, see on nüüd muutumas toetatud brausereid, saab eksportida standard graafika (joonistus) programmid nagu GIMP.

XML-ühendab spetsifikatsioonid välised pildid palju paremini üle tee, aktiveeri link nii, et autor saab näiteks kindlaks määrata, olenemata sellest, kas seal on pilt, mis kuvatakse, kui leht on peale-või kliki kasutaja, või eraldi aknas, ilma et peaks kasutama skriptimist.

XML ise ei predikaat või piirata graafilise faili formaadid: GIF, JPG, TIFF, PNG, CGM, EPS, SVG vähemalt tundub mõistlik, kuid, vektor formaadis (EPS, SVG) on tavaliselt oluline, mitte foto-pildid (skeemid).

Varjatud binaarne graafika
Ei embed raw binaarne graafika faili (või mis tahes muu binaarne [non-text] data) otse XML-faili, sest kõik baiti juhtub meenutavad markup saab tõlgendada: viide sellele, sidudes (vt allpool). Siiski on võimalik lisada teksti kodeeritud ümberkujundamine binaarne fail CDATA tüüp on Märgitud punktis kasutades midagi UUencode koos markup tähemärki ], & , > eemaldatud map, nii et ei teki nagu vigase CDATA lõpetamise järjekorras, nii et vastus sellele küsimusele. Samuti saate kasutada seda lihtsat kodeering on kuueteistkümnendsüsteemis kasutada PostScript. Vektor graafika, kuid lahendus on SVG (vt Peter Murray-Rust on mägi).

Helifailide on binaarne objektid samamoodi, et väline graafika on, et nad on ainult väliselt viidatud (sama tehnika nagu graafika). Muusika failid kirjutatud MusiXML või XML-variant smd sa samal ajal on manustatud samal viisil, nagu SVG.

Mõte on selles, et kasutage üksuste ja hallata oma graafika on, et saate hoida loetelu üksus deklaratsioonid eraldi ülejäänud dokumendi, nii et uuesti kasutada nimed, kui pilt on rohkem vaja kui kunagi varem, kuid ainult poest füüsilise faili spetsifikatsioon ühes kohas. Välised ühikud on saadaval ainult siis, kui DTD, mitte Skeemi.

Bob DuCharme kirjutab:

Kõik andmed XML-dokumendi isik parsable XML-i. Saate määrata välise üksuse, kas vaikimisi üksus (parsable XML) või unparsed üksus (midagi muud). Unparsed üksused saab kasutada pilti, pilti, häält, pilte, videofaile, või kui soovite. Nad saavad ainult viidatud dokumendis, väärtus atribuudi (samamoodi nagu bitmap pildi HTML web väärtust img elemendi src atribuuti) , see ei ole osa tegelikult dokumendi. XML-dokument, seda atribuuti tuleb deklareerida tüüp üksus ENTITY üksuse kinnitus, tuleb täpsustada, et deklareeritud NOTATION, sest kui keha ei ole XML, XML-protsessor peab teadma, mis see on. Näiteks järgmine dokument, colliepic organisatsioon märkis, et JPEG-märgise kasutamine väärtus tühi koer elemendi picfile atribuut.

<?xml version="1.0"?> 
<!DOCTYPE dog [ 
<!NOTATION JPEG SYSTEM "Joint Photographic Experts Group"> 
<!ENTITY colliepic SYSTEM "lassie.jpg" NDATA JPEG>
<!ELEMENT dog EMPTY> 
<!ATTLIST dog picfile ENTITY #REQUIRED> 
]> 
<dog picfile="colliepic"/>

(Majandus) üksus meetod on eriti kasulik, kui sul on palju pilte, või palju korrata kasutab sama pilti, sest sa ainult kuulutada kord, ülaosas dokumenti nii, et pilt haldamise palju lihtsamaks.

On XLink, XPointer lingid kirjeldused kirjeldus teistmoodi punkti XML-faili, näiteks graafiline. Need pakuvad keerukamaid üle kontrolli välise üksuse seisukoht, käitlemise ja välimus jooksul XML-dokument.

Peter Murray-Rust kirjutab:

GIF, JPEG rahuldada bitmaps (pixel esindused pilte: kõik tehtud värvilised punktikesed). Vector graphics (svg-scalable, joonistus, tehnilised andmed), W3C graafika tegevuse Scalable Vector Graphics (vt http://www.w3.org/Graphics/SVG). Spetsifikatsioon on nüüd lõppenud, see on võimalik edastada graafiliselt kui vektorite otseselt jooksul XML-faili. Palju graafika, see tähendab, et oluliselt vähendada alla laadida aeg, ja tagi kaotamata andmeid.

Max Dunn kirjutab:

SVG on tõesti maha võetud viimasel ajal üsna XML-edulugu [ … ] [palju] vastab rakendusi. Ma hiljuti algatas SVG-KKK http://www.svgfaq.com/.

XSLT, et genereerida SVG a XML; üksikasjad http://www.svgfaq.com/xslt.asp (kindlasti XSLT, mitte Microsofti vananenud WD-xsl). Dokumendid võib ka suhelda SVG-pildid (vt http://www.xml.com/pub/a/2000/03/22/style/index.html).

3.19: Mis on analüüs ja kuidas ma seda XML-i?
Analüüsi jaotamise elemente

Analüüsi õiguse jagada teavet elemendid (õpetatakse koolides, et keele tunde, kuni õpetaja elukutse on püütud anti-grammatika viirus).

Mary-kanalid Spot sõeluda nagu

  1. Teema = Mary, pärisnimi, nominative case
  2. Tegusõna = kanalite sihiline, kolmas isik ainsus, aktiivne kõne, oleviku
  3. Objecta = Spot, pärisnimi, accusative juhul

Arvutustehnika, analüüsi programmi (või tükk kood, või API, et te viite sees oma programmid), mis analüüsib faili, et määrata kindlaks osad. Kõik rakendused lugeda sisend analüüsi midagi, muidu te ei suuda kunagi aru saada, millist teavet viisil. Microsoft Wordis on tõlgendus, mis kestab avamisel .doc fail ja kontrolli, et on võimalik tuvastada varjatud koode; iCal, Google i Kalender sisaldab tõlgendus, mis on sõnastatud järgmiselt: a .keemiline kohtumine manus e-mail toimib, millist teavet on. Neile rikutud fail, saad veateate.

XML rakendused on lihtsalt sama: nad sisaldavad parser mis vastavalt XML-i ja määratleb funktsiooni iga osa kohta dokumendi, siis teeb selle teabe kättesaadavaks mälu teised programmid.

Lugemise ajal XML-faili parser kontrollib süntaksi (teravanurgeliste sulgudes, sobitamine hinnapakkumisi, jne) hästi formedness, ja aruandeid mis tahes rikkumiste eest (avalikustatava vead). XML-Spetsifikatsioon loetleb, millised need on.

Valideerimine muud off-etapi analüüs. Kuna programmi osad on kindlaks tehtud, analüüsi võib võrrelda muster kehtestatud DTD või Schema, veenduge, et te järgima. Protsessi vaikimisi väärtused on datatype (kui see on täpsustatud) saab lisada mälu tulemus seire, analüüs, mis annab taotlusele.

 
<person xml:id="abc123" birth="1960-02-31" gender="female"> 
  <name>
    <forename>Judy</forename> 
    <surname>O'Grady</surname> 
  </name>
</person> 

Ülaltoodud näites sõeluda:

  1. Element <isik> id Atribuut xml:id (eelnevalt määratletud tüüp “ID”), mis on “abc123” ja Atribuut sündi, mis sisaldavad “1960-02-31” ja Atribuut soolise sisaldavad “naine”, mis sisaldavad …
  2. Element <nimi>, mis …
  3. Element <esimene-nimi>, mis sisaldab teksti “Judy” pärast …
  4. Element <perekonnanimi>, mis sisaldab teksti “O’Grady”

(paljud muud asjad). See on ju pere-puu struktuuri taotluse mälu (puu struktuurid on ühine viis, kuidas programme, andmeid salvestada).

Samuti sisseehitatud ąvé, seal on ka self-analysis-validator (vt Bill ray otsa), mida ma lugeda XML-fail ja ütle mulle, kui sa leiad vea (nagu puudu nurk sulgudes või hinnapakkumisi, või vales kohas markup). See on väga oluline, katsetamine failid eraldi, enne teeme midagi, eriti kui teil on juba loodud käsitsi ilma XML-i redaktorit või API, mis võib olla liiga sügavalt juurdunud mujal võimaldada lihtne testida.

Bill Ray, ütleb:

Self-analysis/valideerimine kasutada tarkvara, nagu James Clarki onsgmls või Richard Tobini on rxp. Nii töötab Linux ja Windows/DOS. Erinevus on see, et sellisel kujul vigade nimekiri (kui on olemas), ja et mõned versioonid onsgmls ei too Dtds või muude failide üle võrgu, arvestades, et rxp.

Kontrollige, et XML-faili korrektselt viited DTD Dokumendi Tüübi Deklaratsioon DTD faili[s] on kohapeal kättesaadavad (rxp alla laadida, kui teil on Interneti-ühendus; onsgmls ei tohi, nii et teil võib vaja, kohalik koopia).

Laadige alla ja installige tarkvara. Veenduge, et teil on installitud koht, kuhu operatsioonisüsteem on võimalik seda leida. Kui sa ei tea, mida see tähendab), siis on vaja veidi abi, kes teab, kuidas alla laadida ja installida tarkvara, mis tüüpi operatsioonisüsteemi.

Kui onsgmls, kopeeri pubtext/xml-i.soc pubtext/xml-i.elektripaigaldiste kaabliklambrid raamatukogu.

Kinnitamiseks myfile.xml avatud shell (käsk või terminali), aken (Linux) või MS-DOS (käsuviip) aken (Microsoft Windows). Selles näites, me eeldame, et XML-faili nimi myfile.xml see on kausta nimi myfolder. Kasutada õige nimi kausta ja faili, kui teil on tüüp käske.

Kui onsgmls:
$ onsgmls -wxml -wundefined -cxml.soc -s myfile.xml

Seal on palju erinevaid võimalusi onsgmls, mis on kirjeldatud kodulehel. Kes on siin toodud on vajalik, sest see põhineb SGML parser, need valikud ei võta XML-režiim, summutades normaalne väljund, nii et ainult vigu (kui neid on).

Microsoft Windows võib eesliide onsgmls käsu täielik tee, kui need on paigaldatud nt C:\Program Files\OpenSP\bin\onsgmls.

A rxp:
$ rxp myfile.xml

rxp on mingi variant, mis on kirjeldatud veebilehel.

Microsoft Windows võib-olla eesliide rxp käsu täielik tee, kui need on paigaldatud nt C:\Program Files\ltxml2\bin\rxp.

3.20: Kuidas ma saan lisada ühe XML-faili teise?
Kasutada üldist üksus, nagu SGML, või kasutada XInclude.

Üks meetod on, et Dokument on kasutades, mis töötab täpselt sama SGML, kuid nad nõuavad DTD või sisemine osa. Esiteks tunnistada üksused, mida soovite lisada, siis vaadake, et nime kui Üksus Viide:

 
<?xml version="1.0"?>
<!DOCTYPE novel SYSTEM "/dtd/novel.dtd" [
<!ENTITY chap1 SYSTEM "mydocs/chapter1.xml">
<!ENTITY chap2 SYSTEM "mydocs/chapter2.xml">
<!ENTITY chap3 SYSTEM "mydocs/chapter3.xml">
<!ENTITY chap4 SYSTEM "mydocs/chapter4.xml">
<!ENTITY chap5 SYSTEM "mydocs/chapter5.xml">
]>
<novel>
  <header>
    ...blah blah...
  </header>
&chap1; 
&chap2; 
&chap3; 
&chap4; 
&chap5; 
</novel>

Vahe on see meetod on see, mida kasutatakse, sealhulgas DTD fragment (vt Kuidas lisada üks DTD (või fragment) teises?) on, et see kasutab välist üldine (faili) üksus, millel on viidatud samamoodi nagu tegelane üksus (märk).

See on üks asi veenduge, et kaasasolev fail ei ole XML-või DOCTYPE deklaratsioon. Kui teil on olnud üks toimetamine fragment, eemaldage see enne, kui fail on kasutusel. Jah, see on õrritaja, kuid kui sul on palju kandmisel meeldib see, kirjutada skripti, et riba välja deklaratsiooni (ja kleebi see tagasi toimetamine).

Skeeme ei toeta üksused, nii alternatiivset kasutamist XInclude. See on W3C spetsifikatsioon, sealhulgas XML-dokument (või fragment) sees teise.

<?xml version="1.0"?>
...
<article xmlns="http://docbook.org/ns/docbook"
      xmlns:xi="http://www.w3.org/2001/XInclude">
   <info>
     <xi:include href="metadata.xml" parse="xml"
         xpointer="title"/>
   </info>
   <sect1>
      ...
   </sect1>
</article>

Töötlemise tarkvara peaks olema võimalik hakkama XInclude seda teha. Kui XPointer süntaks on võimalik suunata parser kindlal asukohal dokumendis, erinevalt üksused, kus kogu dokument on kaasas.

3.21: Kui kasutada CDATA Märgitud Punktis?
CDATA on lihtsalt teksti, mis sisaldab xml-meeldib märki.

Pea ei ole isegi vaja kasutada CDATA Osades. Kui CDATA mehhanism oli mõeldud on autori tsitaat killud teksti, mis sisaldab xml märgid (open-angle-bracket ja tähis) näiteks dokumenteerimisel XML (Kasutab CDATA Punktides üsna palju, arusaadavatel põhjustel). A CDATA Jagu kustub markup tunnustamise kestus osa (see on sisse lülitatud uuesti sulgemise jada topelt lõpus nurksulgudes on lähedal-angle-bracket).

Seega, midagi on CDATA osas saate tea midagi pistmist markup: see on lihtsalt märgijada on läbipaistev, kui XML ümberkujundamise keel nagu XSLT, mis tahes markup tähemärki saada tegelane üksuse samaväärne.

Kui te proovige, näiteks, et:

some text with <![CDATA[<em>markup</em>]]&gt; in it.

ootus, et varjatud markup jääb puutumata, ei ole: ainult väljund

some text with &lt;em>markup&lt;/em> in it.

Teisisõnu, CDATA Punktides ei saa säilitada varjatud markup kui kasum. Tavaliselt see on täpselt, mida soovite, sest see tehnika oli loodud selleks, et inimesed teha asju, kirjuta dokumendid märgise. See ei olnud mõeldud selleks, et võimaldada kulgeb vähe tükkideks võltsitud, rikutud või kehtetu unparsed HTML manustatud sees oma XML-läbi järgmise protsessi, sest see on riski invalidating väljundi.

Selle tulemusena, siis ei saa loota, et hoida markup puutumata lihtsalt sellepärast, et see tundus nagu siis, kui ohutult “peidetud” sees CDATA jagu: seda ei saa kasutada magic shield säilitada HTML markup tulevikus kasutada, kui hea, just nagu tähemärki.

Loe, kuidas saate hallata sisseehitatud HTML XML? ja, mis on väga tihedalt seotud.

3.22: Kuidas ma saan hallata sisseehitatud HTML XML?
Tagada, et väljund, kasutage sügavat koopia, või üritada disable-output-pääseks.

Lisaks, kasutades CDATA Lõigud, kaks ühist olukordi, kui inimesed tahavad käepide sisseehitatud sees HTML a XML-elementi:

  1. kui nad on saanud (võib-olla halvasti mõeldud), XML-või HTML-kusagil mujal, kus teil on vaja leida viis, kuidas käepide;
  2. kui rakendus, mis on spetsiaalselt projekteeritud, et salvestada märgijada, mis sisaldavad &lt; või &amp; iseloomu üksus, viited, mille eesmärk on anda neile tagasi ametisse nimetamise hilisemas protsessis (nt FreeMind, Aatom).

Tavaliselt, kui sa tahad, et vältida selline trikk, kuna see näitab tavaliselt, et dokumendi struktuuri, disaini oli piisavalt läbimõeldud. Siiski, seal on aegu, kui see muutub vältimatuks, nii et kui teil on tõesti vaja või tahad varjatud HTML markup sees XML, processable hiljem markup, seal on mõned tehnikad saate kasutada:

  • Pakkuda malle hallata, et märgistus XSLT ümberkujundamise või mis iganes tarkvara on lihtne kasutada, mis on identne sellega, mis oli puutumata, nt kui teil on vaja säilitada <b>tekst</b>-pakkumise malli teha:
<xsl:template match="h:b">
  <b>
    <xsl:apply-templates/>
  </b>
</xsl:template/>

(Kui juhtimise elemente eri DTD või Schema, siis peaks ilmselt Nimeruum on hoida neid erinevaid, seetõttu h: prefix.)

  • Kasutada XSLT “sügav koopia” juhendamine, mis väljundid ühendatud hästi arenenud markup sõna otseses mõttes, nt.
<xsl:template match="h:b">
  <xsl:copy-of select="."/>
</xsl:template/>
  • Viimase võimalusena kasutada disable-output-põgenemine atribuut xsl:text element, XSL[T], mis on saadaval üksikute töötlejad, nt
  • <xsl:text disable-output-escaping="yes"><![CDATA[<b>Now!</b>]]&gt;</xsl:text>
    

Sel sügisel “räpased trikid” osakonna, tavaliselt on aegunud. Iga protsessorid ei toeta.

  • Mõned töötlejad (nt JX), samuti oma on samaväärne keelamine väljuvad alates. Usklikud väidavad, et “soovitav või” mida enamik inimesi vaja, kuid see on alati raviks, et hoida ära soovimatu (võib olla ka ohtlik) suvalise koodi on läbinud puutumata läbi teie süsteemi. See on ka uue sõltuvuse tarkvara.

Täpsemalt, et kasutada neid tehnikaid XSL[T] vt asjakohane küsimus, et XSL sõbralik küsimusi.

Lugeda, Kui kasutada CDATA Märgitud Punktis? ja, mis on väga tihedalt seotud.

3.23: millised on erisümboleid, XML?
Ainult viis: &lt; (<), &amp; (&), &gt; (>), &quot; (“) &apos; (‘).

Tavalise teksti (ei markup), mingeid erilisi märke, välja arvatud juhul,< , &: veenduge, et XML-i deklaratsiooni, mis viitab õige-märgivahetuseks ühest süsteemist, keele ja/või kirjutamise süsteemi, mida soovite kasutada, ja et arvuti korralikult, salvestab faili kasutades, et kodeerimissüsteem. Vt küsimus mitte-ladina tähtedega pikem selgitus.

Peale nähtamatu ASCII kontrolli märgid (ei saa tüüp), kõik muud tähed on lihtsalt tavaline tekst. Valuuta märgid (€, £, $, ƒ, ₨, Ƀ, jne.), kirjavahemärke (välja arvatud < ja &), kõik muud tähed, märgid, sümbolid, ükskõik mis keeles või kirjalikult süsteemi, et ainult teksti (eeldades, et õige kodeering).

Kui klaviatuur ei võimalda teil sisesta sümbolid, või kui soovite kasutada märki väljaspool piire kodeerimise süsteem on valitud, saate kasutada sümboolne märge “üksus viitega”. Üksuse viited või numbritega, kasutades koma või kuueteistkümnendsüsteemis Unicode-kood punkti iseloomu (nt kui klaviatuur ei ole Euro sümbol (€) tüüp &#8364;); või nad võivad olla märgi, kasutades kindlaks määratud nimed, mida saab deklareerida oma DTD (nt <!ÜKSUSE euro “&#8364;”>), mis seejärel võimaldab teil kasutada nime &euro; dokumendis. Kui Skeemi, kasutada numbrilist vormis, välja arvatud viie alla, sest Schemas pole mingit võimalust saada märk üksus, deklaratsioonid.

Kui te kasutate XML nr DTD, siis need viis iseloomu üksused, mis on loetletud ülaosas see küsimus oletada, et predeclared, ja te saate neid kasutada ilma, millega neid eraldi (tõepoolest, enamik tarkvara takistab sul redeclaring neid):

&lt;
Vähem kui märk (<) algab element markup (esimese sõna algus-tag-või lõpp-tag).

&amp;
& märk (&) alustab üksus markup (esimene märk märk üksuse viide).

&gt;
Suurem, kui märk (>) lõpeb start-tag-või lõpp-tag.

&quot;
Topelt jutumärgid ( ” ) sm-see märk viide üksus, kui teil on vaja kinnistada double-quote stringi sees, mis on juba topelt tsiteeritud.

&apos;
Kui ülakoma või ülakoma ( ‘ ) sm see märk viide üksus, kui teil on vaja kinnistada ühe hinnapakkumise või ülakoma stringi sees, mis on juba ühe-ja muutumatu.

Kui DTD siis peate deklareerima kõik iseloomuga üksused, mida vaja kasutada, nii et see oleks hea tava, kinnitan, et eespool nimetatud viie kasutada. Kui Skeemi, kasutada numbrilist vormis, välja arvatud viie kohal, sest Schemas pole mingit võimalust saada märk üksus, deklaratsioonid.

On asjaolusid, mille saate kasutada erimärke nagu ise, nagu CDATA Osades. Kõige kontrolli tegelased on keelatud XML: Spetsifikatsioon täpsed andmed.

Ei ole reserveeritud sõnu, nagu kasutaja nimeruumi XML: võite helistada element, element, atribuut atribuut, nagu pärast (väärastunud) näide:

<?xml version="1.0"?>
<!DOCTYPE DOCTYPE SYSTEM "SYSTEM" [
<!ELEMENT DOCTYPE (ELEMENT+)>
<!ATTLIST ELEMENT ATTLIST ENTITY #IMPLIED>
<!NOTATION DOCTYPE SYSTEM "ENTITY">
<!ENTITY NOTATION SYSTEM "ENTITY" NDATA DOCTYPE>
]>
<DOCTYPE>
  <ELEMENT ATTLIST="NOTATION">foo</ELEMENT>
</DOCTYPE>

kui faili SYSTEM sisaldab deklaratsiooni: <!ELEMENT ELEMENT (#PCDATA)> faili ENTITY ei ole olemas.

Seal on märksõnad, nagu DOCTYPE, IMPLIED, mis on reserveeritud Nimed, kuid need on, mille ees seisab lipu märk (xml Deklaratsiooni Avatud iseloomu või reserveeritud Nimi Näitaja), seetõttu ei tohi segi ajada kasutaja määratud Nimi.

3.24: Mida muud markup süsteemid on olemas?
Mitmed teised populaarsed saadaval süsteemid

MarkDown
See on nii polegi vormindamine süntaks, ja Perli skript, mis teisendab XHTML. Eesmärk oli souci faili ei näe välja nagu markup (nii, et seda saaks lugeda kui tavaline teksti dokument), kuid olema piisavalt tugevad taluma muutmist.

Detailid http://daringfireball.net/projects/markdown/.

Wiki/blogi formaat
Paljud neist: kõige tuntum on ehk MediaWiki-vormingus, mida Wikipedia, mis on üsna ulatuslik polegi vahendid, et luua kanded kasutada, lehel, mis on seejärel konverteeritakse HTML-ekraanile.

Sarnane mõiste vorming, mida kasutatakse teiste wiki-süsteemide, näiteks Pmw ja Google ‘ i Kood; seal on hübriidid, mis on kasutada ka HTML, nagu Fossiilsete.

LATEX
LATEX dokumentide ettevalmistamine, ladumiseks süsteemi (Lamport, 1994) kasutab makrod ehitatud TEX süntaks rakendada osaliselt struktureeritud dokumendi mudel. Süntaks kasutab längkriips, et lipu märgise elemendid, vormindamise juhiseid, ja lokkis traksid piiritleda argumendid ja ulatust piirata typographic meetmed.

Tarkvara kõigil platvormidel, ja loob PDF-või PostScript-väljund. Üleminek LATEX XML-põhiste süsteemide teha XSLT, kuid konverteerimist LATEX süntaks on problemaatiline, sest funktsioone, mis ei ole kergesti esinduslikud muud süsteemid.

SGML
SGML varre rakud on jätkuvalt kättesaadav, kuid seda kasutatakse harva.

Seal on ulatuslik nimekiri markup language Wikipedia leht.

Jagu 4: Arendajad

Kui programmeerijad, täitjad

4.1: Kus spec?
Siin

Siin: Bray, Paoli, Sperberg-McQueen, Maler, Yergeau (2004) (vt http://www.w3.org/TR/REC-xml). Sisaldab EBNF, samuti normatiivse materjali. Seal on versioon Jaapani; Hispaania; Korea; Java-ise sa kommenteeritud versioon ja kommenteeritud versioon raamatu kujul (DuCharme, 1999).

Eve Maler säilitab DTD kasutada, spec ise; DTD on ka kodeerida mitu muud W3C näitajad, nagu XLink, XPointer, DOM, XML Schema, jne. Seal on dokumendid kättesaadavad DTD. Pane tähele, et XML-spec on tarvis kasutada spetsiaalseid ühe-off versiooni DTD, kuna reaalne originaal DTD kasutada, oli ammu kadunud.

4.2: ma olen püüdnud aru saada, XML Specifikácia: miks selline keeruline terminoloogia?
See on ametlik ja täpne.

Rakendamine on edukas, terminid peavad olema täpsed. Disaini eesmärk on kaheksa spetsifikatsioon ütleb, et “disain XML peab olema ametlik ja sisutihe”. Kirjeldada XML spetsifikatsioon, seetõttu kasutab ametlik keel koostatud mitmetes valdkondades, eelkõige dokument, inseneri, rahvusvaheliste standardite ja arvutiõpetus. See on sageli segane, et inimesed, kes on kuni nendel erialadel, sest nad kasutavad tuntud inglise sõnad erilist mõtet, mis võib olla väga erinevad ühise tähenduse — näiteks: grammatika, tootmise, token, või terminal.

Spetsifikatsioon ei selgitama neid termineid, sest ülejäänud projekteerimise eesmärk: spetsifikatsioon lühike. Ärge korrake selgitused, mis mujal on olemas, ma arvasin, ma tean, ma isegi ei tea, mõisteid või on võimalik leida neid. Põhiliselt, see tähendab, et grok täius spec, teadmiste,  SGML, arvuti, teadus, kuid mõned kokkupuudet keele ametliku spetsifikatsioonid.

Lohakas terminoloogia kirjeldused põhjustab arusaamatusi ja raske teha järjepidevalt, nii et ametlikke standardeid, et sõnastada, ametliku terminoloogia. Ei ole ametlik dokument, nutikas lugeja on juba märganud, viitab see element nimed “siis kui” elemendi tüüp nimed on õigem, kuid endine on laiemalt tuntud.

Uue terminoloogia võiks olla kasulik lugeda midagi TEI P4: Suunised Elektrooniliste Teksti Kodeering ja Vahendustasu (Sperberg-McQueen ja Burnard, 2002) või XML: Märkused Spetsifikatsioon (DuCharme, 1999).

4.3: Millised on need tingimused DTDless, kehtiv, kuid hästi vormitud?
Hästi arenenud tähendab, et ainult syntactically õige; kehtiv, mis tähendab, et see vastab DTD või Schema.

XML võimaldab teil luua Schema või Dokumendi Tüübi Definitsioon (DTD) kirjeldada xml (elemente ja muid konstruktsioone) saadaval konkreetset liiki dokumendiga. Siiski, projekteerimise, ehitamise, Schema, ja Dtd võib olla keeruline, mitte-triviaalne, nii XML ka võimaldab teil töötada ilma. DTDless operatsiooni tähendab, et leiutada markup ilma, et määrata ametlikult, tingimusel, et teil püsida hästi formedness reegleid XML-i süntaksit.

Teha seda tööd, DTDless faili on eeldada, et määrata oma markup, vaid olemasolu, asukoht elemente, mille loote neid. Kui XML taotluse kohtab DTDless faili, see ehitab sisemudeli dokumendi struktuuri kuigi see loeb see, sest seal on mingit Skeemi või DTD öelda seda, mida oodata. Seetõttu tuleks üllatusena, või ei ole selge süntaks. Selleks, et dokument on (järgige eeskirju).

Et mõista, miks see mõiste on vajalik, pilk standard HTML näiteks:

  • <Img> elementi on deklareeritud ([SGML] Dtd HTML) nii TÜHI, nii et sa ei pea lõpp-tag (ei ole </img>);
  • Palju teisi HTML elemente (näiteks <para>) võimaldab teil jätta lõppu-silt lühiduse.
  • Kui XML-protsessor loeb HTML-faili, ilma et seda teha (sest ma ei kasuta DTD), sa kohtub <img> või <para> (või mis tahes muu start-tag), see ei ole viis, kuidas teada, kas on või ei ole oodata lõpp-tag. See on võimatu teada, kuidas ülejäänud faili on õige või mitte, sest nüüd ei ole tõendeid, et seal oli üks element, või, kui olete lõpetanud.

Hästi arenenud dokumendid, seepärast tuleb alustada-sildid, lõpp-sildid, iga normaalne element, ja kõik TÜHJAD elemendid peavad olema selgelt välja, või tavaline start-sildid, lõpp-sildid, või kaldkriipsuga nimi, start-tag enne sulgemist > kui märki, et seal ei ole eraldi lõpp-tag.

Kõik XML-dokumendid, nii DTDless, kehtiv, kindlasti. Ma peaks algama XML-i deklaratsiooni, kui vaja (näiteks kindlaks kodeeringut, või kasutades Eraldiseisev Dokument, Deklaratsioon):

<?xml version="1.0" encoding="iso-8859-1" standalone="yes"?> 
<foo> 
  <bar>...<blort/>...</bar> 
</foo>

David Brownell, kirjutab:

XML, mis on lihtsalt hästi, ma ei pea olema Eraldiseisev Dokument, Deklaratsioon. Sellised väited on olemas, et võimaldada teatud töötab kiiremini kui töötlemise dokumendid, unustades väline parameeter üksused — põhimõtteliselt ei tugine välise deklaratsioonid standalone dokumendid. Liigid, mis on olulised või organisatsioon, ja atribuute. Eraldi dokumente ei nõua atribuut normaliseerida või kohustused täitmata jätnud või on kehtetu.

Samuti on võimalik, et Dokumendi Tüübi Deklaratsioon DTDless faile, kuigi ei ole Dokumendi Liik, vt:

Richard Lander kirjutab:

Kui teil on vaja iseloomu üksuste [muud kui viie sisseehitatud] DTDless faili, võid kuulutada neid sisemise osa sellest ilma viide midagi muud kui root element tüüp:

 
<?xml version="1.0" standalone="yes"?> 
<!DOCTYPE example [ 
<!ENTITY mdash "&mdash;"> 
]> 
<example>Hindsight&mdash;a wonderful thing.</example>

Nii…siin on reeglid:

Hästi arenenud XML

  • Kõik sildid peavad olema tasakaalus, st, kõik elemendid, mis võivad sisaldada iseloomu andmete või alam-elemente nii start-tag-ja lõpp-tag kohal (tegevusetus ei ole lubatud, välja arvatud TÜHJAD elemendid, vt allpool);
  • Kõik atribuutide väärtused peavad olema noteeritud. Ühe hinnapakkumise iseloomu (ülakoma) võib kasutada, kui nende väärtus sisaldab topelt tsiteerida, või vastupidi. Kui teil on vaja isoleeritud hinnapakkumisi, kuna andmed, mida saab kasutada &apos posei programmi; või &quot.
  • Mingil juhul ärge kasutage automaatset typographic (‘lokkis’) jutumärgid ümber, mis mõne sõna töötlejad hinnapakkumine atribuutide väärtused.
    TÜHJAD elemendid (näiteks need, kes ei ole lõppu-tag nagu HTML on <img>, <hr>, <br> ja teised), või lõppu /> või nägema non-EMPTY elemente, millel on tegelik lõpp-tag (kuid mitte sisu). Näiteks: <br> või <br/> või <br></br> (midagi vahel).
  • Ei tohi olla mingit isoleeritud markup-start sümboleid (< ja &) tekstis andmeid. Tuleks tõlkida kui &lt; või &amp; või jada ]]> võib-olla, et see saab toimuma alles siis, kui lõppu CDATA tüüpi märgitud lõik: kui soovite kasutada muul eesmärgil peaks olema antud ]]&gt;.
  • Elemendid peavad pesa üksteise sees korralikult (ei ole kattuvad markup, sama mis HTML);
  • DTDless hästi arenenud dokumente võib kasutada atribuute kõik elemendid, kuid atribuudid on kõik eeldatakse, et tüüp CDATA. Te ei saa kasutada ID/IDREF atribuuditüübiga jaoks parser-kontrollida, et ma võtsin kõik DTDless dokumendid.
  • XML-failid nr DTD peetakse &lt; &gt;, &apos;, &quot;, &amp; kindlaks määratud, et kasutada. DTD-ga, kõik iseloomuga üksused, tuleb teatada, sealhulgas viis.

Kehtiv XML

Kehtiv XML failid on hästi arenenud faile, mis on Dokumendi Liik Määratlus (DTD) või Skeemi, mis vastab. Nad on hästi formuleeritud, et kõik ülaltoodud reeglid kehtivad.

Kehtiv fail algab Dokumendi Liik Deklaratsiooni, täpsustades DTD, või kood, milles W3C Skeemi. Võib-olla valikuline XML-deklaratsiooni prepended.

 
<?xml version="1.0"?> 
<!DOCTYPE advert SYSTEM "http://www.foo.org/ad.dtd"> 
<advert>
  <headline>...<pic/>...</headline> 
  <text>...</text>
</advert>

XML-Spetsifikatsioon predefines on SGML Deklaratsiooni XML, mis on fikseeritud kõigil juhtudel, seetõttu on kodeeritud sisse XML tarkvara, kuid te ei ole kunagi määratud eraldi (välja arvatud juhul, kui SGML/XML lülitatav validator nagu onsgmls: vt allpool).

Peter Flynn kirjutab:

Kui SGML Deklaratsiooni XML on eemaldatud teksti Spetsifikatsioon, kuid on olemas eraldi dokumendina). Sest see tähendab, et peame kannatama mõnikord bits-te või unustada teid, seal on koopia (WebSGML TC) ja siin (laiendatud Nimetamise Eeskirjad TC), samuti versiooni onsgmls siin.

Määratud DTD peab olema, et XML-protsessor kasutades URI tarnitud SYSTEM Tunnus, kas on kohapeal olemas (ie kasutaja juba on koopia kõvakettale), või mis on kättesaadavad võrgu kaudu. Pane tähele, et DTD nõuded peavad olema uri-sid (kohalikud, suhteline või absoluutne). Oma-unikaalne failisüsteemi otseteed (nt C:\dtds\my.dtd no Uri ei kasutata: kasutage file:///C|/dtds/a.dtd vormi asemel.

See on võimalik (paljud ütlevad parem) esitama Formaalne Avalik identifikaator PUBLIC märksõna, ja siis XML Kataloogis on samad, kuid Spetsifikatsiooni volituste SYSTEM, nii et see tuleb paigaldada pärast PUBLIC tunnus: enam märksõna on vaja. PUBLIC identifitseerimine kvaliteet, väita, et omanik lihtsalt id, mitte DTD ise (kuigi ion paljudel juhtudel, et on vaikimisi).

<!DOCTYPE advert PUBLIC	
   "+//Silmaril//DTD Foo Corp Advertisements//EN"
   "http://www.foo.org/ad.dtd"> 
<advert>...</advert>

Katse kehtivuse analüüsi, mis ei leia viga faili: peaks vastama täielikult mõisted, deklaratsioonid DTD.

XML-i (W3C) schemas ei ole tavaliselt seotud otseselt jooksul ja XML-dokument, näiteks DTD: vastav Schema (XSD) dokument, näiteks, on tavaliselt kindlaks määratud parser eraldi, või faili süsteem viide, või.

4.4: Mida teil on vaja kasutada DTD/Schema, atribuudid või elemente?
Vt http://xml.coverpages.org/elementsAndAttrs.html

Puudub ühtne vastus: palju sõltub sellest, mida te plaanite dokumendi liigile.

Traditsiooniline toimetuse tava tavalise teksti dokumendid on see, et tõeline teksti (mis oleks trükitud) kui märk andmete sisu, metaandmed (teave tekst) tunnused, kui ta võib kergemini olla isoleeritud analüüsiks või erilist kohtlemist, nagu kuvari servale, või vastasmõju:

<l n="184">
  <spara>Portia</spara>
  <text>The quality of mercy is not strain'd,</text>
  ...
</l>

Kuid süsteemi seisukohast, seal on midagi valesti, salvestades andmed teise suunda, eriti, kui maht teksti andmeid iga kord on suhteliselt väike:

<line speaker="Portia" text="The quality of mercy is not strain'd,">184</line>

Palju sõltub sellest, mida sa tahad teha sellist infot, mis on natuke lihtsam juurde pääseda iga meetod. Reegel on traditsiooniline teksti dokumente, kui nimetamisel on kõik ära võetud, paljas tekst on ikka õige, loetav, kuid võib kasutada ka siis, kui vormindamata ebamugav. Andmebaasi väljundit, aga ega muud masin loodud dokumentide, nagu näiteks e-kaubanduse tehingute puhul, inimese lugeja võib-olla ei ole mõtet, nii et see on väga võimalik, et dokumendid, milles andmeid atribuudid, kui dokument ei sisalda iseloomu andmete sisu mudelid. Vt http://xml.coverpages.org/elementsAndAttrs.html rohkem infot.

Mike Kay kirjutab:

Kasutaja: “[ … ] enamik ei kasuta element-põhine või atribuut põhinev xml? miks?”

Algajatele alati see küsimus. Need, kellel on vähe kogemusi oma arvamusi kirglikult. Eksperdid ütlevad, ei ole hea vastus. (http://lists.xml.org/archives/xml-dev/200006/msg00293.html)

4.5: Mis on muutunud vahel SGML, XML?
Rangemad süntaks ei ole võimalik.

Peamine süntaktilist muutus on see, et EMPTY elemendid DTDless dokumendid kasutada Null-Lõpp Tag trikk (nt <img src=”pic”/>), sest ilma DTD või Skeemi, ei ole nii, et analüütik teada, et ma ei oodanud lõppu-liikmed. Kui element, mille tüüp on deklareeritud EMPTY aastal DTD/Schema siis saab kasutada, või kokku lõppu-tag süntaks (nt <img src=”pic”></img>).

Teise süntaksi muutus on see, et kõik atribuutide väärtused peavad olema kindlaks määratud; ei ole minimeerimine atribuutide või elemendid; ja igal juhul-tundlik. Samuti on oluline, et mitu ATTLIST deklaratsioonid on lubatud, nii et see on sisemine osa, mida saab lisada atribuudid juba deklareeritud elemendi tüüp.

Peamised muudatused DTD-ga, saame anda teile. Mis on lihtsam, lihtsam kirjutada töötlemise tarkvara, suur hulk SGML xml deklaratsiooni valikud on alla surutud (vt loetelu vahelejäetud üksusi). Kõige suurem muutus sõnavara juhtimise juurutamine W3C Schema, mis võimaldavad tasandil content-type kinnitamine ei ole saadaval Dtds, on väljendatud ka XML-Dokumendi Süntaksi.

Peamine lisaks siin on nõuanded, mis võimaldab Schema ja dokumente eristada elemendi tüübi ja atribuut-tüüpi allikas (omandi, päritolu-või taotlus). See võimaldab teil elemendi tüüp, sama nimega, kuid eri tähendusi dokumendis, nt DocBook:laua-ja TEI:tabel. Pildi Nimi Alustada Iseloomu (koolon), XML-Nimed. Vaatamata oma klassifitseerimise, koolon kuvatakse ainult keskel nime, mitte alguses või lõpus eesliide xml: on reserveeritud.

4.6: ma saan Kasutada, JavaScript, ActiveX, jne XML-faile?
Ei XML-faili, kuid vahendusel stiililehe.

See sõltub sellest, millised valikud kasutajad brauser käivitab. XML on umbes kirjeldavad andmed; scripting keeled, põimitud funktsionaalsus on tarkvara, mis võimaldab teabe manipuleeritav kasutaja lõpuni, nii need keeled on tavaliselt koht, XML-faili, kuid style sheets, nagu XSL, CSS, skripti faile, Javascript, jne, kus nad võivad olla lisatud genereeritud HTML.

XML ise pakub võimalust määratleda xml, mida on vaja rakendada scripting keeled: neutraalne standard ei julgustab ega soovitab nende kasutamist, kuid ma ei saa eelistada ühte keelt üle teise, nii et seda on võimalik kasutada XML-salvestada programmi koodi, kust saate alla laadida (näiteks) XSLT ja uuesti väljendatud HTML-skripti element.

Serveripoolse skripti põimimine, nagu PHP või ASP, teil on võimalik kasutada serverit muuta XML-kood sõita, kui dokument, just nagu HTML. Autorid peaksid olema teadlikud sellest, et kinnistada serveripoolse skripti võiks olla, et fail on salvestatud, ei ole kehtiv XML: see kehtib ainult siis, kui töödeldud kätte, nii et tuleb olla ettevaatlik, kui valideerimine toimetajad või muud tarkvara käsitseda ega hallata selliseid faile. Paremat lahendust võib kasutada XML-teenindavad lahendus nagu Cocoon.

Kui teil on vaja kinnistada skriptid veebilehe, mis toodab alates XML, teil on vaja veendumaks, et kaks markup märgid < ja & või põgenenud, kuna &lt; ja &amp; vastavalt, või et iga skripti sisu on kinnine CDATA Jagu, nii et ma ei näe kui kasu.

4.7: te Saate kasutada Java loomiseks või haldamiseks XML-faile?
Muidugi.

Jah, iga programmeerimiskeel saab kasutada väljundandmed allikas XML-vormingus. Seal on üha rohkem front-end, back-end programmitöö keskkonnas ja andmete haldamise keskkonnad automatiseerimiseks. Java on kõige populaarsem hetkel.

Seal on suur keha vahevara (API) kirjutatud Java, muud keeled, andmete haldamine, või XML või XML väljundi või sisendi. Seal on suite Java õpetused (lähtekoodi, selgitus) saadaval http://developerlife.com/tutorials/.

Palun ärge posti sõbralik küsimusi toimetaja küsimusi oma Java programmeerimise vigu. Küsi Java uudistegrupi asemel.

4.8: Kuidas ma saan XML või andmebaasi?
Küsige oma andmebaasi tootja

Peaaegu kõik andmebaasi haldamise süsteemid pakuvad XML-i impordi ja ekspordi mooduleid selleks, et ühendada XML rakendused, andmebaasid.

Mõned triviaalne juhtudel on 1:1 mängu vahel väljade nimed andmebaasi tabeli punkt, tüüp nimetus, XML Schema või DTD, kuid enamikel juhtudel on mõned programmid on vaja selleks, et luua soovitud vaste. See on tavaliselt salvestatud protseduur, et seda kasutada lihtsalt käsib või palub vajalikud parameetrid.

Teise võimalusena kõige andmebaasi süsteemid pakuvad XML dump-vormingus, mis võimaldab teil eksportida tabeli, näiteks ümbritsevate väljade väärtused kategooria nime pärast välja nime. Näiteks-X-võta mysql käsk seda teha:

$ echo 'select * from news;' | mysql -X -u username -p password dbname

<?xml version="1.0"?>
<resultset statement="select * from news" 
           xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
  <row>
	<field name="id">1</field>
	<field name="stamp">0</field>
	<field name="title"></field>
	<field name="date">0000-00-00</field>
	<field name="time">test</field>
	<field name="description">News Engine test item 1</field>
  </row>
</resultset>
$

Vähem triviaalne, kuid siiski lihtne, juhul võid ekspordi aruande kirjutamisega rutiinne, et vormid väljund, kuna XML-dokument, lisades asjakohased sildid nagu literaale enne ja pärast iga andmete väärtus; ja teil võib importida kirjutades XSLT või sarnase ümberkujundamine, et vormindatud XML-andmeid laadida faili teie andmebaas on eelistatud vorm. Näiteks, järgmised andmed:

<news>
  <entry xml:id="N1" stamp="0" date="0000-00-00" time="test">
    <title></title>
    <description>News Engine test item 1</description>
  </entry>
</news>

sa võiksid omakorda MySQL avalduse lxprintf:

$ lxprintf -e entry \
  'INSERT INTO `news` VALUES (%s,%s,"%s","%s","%s","%s");\n' \
  'substring(@xml:id,2)' @stamp title @date @time description \
	mynews.xml

INSERT INTO “uudised” VÄÄRTUSTEGA (1,0,””,”0000-00-00″,”test”,”News Engine test item 1″);
$

Kasutajad andmebaasist või computer science tausta, peaks teadma, et XML-i ei ole andmebaasi haldamise süsteemi: see on text markup süsteemi. Kuigi seal on palju sarnasusi, mõned mõisted, üks on lihtsalt olematu muud: XML-i ei ole sellel mõned andmebaas-like funktsioonid samamoodi, et andmebaasid ei ole markup-nagu need. See on tavaline viga uskuda, et XML on DBMS nagu Oracle või Access ja seetõttu on ta sama rajatistele. See ei ole.

Andmebaasi kasutajad peaksid lugema artikli (Salminen ja Tompa, 2001) [tänu Bart Lateur tuvastada seda.] Ronald Bourret säilitab ka hea ressurss kohta XML-i ja Andmebaaside arutame native XML andmebaaside juures http://www.rpbourret.com/xml/XMLAndDatabases.htm.

Seal on mõned teavet XQuery (XQL) Keel märkus Otsivad.

4.10: Mis on nimeruumi?
Nimetatud DTD/Schema, või lauseosa, mis tehakse kindlaks URI (URL-i).

Randall Fowle ta ütleb:

Nimeruumi on kogumik element, atribuut nimesid nimetamata Uniform resource identifier viide. Viide võib tunduda, root element väärtus aus xmlns atribuut. Näiteks, nimeruumis viide XML dokument, mis on root element <x> näeb välja selline:

<x xmlns="http://www.company.com/company-schema">

Rohkem kui üks nimeruum võib ilmuda XML document, et võimaldada nimi, mida kasutatakse rohkem kui üks kord. Iga viide võib tunnistada prefiks, mida kasutatakse iga nime, et eelmises näites võib tunduda

<x xmlns:spc="http://www.company.com/company-schema">

mis näitab, et nimeruum “spc” eesliide:

<spc:name>Mr. Big</spc:name>

James Anderson kirjutab:

Üldiselt, pange tähele, et siduvad, võib olla täidetud ka siis, vaikimisi väärtus atribuut DTD-ga.

Viide ei ole füüsilise fail; see on lihtsalt viis, kuidas eristada nimeruumi. Viide peaksid ütlema isik vaadates XML-dokument, kus ma võin leida mõisted elementide atribuutide nimed, kasutades selle konkreetse nimeruumi. Ronald Bourret südametunnistus jääb Nimeruumis sõbralik küsimusi http://www.rpbourret.com/xml/NamespacesFAQ.htm.

4.11: Mida XML-i tarkvara on saadaval?
Tuhandeid programme: liiga palju loetleda.

Sajad, võibolla tuhanded programmid. Detailid on sisaldu enam seda KKK-d, sest see on nüüd liiga palju, või muutuvad liiga kiiresti, kursis: vt XML Web pages http://xml.coverpages.org/ vaata teadaanded meililistide ja uudistegruppide.

Üksikasjalik juhend mõned näited XML programmid ja mõistete taga, vaadake toimetaja raamat (Flynn, 1998). Mitmeid rakendusi võti XML töötlemise ja päringu keeles (XSLT2, XQuery, XSL:FO), kõige populaarsem, mis on ilmselt Saxon.

Üksikasjad mõned XML tarkvara tooteid hoitakse XML-kaas lehekülgi. Brauserid, vt küsimus XML, andmed xml-dev postiloendi tarkvara arendajatele. Bert Bos hoiab nimekiri mõned XML arengud Bison, Flex, Perl, Python. Viimase muundamise, ja rakenduste arendamisele mootorid nagu Omnimark, ja SGMLC kõik on XML-võime ja Api-d, mida ta pakub.

XML Toimetajad
Valides editor on üks raskemaid ülesandeid, sest kõik on erinevad nõuded ja teadmiste tase, mis tundub uskumatult lihtne, et üks kasutaja võib tunduda dauntingly raske teine. Iga XML-muuda juhiseid kasutaja ehituse või hoolduse XML dokumendid — see on nende elu eesmärk.

Lihtsaim neist lihtsalt jälgida õige teravanurgeliste sulgudes, start-sildid, lõpp-sildid, ja tasakaalustatud hinnapakkumisi, mis on hästi arenenud faili. Võimsam toimetajad saab lugeda DTD või Skeemi, menüü valik, toote manipuleerimine, ja atribuudi muutmiseks või takistada loomine kehtetu dokumendid. Tugevaim, mida saab kasutada DTD või Skeemi väljatöötamine ja XML töötlemine, XSLT või XSL:FO.

Mõned text-mode toimetaja — et näidata nii märgistus ja tekst on midagi peidetud, sageli kasutades värv eristada markup märki, taandus näidata struktuuri. Kõige toimetajad on sünkroonne typographic mode, style sheet kasutades format display, nii et tundub, et toimetamine on täiesti tühja ruumi, et vaadata dokument (nimetatakse sageli WYSIWYG, kuigi tegelikult pole). Teksti režiimis toimetajad muretse, mõned kasutajad, sest teravanurgeliste sulgudes on nähtav (ma arvan, programmeerimine); sünkroonne typographic toimetajad muretsema teised inimesed, sest teravanurgeliste sulgudes ei ole nähtavad, mistõttu on raske näha, kus asi algab või lõpeb.

Rohkem kogenud toimetajad on programmeeritav nii, iseloomu ja mõju määramine ja kasutaja meetmed võivad olla piiratud või suurendada skriptid, JavaScript, VBscript, Python, Tcl, Lisp, jne; või XSLT.

Ärge kiusatus kasutada mitte-XML editor nagu Notepad, vi, või teksti toimetaja XML dokumendid: ainult lõppu, viha, süüdistused. Õigesti varustatud. (Microsofti eraldi XML Notepad toote saab kasutada redigeerimise väike juhtudel, kuid mitte DTD või Schema väljatöötamine.)

Wikipedia võrdlus toimetajad http://en.wikipedia.org/wiki/Comparison_of_XML_editors kuid ei, ei anna kvaliteetset teavet. Seal on vana (2004) võrdlev raamatu valimine on XML editor Thijs van den Broek, mis võib aidata meetod, kuigi kaup ei ole voolu.

Seal on lehekülg, kasulikke linke XML-kasutajad hollandis http://xml.beginthier.nl/.

Teave arendajatele Hiina XML-süsteeme võib leida Hiina XML Nüüd! veebilehel Academia Sinica: http://www.ascc.net/xml/ See leht sisaldab kontrollkatse faile.

4.12: Tarkvara puudub
Kasulikud programmid, et saada sind minu silmis

Ilmselt palju kasulikku, produktiivne programmid, see läinud. Mõnikord, firma lihtsalt pankrotti läks ja kadus; mõnikord see oli era-või avatud lähtekoodiga ettevõtja, et autor pidi lahkuma; mõnikord (halvim), firma võttis üle teine firma, kus ma tõesti ei tea, XML, nii et ostsin teise, mis ei ole trükitud tooteid, sai abandonware.

See on nimekiri, mida me teadsime, kuid ei armastan seda, kuid mõnel juhul isegi installiketas, on tarkvara endiselt ellu viia, kuna vastava (vananenud) platvormi.

Lähedal Ja Kaugel (Micros Päritolu)
Graafiline SGML DTD-disain programmi Windows 95, mis ma just tegin, et XML-era (võib-olla eksportida XML-deklaratsiooni Süntaks, kuid ma ei saa importida). See on tähelepanuväärne eelkõige kasutusmugavus, samuti kenasti kujundatud interaktiivne diagramming struktuuri teie dokument (ikka kasutatud paar fännid dokumendid).

DynaText/DynaTag/DynaWeb (Elektrooniline Raamat, Tehnoloogia)
Komplekt Windows 95/NT tarkvara, mis on XML andmebaasi, web server teenindab HTML, see võib olla see, et Wordi dokumente.

Kõige olulisem oli, DynaTag, mille importimine Wordi dokumenti ja määrab proovid (mitte-XML) xml), mis on ühendatud elemente, ad-hoc väljund XML-dokument. Valitav kasutaja poolt kaardistamisel me teile lase sind elementide loetelu on tõeline loetelu, ja üldiselt võidelda oma teed läbi jama Sõnad .doc failid toota tagged väljundi. See võib olla post-töödeldud ja vastama tuntud DTD. Piisavalt näiteid, samuti ehitatud Wordi faili, see võiks olla, et lasen kogu kollektsioon massi muutmine.

Microsoft SGML Autor Sõna
Oma nimest hoolimata ei ole toimetaja kuid converter. Kasutada kaarti Sõna stiile, et SGML markup on tõesti võimalik, et ümmarguse a lossless muutmine. Lepingute eesmärk kogukondi, kes kas ei saa või ei taha õppida, et autor või toimetaja, SGML, siis see on lubatud, autoriõigus Sõna, ja toimetamine XML, siis dokumendiga, et muuta see tagasi, et autor re-edit. Ilmselt ruut punkt on leping, ei toeta Microsoft, kuid isegi oma helpdesk ma ei usu, et oli reaalne.

Panorama (SoftQuad)
Plugin Netscape ‘ i, et võimaldada XML lingid viidatud stiililehe (mis töötas veatult, pärast heli imelik viide). See on lõpuks HyTime kaks-viis lingid, postitada linke moliets.

Saadaval ka Panorama Kirjastaja, sisuliselt laiendatud versioon, enese vormis suuremahulise dokumendi avaldamist. Laaditabeli redaktori akna, mis on endiselt üks parimaid näiteid interaktiivne stiilis manipuleerimine.

Autor/Toimetaja (SoftQuad)
Üks esimesi tõeliselt sünkroonne typographic toimetajad jaoks SGML (XML, hiljem kehastus, kui Xm). Laialdane kasutamine on aastaid koos lihtsustatud vend, HoTMetaL.

4.13: Mis on info? ANDMETE või DOKUMENDI?
See sõltub sellest, mida te kasutate.

Mõned oluline erinevus nende kahe vahel on peamised klassid XML rakendused, samuti viisi, kuidas neid kasutatakse.

Kaks klassi rakendused on tavaliselt nimetatakse “dokument”, “data” – rakendused ning see kajastub tarkvara, mis on tavaliselt (kuid mitte alati), mille eesmärk on ühte liiki või muud.

Dokumendi-style rakendused
Need on nagu traditsiooniline kirjastajate tööd: tekst ja pildid struktureeritud keskkonnas, fonte, vormindamise. Enamikul juhtudel see hõlmab veebilehti, samuti materjali, mis on mõeldud PDF-või print raamatud, ajakirjad. Glasgow dokumendi rakendusi, see on raske kasutada Segatud Sisu (nt alam-elementide teksti).

Data-style rakendused
Need on enamasti e-kaubandus, internet, teenuse, protsessi või rakenduste kontroll, XML on kasutatud konteiner salvestatud teave või suri süsteemide vahel, tavaliselt vormindamata, nähtamatud inimesed. Iseloomulikuks tunnuseks on see, et puudub Segatud Sisu, levimus numbriline või kategooriline andmeid.

On ka kolmas oluline valdkond, veebidisain, kelle nõuded on sageli hübriid, ja span funktsioone, kõiki dokumente ja andmeid, rakendusi, sest need sisaldavad osaliselt staatiline kirjeldavat teksti ja osaliselt dünaamilisi andmeid.

Kuigi teoreetiliselt oleks võimalik kasutada data-klassi tarkvara romaani kirjutada, või dokument-klassi tarkvara, et luua arveid, ilmselt tõsiselt optimaalne. Sest laadi teavet, mis on kaks klassi, data-klassi rakendused kipuvad kasutada Skeeme, dokumendi-klassi rakendused kipuvad kasutama Dtds, kuid seal on olulisel määral kattuvad.

Kuidas XML-i kasutatakse seda kaks klassi on ka jagatud kahte ossa: XML saab kasutada käsitsi või programmi kontrolli.

Kasutaja juhend
See tähendab, muutmine, hooldus failide redaktor, klaviatuur, näe teavet ekraanil, just nagu sina. See sobib üksikute dokumentide, eriti kirjastamise valdkonnas, veebilehtede arendajad töötavad teatud juhtudel, näiteks proovi faile või veebilehe malli. Käsitsi töötlemine tähendab ka, töötab tootmise programme, nagu vormindamistööriista, muundurid, andmebaasi päringuid üks-üks alus, klaviatuur ja hiir tavapärasel viisil. Tarkvara käsiraamatu kasutamine saab käivitada käsurealt, mis võimaldab teil lihtne-kuni kasutamist, ühtse taotluste ja varjatud rakendusi nagu Veebi skripte.

Programmeeritav kasutada
See tähendab, et kirjutada programme, mis on tarkvara teenuseid, Apis, raamatukogud, või võrk hakkama XML-failid jooksul programmi. XML-failid, andmete, rakenduste peaaegu kunagi ei ole toimetanud poolt. See on tavaline meetod tegutsevad e-kaubanduse rakendustele, web automaatika, web services ja muu protsessi või taotluse kontrolli. On olemas raamatukogud, Apis paljude keelte, sealhulgas Java, C, C++, samuti tavaline skriptimine keeli nagu Python, Perl, Tcl, Ruby jne.

Lisaks sellele, et need suunad on praegu kahel erineval viisil töötlemise XML -, mälu-kaardistatud või sündmus-käivitab tavaliselt nimetatakse nimed, nende originaal instantiations, Document Object Model (DOM) ja Simple API for XML (SAX), vastavalt. Mõlemad mudelid põhinevad dokumendi engineering põhineb puu struktuuri hierarhilist dokumendi xml tuntud Grove (kogumine puud, tegelikult mälu kaart analüüsi tulemusel dokumendi xml). Selle mudeli puhul on iga ‘node’ (kirje teave) välimise elemendi alla läbi iga elemendi atribuut igale tähistamata teksti on võimalik kindlaks teha. Rakenduste puhul, kasutades Schema, Post-Schema-Validation Info (PSVI, samaväärne grove) on kindlaks määratud, mis määrab, millist teavet parser peaks tegema saadaval, et rakendus.

Joe Fawcett kirjutab:

(artikkel <eFIrHKtCGHA.2920@tk2msftngp13.phx.gbl>)

Ühesõnaga, “node” on üldine termin mitut liiki XML-ehitusplokid, sealhulgas element: <myElement/>; määrata: <myElement myAttribute=”myValue”/>; text node: <my Text Node>

On märkusi [Kommentaar deklaratsioonid], Töötlemiseks Juhiseid ja nähtamatu Dokumendi Sõlm esindab juur XML-dokumendi, samuti teised.

Äärmiselt oversimplified, DOM-põhine rakendus loeb kogu XML-dokumendi mällu ja seejärel annab programmeeritav juurdepääs iga sõlme iga puu grove; SAX-põhine rakendus loeb XML dokumendi, samuti sündmusi, mis on põhjustatud sündmus sõlmed nagu nad juhtuvad, mille puhul eeskirjade või tegevus on eelnevalt programmeeritud. (Tegelikult see on keerulisem kui, et kõik meetodid on palju ühiseid mõisteid ühist).

Mõlemad mudelid pakuvad abstraktse API ehitamiseks, juurdepääsu, ja XML dokumente. Siduv abstraktne API konkreetse programmeerimiskeele annab konkreetse API. Müüa konkreetse Api-sid, mis on ühe või teise meetodi pärida ja manipuleerida XML dokumente. Mõlemat tüüpi analüüsi on rakendatud paljudes keeltes ja vastavalt paljude operatsioonisüsteemide liideste. Olemas sõbralik küsimusi nii DOM ja SAX.

4.14: Sa pead muutma server tarkvara tööd XML?
Veenduge, et server saadab XML-faile, nagu text/xml

Kui teil on lihtsalt ootab staatilisi faile. ainus muutus, see on vajalik, et kontrollida, kas server teenindab .xml, .css .dtd .xsl, mis muud tüüpi fail, mida saab kasutada, kui õige MIME (meedia) tüüp.

Andmed, seaded RFC 3023. Populaarne server tarkvara nagu Apache HTTPD juba teame seda.

Kui sul ei ole, kõik, mis on vajalik, et muuta mime-tüüpi faili (või samaväärne): server käitaja sa juba tead, kus see on, eks?) ja lisada või muuta vastavate ridade õige meedia tüüpe. Mõned serverid (näiteks Apache), individuaalne sisu pakkujate või kataloogi omanikud saavad muuta MIME tüüp teatud failitüübid jooksul oma kataloogi, kasutades direktiivid .htaccess faili. Meedia tüübid on nõutav:

  • text/xml-XML-dokumente, mis on “loetav casual kasutajad;
  • application/xml-XML-dokumente, mis on “loetamatu vabaaja kasutajad”;
  • text/xml-external-default-osakute välise tõlgendamine üksused, nagu dokumendi killud (nt eraldi peatükid, mis on raamatuga), kus loetavuse vahet text/xml;
    application/xml-external-default-osakute välise tõlgendav teema üksus,
  • loetavust erinevus, application/xml;
  • application/xml-dtd DTD-ga faile moodulid, sealhulgas iseloomu üksus seab.

RFC on muid soovitusi kasutamise kohta +xml-meedia tüüp sufiks identifitseerimiseks lisateenuste faile, nagu XSLT (application/xslt+xml).

Kui skripte käivitada teeniva XHTML, milles te soovite pidada XML, mitte HTML, teil tuleb võib-olla kohandada, et toota asjakohase Dokumendi Tüübi Deklaratsioon, samuti asjakohaseid meediakanaleid tüüp, kui taotlus peavad olema valideeritud.

4.15: kas ma saan Kasutada server-side salvestamine?
Jah, lihtsalt veenduda, et toodang vastab XML

See töötab nii kaua, kui me toodame lõpuks, sest osa XML-vastab faili (st kas kehtiv või lihtsalt hästi arenenud).

Server-side member-asendada skriptimine keeles, nagu shtml, PHP, JSP, ASP, Zopa, jne salvestada peaaegu kehtiv-faile, kasutades kommentaarid, Töötlemiseks Juhiseid või XML-märgistust, mis saab asendada punktis teenuse tekst-või XML-märgistust (kui see ei ole selge, miks mõned neid süsteeme kasutada mitte-HTML/XML-märgistus). Samuti on XML-põhine eeltöötluse formaadid, nagu xv hästi (eXtensible Väärtus Resolutsioon Keeles), mille lahendamiseks spetsialiseerunud viited välistele andmete väljund a normaliseeritud XML-faili.

4.16: (autor) kasutage alati kliendi poolel, salvestamine?
Jah, lihtsalt veenduda, et toodang vastab XML

Sama reegel kehtib siis, kui server-side salvestamine, seepärast on vaja tagada, et varjatud koodi, mis on üle kantud kolmandale osapoolele mootori (nt kõned SQL, VB, Java, jne.) ei sisalda ühtegi märki, mida võib tõlgendada kui XML-märgistust (ie nr nurgikuid või ampersands). Või kasuta CDATA tüüp tähistatud punktis, et vältida oma XML kohaldamise analüüs varjatud koodi, või kasutada standard &lt; või &amp; iseloomu üksuse viited asemel.

4.17: ülevaade XML-manager/client/investor/advisor. Milline peaks olema mainitud?
Mittekaubanduslik mitmeotstarbeline paindlik markup

Tad McClellan kirjutab:

  • XML ei ole markup language. XML on “metalanguage’, mis on, see on keel, mis võimaldab teil määrata oma markup keeled (vt määratlus).
  • XML on markup language [kaks (ilmselt) vastuolulisi avaldusi üksteise järel, tähelepanu-haardeseadised seade, et ma armastan], ei ole programmeerimiskeel. XML-andmeid: mitte midagi tegema, et asjad.
  • XML on mittekaubanduslik: andmed ei ole pantvangis keegi teine.
  • XML võimaldab multi-purposing andmeid.
  • Hästi kujundatud, XML rakendused enamasti eraldi “sisu” “välimus”. Ma peaks olema kirjeldatud, mis see oli, pigem midagi, mis näeb välja nagu (v.a numbritega väljendatud kategooriline või andmete sisu, mis ei ole kunagi esitatud inimest).

Öelda, et andmed on XML on suhteliselt mõttetu avaldus, mis on sarnane öelda, et raamat on loomulik keel”. See oleks kasulik, endine vaja täpsustada, “meil on kasutada XML-i, et määrata oma markup language” (ja öelda, mis see on), mis on sarnane, mis määrab raamat Prantsuse.

Klassikaline näide multi-purposing, lahuselu, et ma kasutavad sageli on ravimitootjale. Seal on suur alus andmete, eelkõige narkootikumide, mis peaksid olema avaldatud:

  • aruanded FDA;
  • uimasti info-kirjastajad narkootikumide kataloogid/kataloogid;
  • “ette näha mind!” brošüürid saata arstid;
  • väike tükk paberit koguda kasti;
  • etikett pudelid;
  • kaks lehekülge fine print jälgida oma reklaami Reader’s Digest;
  • juhised patsiendile, et kohaliku apteekri prindib välja;
  • jne.

Ilma eraldamine sisu, esitusviis, mida nad vajavad, et säilitada sisuliselt identsed teabe 20 koha. Kui nad ei pane koht, inimesed surevad, advokaadid rikas, narkootikumide firma saab vaene. XML (või SGML), nad väidavad, seeria hoolikalt kontrollitud teavet, ja kirjutada 20 programmi või programmi 20 väljund (Ed)] väljavõte ja vormindamine iga taotluse. Samal 20 programmi saab rakendada sadu narkootikume, mida nad müüvad.

Web arengu valdkonnas, mis on suurim asi, mis XML pakub määrata, mis on valesti HTML:

  • brauserid võimaldavad nõuetele mittevastava HTML esitatakse;
  • HTML on piiratud ühe-märgise (edaspidi silte).

Kui olete lasknud katki HTML töö (esitada), siis puudub ka motivatsioon parandada. Veebilehed seetõttu sildi supp, mis on kasutud edasiseks töötlemiseks. XML-määrab, et töötlemine ei saa edasi, kui XML ei ole õige, seejärel jätkama tööd, kuni ta vastab. See on rohkem tööd, kuni ees, kuid tulemus ei ole ummiktee.

Kui ma tahtsin, et valida nimede asja: inimesi, kohti, ettevõtted, jne selles, HTML, sa ei pea palju valik, mis võimaldab neid eristada. XML võimaldab nimi asju, mida nad on:

<person>Charles	Goldfarb</person> worked at <company>IBM</company>

annab teile paindlikkuse, et sa ei ole HTML:

<B>Charles Goldfarb</B> worked at <B>IBM</B> 

Koos XML-sa ei pea kinga-sarv sinu andmed), mis piirab sinu võimalusi.

4.18: On olemas conformance test suite XML-protsessorid?
Jah, seal oli: https://www.oasis-open.org/committees/tc_home.php?wg_abbrev=xslt

James Clark on kogumik katse puhul katsetamiseks XML ąvé esitatud http://www.jclark.com/xml/ mis hõlmab vastavuse katse kanooniline XML’.

Carmelo Montaneza kirjutab:

NIST välja töötanud mitmeid XSLT/XPath testid, mis on osa euroopa liidu OASIS XSLT/XPath suite (avaldamata). Oodatavad tulemused võivad erineda natuke üks rakendamise teisele. OASIS XSLT tehnilise komitee lahendus probleemile, kuid uuringud ei ole veel rakendada sellist lahendust. Palun edastada mis tahes kommentaare carmelo@nist.gov.

Jon Noring kirjutab:

Neile, kes on huvitatud, võtsin praegune ja täielik Unicode 3.0 “loo” tegelased ja nende hex koodid ja loonud lihtsa XML-dokumendi testida XML-i brauseritega Unicode i vastavust. Ole valmis — vaja teha märgib, et määrata display-rtl märgid (ie heebrea, araabia). See asub: http://www.windspun.com/unicode-test/unicode.xml. See on päris suur, peaaegu 900 on suurusega, nii et olge valmis. IE5 paljud tegelased XML document, ja ka, sest see, tundub, et see on nõuetekohaselt kaitstud. Ma ootan, et kui Opera on samamoodi. Ma ei ole testitud praeguse versiooni Mozilla/Netscape Unicode i vastavust.

4.19: sa oled juba sain SGML DTDS: kuidas teisendada need XMLI?
Muuda käsitsi või kasutada tarkvara, nagu Lähedal+Palju Disainer.

Mitmed projektid on teisendada ühise või populaarne SGML Dtds XML-formaadis (näiteks nii TEI DTD-ga (Lite, full versioonid) ja DocBook DTD on saadaval nii SGML, XML, Schema ja DTD formaadis).

Seán McGrath kirjutab:

Teisendada SGML DTDS XML:

  1. Samaväärne SGML Deklaratsiooni. Nii märksõnad, character set jne on sisuliselt fikseeritud;
  2. Silt minimeerimine ei ole lubatud, nii et <!ELEMENT x – O (A,B)><!ELEMENDI X (A,B)> ja <!ELEMENT x – O EMPTY> ei <!ELEMENT X EMPTY>;
  3. #PCDATA peab toimuma ainult siis, äärmuslik vasakule (st esimene) VÕI mudeli, nt <!ELEMENT x – – (A|B|#PCDATA|C)> (SGML) muutub <!ELEMENT x (#PCDATA|A|B|C)*>,<!ELEMENT x (A,#PCDATA)> on ebaseaduslik;
  4. Ei CDATA, RCDATA on elemendid [deklareeritud sisu];
  5. Mõned SGML atribuuditüübiga ei ole lubatud XML-nt. NUTOKEN;
  6. Mõned SGML atribuut vaikeväärtus on ei ole lubatud XML-eg CONREF ja CURRENT;
  7. Kommentaare ei saa mitte deklaratsioone.
    <!ELEMENT x - - (A,B) -- an SGML comment in a declaration -->
  8. Hunnik SGML lisavarustusele ei ole olemas XML: kõik vormid sildi minimeerimine (OMITTAG, DATATAG, SHORTREF, jne.); Link Protsessi Mõisteid; Mitu DTD iga dokumendi; ja palju muud: vaata http://www.w3.org/TR/NOTE-sgml-xml-971215 nimekirja bitti SGML, mis olid eemaldatud XML;
  9. [Ligi] last but not least, ei CONCUR!
  10. Seal on mõned olulised erinevused sise-ja väline osa osa XML DTD: Tähistatud Lõigud saab toimuda ainult välise subset; ja Parameeter Üksused on vaja asendada kogu deklaratsioonid sisemine osa on osa DTD, nt pärast on invalid XML:
     
    <!DOCTYPE x [ 
    <!ENTITY % modelx "(A|B)*"> 
    <!ELEMENT x %modelx;> 
    ]> 
    <x></x>
    

    Lisateavet, McGrath (1998).

4.20: Kuidas ma saan lisada üks DTD (või fragment) teises?
Kasutada parameeter üksus, nagu SGML

See töötab täpselt sama XML. Esiteks, määrata soovitud üksus, mis sisaldab viite nimi parameetri (majandus) üksus:

<!ENTITY % mylists SYSTEM "dtds/listfrag.ent"> 
... 
%mylists;

Sellised deklaratsioonid traditsiooniliselt top peamisi DTD faili, kus seda saab ravida, ning seda tuleks säilitada, kuid see ei ole tingimata vajalik, kuni need on välja kuulutatud enne, kui nad on kasutatud. Kasutada Parameeter Üksus, Süntaks (protsenti märk), sest fail sisaldab DTD tõlkimise ajal, kui dokumendis, näiteks, oma tõlgendus.

Pane tähele, et URI on kohustuslik XML-Süsteemi identifikaator kõiki väliseid viiteid: standard eeskirjad dereferencing URID kohaldata (eeldades et sama meetodit, server, ja kataloogis kui sisaldava dokumendi). Formaalne Avalik identifikaator võib olla ka kasutatud, järgides samu reegleid nagu mujal.

4.21: Kuidas lisada tingimuslik avaldus XML?
Mulle ei meeldi: XML ei ole programmeerimiskeel.

Mulle ei meeldi: XML ei ole programmeerimiskeel, et sa ei saa öelda asju nagu:

<foo if{DB}="A">bar</foo>

Kuid teil võib olla tingimuslik kriteeriumid  Schema, DTD või volitatud töötleja ja DTD tagada, et atribuutide tingimisi töötlemine.

Kui teil on vaja teha element, vabatahtlik, põhineb mõned sisemised või välised kriteeriumid, siis  Schema. Dtds puudub sisemine viitavat mehhanismi, nii et ta ei saa väljendada, et selline tingimuslikkus a DTD iga elemendi tasandil.

See on võimalik väljendada olemasolu või puudumise kohta, tingimuslikkus a DTD kogu dokument, kasutades Parameetrit Üksuste Loogika lülitid lisada või ignoreerida teatud lõikudes DTD põhineb seaded kas hardwired selles DTD või esitada, kui sisemine osa. Nii TEI, Docbook DTD kasutatakse seda mehhanismi, et teha moodulitest.

Teine võimalus, mida saate teha, kui element on täielikult vabatahtlik DTD või  Schema, ja esitama kood töötlemise tarkvara, mis kontrollib olemasolu või puudumise. Enamus kontrolli kuni töötlemise etappi: üks põhjusi, miks Mustreid, mis pakuvad seda liiki kontrolli ajal dokumendi loomine või muutmine.

Töötlemise keeltes, nagu XSLT, seal on skeemid eest tingimisi töötlemise, samuti eksklusiivne juhtumi otsused:

<xsl:if test="@foo='bar'">
  <xsl:text>Hello, world!</xsl:text>
</xsl:if>

<xsl:choose>
  <xsl:when test="$type=1">
    <xsl:apply-templates select="//*[@class='special']"/>
  </xsl:when>
  <xsl:when test="$type=2">
    <xsl:apply-templates select="/foo/bar"/>
  </xsl:when>
  <xsl:otherwise>
    <xsl:apply-templates/>
  </xsl:otherwise>
</xsl:choose>

DocBook ja palju muud DTD ja Schema pakkuda atribuudid mõned elemendid spetsifikatsioon effectivities, öeldes, milline osa dokumendist kohaldatakse mis asjaoludel. Töötlemise tarkvara saab siis eraldada need ja töödelda neid vastavalt.

4.22: kuidas XML, EDI?
Lähenemine: vajab veel tööd, leping.

Elektroonilise andmevahetuse on juba kasutatud e-kaubanduse aastaid dokumentide vahetamiseks vahel äripartneritega tehingu. Nõua erilist, varalise tarkvara, on üle jõu käivalt kallis väike-ja keskmise suurusega ettevõtetele. Seal on käigud, et võimaldada EDI dokumentide reisida sees XML-i, ja samuti ettepanekutega, mis asendab olemasolevaid EDI formaadis XML. Seal on juhendid http://www.eccnet.com/xmledi/guidelines-styled.xml s http://www.geocities.com/WallStreet/Floor/5815/guide.htm.

Võib-olla suurim mõju EDI on tõus standardimise katsed XML-äridokumente ja-tehinguid. Standard ühiselt sponsoreeritud OASIS ja Üro/CEFACT, et ebx edastada? (Electronic Business XML), mis annab Schemas ühise kaubandusliku tehingu dokumendi tüüpi. Normaalne office i dokumente (kirjad, aruanded, tabelid jne.), juba kasutatakse materjalide alusel tasu OASIS Open Office XML-Vorminguid, TC, üksikasjalikult kirjeldatud eespool. Muude standarditega, nagu valge tasakaal, rosetta lugu alusel koostalitlusvõime katsete ebx üleandmise ml.

Lisaks täielik standardid, mitu komplekti shims, koostalitlusvõime, mis võimaldavad vahendid, osa raamatukogude selline XML Ühise Äri Raamatukogu (XML Ühise Äri Raamatukogu – xCBL).

Jagu 5: Lisad

5.1: Viited
Seal on palju suurem XML ja SGML kirjandus kohta http://xml.coverpages.org/biblio.html.

See loetelu hõlmab üksnes neid dokumente, mis on otseselt viidatud käesolevas sõbralik küsimusi.

Viited

Bray, Tim; Jean Paoli; CM Sperberg-McQueen; Eve Maler; ja François Yergeau [toimetajad:] (2004) Extensible Markup Language (XML) 1.0, Boston : W3C.
DuCharme, Bob (1999) XML: The Annotated Specification, Upper Saddle River, NJ : Prentice Hall PTR, ISBN 0-13-082676-6.
Ensign, Chet (1995) ‘If SGML Is So Smart, How Come It Ain’t Rich?’. In Proc. SGML’95, Boston, MA, Detsember 1995.
Flynn, Peter (2014) Formatting Information: An introduction to typesetting with LATEX, Cork, Ireland : Silmaril Consultants.
Flynn, Peter (1998) Understanding SGML and XML Tools, Boston, MA : Kluwer, ISBN 0-7923-8169-6.
Flynn, Peter (1995) ‘Making more use of markup’. In Proc. SGML’95, Boston, MA, Detsember 1995.
Lamport, Leslie (1994) LATEX: A Document Preparation System, Reading, MA : Addison-Wesley, ISBN 0-201-52983-1.
Maler, Eve ja Jeanne el Andaloussi (1995) Developing SGML DTDs: From Text to Model to Markup, Upper Saddle River, NJ : Prentice Hall PTR, ISBN 0133098818.
McGrath, Seán (1998) XML by Example: Building E-Commerce Applications, Upper Saddle River, NJ : Prentice Hall PTR, ISBN 0139601627.
Pawson, Dave (2002) XSL-FO: Making XML Look Good in Print, Sebastopol, CA : O’Reilly, ISBN 0-596-00355-2.
Salminen, Airi ja Frank Tompa (2001) ‘Requirements for XML Document Database Systems’. In Proc. ACM Symposium on Document Engineering, Atlanta, GA, November 2001.
Sperberg-McQueen, Michael ja Lou Burnard [editors] (2002) ‘Gentle Introduction to XML’. In ‘TEI P4: Guidelines for Electronic Text Encoding and Interchange’, Oxford, Providence, Charlottesville, Bergen : Text Encoding Initiative Consortium.
Truss, Lynne (2003) Eats, Shoots & Leaves: The Zero-Tolerance Approach to Punctuation, London : Profile Books, ISBN 1-86197-612-7.

5.2: Kui palju on meil läheb?
Infinity liiga!

Otsinguvahend käesoleva sõbralik küsimusi on juba andnud huvitavaid tulemusi, teated, mõlemad sobivad ja mitte sobivad. Sugu vähendada 10 koht.

  • Kõige levinum taotluse (5% üldine) üksikute märkide või märgi üksus, nimed või arvulisi väärtusi või markup sümboleid (< ja &).
  • Viimastel kuudel on suuruselt teine kategooria on stabiliseerunud sõna dtd (3%).
  • Kolmas tuleb CDATA 2% (vaevalt üllatav, kuna kuritarvitamise nii laialt levinud).
  • Neljas on võrdne 1% – tulge XSD-ja XSL, kumbki mis on suunatud täpsemalt siin, sest nad on oma sõbralik küsimusi.

On lõbus bitti on sügaval saba, nagu Broomfield, CO, kes sisenes, Kuidas analüüsida telefoni selle paremaks mõistmiseks on?” (arvestades, et tükid on ilmselt alustada); Filipiinid, kes tahtsid teada, kuidas kirjeldada viie põhilise vastasmõju, röntgeni, Gamma-kiirte eest koos asja (proovige DS9); Culver City, CA, kes küsis, kuidas on echinodermata organismid erinevad madalama selgrootud? (nagu ma hoolin?); üks Lexington, KY, kes küsis: “Kuidas ma lisada kaks teksti väljad on?” (seal, d00d, kuidas sa korrutad a salat, kurk?).

Kuupäev: Reede, 09 Jul 1999 14:26:17 -0500 (EST)
A: Internet Oracle <oracle@cs.indiana.edu>
Teema: Oracle vastused!
Et: <Aadress-eemaldatud>
X-Planation: X-Face saab vaadata ftp.cs.indiana.edu:/pub/faces.

Internet, Oracle ka asjaomase küsimus
sügav. Küsimus oli:

> Oh Oracle kõige tark, kõik-näe, teadja,
> teie tarkus mulle vastused minu palve:
>
> XML on sinep?

Aga vastuseks, et Oracle:
Noh, kuna XML on osa SGML, SGML
seal on <lõigata sinep> tag, ma ütleksin jah.

Sa võlgned Oracle a B1FF analüüs.

Kui SGML-uudishimulik seas meie lugejad, et:

<!element cut - o empty>
<!attlist cut mustard (mustard) #required> 
<!-- 🙂 --> 

5.3: XML-Sõbralik küsimusi
Harva Kippuvad Küsimused

See on nimekiri teemadest, mida inimesed on küsinud või otsiti seoses XML Sõbralik küsimusi, mis ei pruugi olla otseselt seotud XML, samuti tehnoloogia ega ka korduma kippuvad küsimusi. See sisaldab ka mõningaid fall-back mõisted kasuks kasutajaid, kes on tulnud, et XML-teistmoodi ei peaks olema dokument, kirjastamine taust.

Lugejad võivad ka soovite vaadata Joe inglise keeles “Mitte SGML FAQ” http://www.flightlab.com/~joe/sgml/faq-not.txt.

AJaX
Asünkroonne HTTP, Javascript, XML-i. Tehnikat parandada suhtlemis-lehtede, mis brauser skriptimine avastatud kasutaja tegevuse või pre-allalaadimine vajalikud andmed asynchronously saadab XML-põhine andmed-pood, selle asemel, et oodata, kuni kasutaja klõpsab lingile, paludes tal ka serverist.

Omadused
Need on elemendid, metaandmete või meta-info (teave teave), mis on lisatud start-silt objekti. Tavaliselt atribuudid on nii täpsustamiseks aruande funktsioon, või muud kvaliteetset punkt. Nad on kujul nimi, noteeritud väärtus liitunud poolt, võrdub märk.

 
<part xml:id="B22" catnum="51N1573R" level="App">Left-handed
      Screwdriver</part> 

Atribuutide nimed peavad järgima XML-eeskirjad Nimed (vt spec). Kui taotlus ei kasuta DTD või Skeemi, atribuudi väärtusi käsitletakse tekstina (CDATA) , teil ei ole mingit erilist tähendust, XML (välja arvatud xml:id, xml:lang, vt allpool). DTD-ga või Skeemi, atribuudid võivad olla määratud datatype, kõige levinum, (DTD terminoloogia lihtsus):

ID-kaardi või IDREF
ID atribuudi väärtused peavad olema XML Nimed (ilma tühikuteta; peab algama tähega) peab olema unikaalne dokument. On IDREF atribuudi väärtus võib ilmneda ükskõik mitu korda, kuid see on väärtus, ID atribuut sama dokumendiga. ID IDREF kõige sagedamini kasutatakse rist-viidatud dokumentides.

Pane tähele, et ID-atribuut võib olla mis tahes nimi: see ei pea nii-öelda “ID”, kuigi sageli. Seevastu — nagu tegelikult, parim tava — mitte kunagi ei tohi kasutada nime “ID” (“id”) on atribuut, mis ei ole tüüp, lihtsalt sellepärast, et see on segane. Kui taotlus on unikaalsed identifitseerimisandmed väärtused, et ühendus nõuab Id-d, mis ei ole XML-Nimed, kas nimi atribuudi midagi erinevat (nt Toote-ID’) või dokumendi tugevalt, et väärtus ei ole XML-ID.

Seal on W3C Soovitus, dokumendi tüüp disainerid peaksid kasutama atribuudi nimi xml:id, mida saab tõlgendada ąvé kui kordumatu tunnus, ilma dokumenti kasutades DTD või Schema.

CDATA
Ainult tekst.

Token Nimekirja
Atribuut peab olema üks piiratud arvu väärtused (täpsustatakse sulgudes deklaratsiooni, mis on eraldatud vertikaal-baarid)

 
<!ATTLIST part level (App|Jny|Mst) #REQUIRED> 
<!ATTLIST Q.27 resp  (Yes|No) "Yes"> 

Esimeses näites ei ole vaikimisi väärtus on kohustuslik. Teises, ” Jah ” on vaikimisi väärtus (juhul, kui atribuut on ära jäetud, parser võtab vaikimisi väärtus deklaratsiooni).

ENTITY
Atribuudi väärtus peab olema deklareeritud Üksus.

NMTOKEN
XML Nimi Märgiks on nagu ID-väärtus (ilma tühikuteta), kuid see võib alustada mitte-täht (nt numbrit ega kirjavahemärke).

Erilised omadused
Lisaks xml:id (eespool mainitud), on kaks teiste poolt lubatud XML-Kirjeldus:

xml:space
signaali kavatsus, et see element, valge ruumi peaks olema konserveeritud rakendused;

xml:lang
täpsustada keelt kasutatakse, mille sisu ja atribuutide väärtused mistahes element.

Selles Schemas palju suurem valik andmetüübid on saadaval kui DTDs ja keeruline kinnitamise kriteeriumidele saab lisada iga.

Atribuute DTD saab deklareeritud #REQUIRED (kohustuslikud) #IMPLIED (valikuline) või #FIXED (eelnevalt määratletud ja muutumatu).

Seal ei ole mingit piiri, pikkusele atribuudi väärtus, kuid te peaksite kontrollima, et teie töötlemise tarkvara suudab ebatavaline andmete mahud, kui te kavatsete kasutada väga suuri pikkused.

BPEL
(Business Process Execution Language) on XML-põhine kirjeldus vajalikud toimingud ühistu äriprotsesside vahel toimuvad nõustudes serverid.

Baidijärjestuse
Kahe-bait allkiri (0xFEFF, mis on kindlaks määratud Unicode ISO 10646), mis peab olema prepended XML-dokument, kasutades UCS-2 kodeeringut, et võimaldada töötlejad eristada UCS-2 ja UTF-8 kodeeringus.

Värv
XML on mõeldud identifitseeriv teave struktuuri ja sisuga dokumente, mitte nende välimus. Kuigi see on täiesti võimalik leida ja salvestada teavet esinemised, see teave on tavaliselt hoitakse CSS või XSL stiililehe. Kui teil on vaja salvestada informatsiooni vormindamine või välimus olemasolev dokument, seal on jooni TEI Schema/DTD selleks.

Andmete eksport
Ühine nõue korter andmed mudel, mida kasutatakse paljudes e-kaubanduse süsteemid on eksportida XML-i andmeid CSV (Komaga Eraldatud Väärtused) andmete vorming, mida kasutatakse sisendina tabeleid. Seal on lihtne näide, lühike skript teha siin. Keerulisem ja kogenud rutiin võib kergesti olla kirjutatud kasutades XSLT-või muu XML-töötlemise tarkvara. Kasutajad peaksid tähele, et kui tulemus CSV-faili on piisav lihtne andmete formaate, see on sobimatu vorm tavaline XML dokumente, mis kasutavad Segatud Sisu mudelid.

Andmete import
Paljud XML-projektid nõuavad importida olemasolevaid dokumente mitte XML-formaadis. Impordi olemasolevate HTML dokumendid on selgitatud, Kuidas ma oma olemasolevat HTML faile töö XML, ja kui te saate teisendada oma dokumente XHTML; see on ilmselt kõige lihtsam meetod. OpenOffice i salvestab Open Document Format (ODF) faile, mis on rahvusvaheline standard office XML-dokumente. Wordi faile saab salvestada WordML (2003) või Office i Avatud XML-i (2007: Microsofti alternatiiv ODF). Mõlemal juhul XSLT ümberkujundamine võib olla kirjutatud, et luua sobiv XML impordi vorm. Keeruliste dokumentide muud formaadid siiski spetsialist konverteerimise tarkvara on vaja. Mõned XML-toimetajad on hakanud pakkuma sisseehitatud muutmise muid formaate, ja seal on palju standalone muundamise süsteemide olemas (mõned on suur kulu) formaate, mis on muul viisil ei ole lihtne masin-kättesaadav markup, nagu PDF, PostScript, LATEKS, Quark XPress, ja kõige varaliste dokumendi formaadid. Kriitiline punkt on see, et peaaegu kõik mitte XML (mitte-SGML) dokument on vormindatud, et muuta need inim-loetav ja päris, mitte teha neid masinloetaval. Seetõttu on sageli nii, et teave on vaja teha dokumendi sisukas XML-lihtsalt ei ole neid formaate. Ainus alternatiiv, sest see klass dokumendid on neid rekeyed või skaneeritakse XML üks paljudest ettevõtteid, indias või Vaikse ookeani ääres.

Miinused
XML-on mõned puudused:

  • See võib olla verbose, välja arvatud juhul, kui element või atribuut nimed on valitud hoolikalt. Suurte dokumentide markup tipugaas, ei pea olema suur, kuid lühisõnumite see võib olla oluliselt rohkem, kui tegelikud andmed, eriti kui elemendi või atribuudi nimi on concocted masin.
  • Kattuvad markup ei ole lubatud (element ei saa käivitada, sees üks element ja lõpus sees veel): element markup peab pesa hierarhiliselt.
  • Enamik rakendusi nõuda dokumendi koormatud mälu tervikuna enne, kui see saab sõeluda ja töödeldud. See võib muutuda probleemiks tõeliselt suur dokumendid (suurem kui adresseeritava mälu arvuti süsteem). Väidetavalt XML on võib-olla vale tööriista kasutada failide jaoks, selle suurus, kuid on streaming süsteemid, mis võimaldavad neid töödelda.
  • Mõned tarkvara on tõesti keskpärane.

Toimetamine
Muuta (avatud) XML faili, siis tuleks kasutada XML-i redaktorit. Võimalik on avatud XML-faili, kasutades mingit standardit polegi toimetaja või isegi wordprocessor, kuid tuleb meeles pidada, et nad võivad proovige uuesti vormindada faili valesti, sest nad ei saa aru, XML-i.

Üksused
Ettevõte on üksus, ladustamine XML. See võib olla nii väike kui tegelane või nii suur kui kogu dokument. Nelja tüüpi üksus on declarable:

Üldine üksused
mis võib olla nagu string-asendamine makrod:

<!ENTITY IBM "International Business Machines">

Neid saab kasutada sama andmesisestaja või tagada ühtne kirjapilt nagu &IBM; ja nad saavad asendatakse kui faili on sõeluda.

Nad võivad esindada ka välised failid:

<!ENTITY chap5 SYSTEM "chapter5.xml"> 

mida saab kasutada kui faili-kaasamise mehhanismi kohas, kus sa paigalda &chap5;. Väline üldine faili üksused ei tohi sisaldada XML Deklaratsiooni või mis tahes Dokumendi Tüübi Deklaratsioon.

Dokumendi üksused
Need on nagu välise üldine faili üksused, välja arvatud see, et nad täpsustada, millist tüüpi andmeid, mida nad sisaldavad, kasutades deklareeritud Märke, nii et parser ja taotluse saab otsustada, kuidas nendega toime tulla (nt lisage need või andma need teisele programmile oma spetsiifilise tüübi keskmise):

<!ELEMENT link (#PCDATA)> <!ATTLIST link to ENTITY #REQUIRED>
... 
<!NOTATION PDF PUBLIC 
  "-//Adobe//NOTATION Portable Document Format//EN//PDF"
  "http://partners.adobe.com/public/developer/pdf/index_reference.html"> 
<!ENTITY pricelist SYSTEM "/sales/pricelist.pdf" NDATA PDF> 
... 
<para>Please refer to our <link to="pricelist">current price list</link>.</para>

See annab väga jõuline meetod, milles määratletakse välise üksuse kord ja mis võimaldab tal tuleb viidata mitu korda (kui välise faili nimi muutub, siis on ainult update üksus, deklaratsiooni).

Märgi üksused
meeldib &aacute; esindada märke, et kasutajad on ilma vaja klaviatuuri funktsioonid tahad minna nagu ‘á’;

Parameeter Üksused
on nagu Üldine isikut, kuid on võimalik ainult viidatud jooksul DTD. Neid kasutatakse kontrolli sisu mudelid, kaasamine või väljaarvamine deklaratsioonid, ja muutmine modulaarne konstruktsioone:

 
<!ENTITY % local.qandaset.mix "|bibliodiv">

(kasutada näiteks DTD selle Sõbralik küsimusi), kus segatakse elemendi tüüpi sisu mudel qandaset on määratud üksuste qandaset.mix (mis on määratletud DocBook) ja local.qandaset.mix (määratletav kasutaja poolt [mind]) nii, et DTD saab tweaked, ilma et tuleks muuta.

Üldine üksus, nimed, sealhulgas XML-dokumendi üksuste ja iseloomu üksused, alustades alati ampersand (&) ja lõpus on semikoolon (;), ja seda saab kasutada kõikjal, kus teie dokumenti. Parameeter üksused saab kasutada ainult DTD: nad hakkavad koos protsendi märk (%) ja lõpeb semikooloniga.

Loendamine
Loendada korda sõlme XML-dokument, mida saab kasutada count funktsiooni XSL[T], nagu

 
<xsl:value-of select="count(//chapter)"/> 

Kohaldada loendur korduva elemendi tüüp, kasutada xsl:number element, nagu

<xsl:number select="appendix" level="any" format="A"/> 

Rohkem XSLT, vaata Kuidas saan kontrollida vormingut XML?.

Keskkonnamuutujad
XML on markup language, ei ole programmeerimiskeel, nii et see ei ole kontseptsioon, keskkonna muutujad. Siiski, kui te kasutate DTD, ja juurdepääsu oma XML-failid alla programmi kontrolli (nt skriptiga, mitte käega), siis on võimalik, et muuda väärtus deklareeritud atribuutide või üksuste (nt koos stream-editor nagu sed) enne faili avamist ning seeläbi edastada väärtusi väliskeskkonnast dokumenti. Sarnane lähenemine oleks võimalik Schema.

Põgenemine
Põgenemine tähendab ajutiselt lülitus, kuidas programm töötab, et teha midagi erinevat andmetega. Selles SGML, see oli kokkuleppeline kasutada ainult ASCII märke oma dokumendid, sest klaviatuurid, ekraanid, ja fonte muud tegelased olid sageli kättesaamatu. Põgeneda piirangud käesoleva vormi mitte-ASCII sümboleid, näiteks aktsendid ja sümbolite komplekt mnemoonika nimed oli olemas, mille ees seisab on ampersand ( & ), et lülitada escapement kohta, ja sellele järgneb semikoolon (;), et lülitada see välja, nii et á oli antud &aacute;.

XML võimaldab teil kasutada Unicode i, nii et iga märk või sümbol, mis tahes keeles, mis on võimalik sisestada ka ise. Kui te kasutate UTF-8 kodeeringus oma dokumendid, ei ole vaja kasutada pääseks välja arvatud kaks markup sümboleid (< ja &). Siiski kõigil ei ole Unicode ‘ i toimetaja, ja täielik Unicode font on väga suur, nii et see on tavaline tähestikulises keeles, et valida kodeering, mis võimaldab teil kasutada enamus tähtedega, teil on vaja, ja kasutada põgenedes jaoks aeg-ajalt muid sümboleid.

Floating-point
Sa ei saa kuulutada iseloomu andmete sisu või atribuudi väärtused, nagu floating-point (või paljud muud andmetüübid), kasutades DTDs. Selleks, et teil on vaja kasutada Schemai.

GTT
Gnome Time Tracker on osa Gnome liidese, mida kasutatakse laialdaselt Linuxi süsteemid. Osa oma sisemisi andmeid, konfigureeritakse XML-is.

Mängud
Ma ei ole teadlikud kõik arvuti mängud kirjutatud kasutades XML veel, kuigi XML on kasutatud mõned sisekontrolli ja konfiguratsiooni failid kasutatud mänge.

Idempotency
Termin, mida kasutatakse HTTP spetsifikatsioon kirjeldada kõrvalmõju-tasuta laadi korduvaid nõudmisi ressurss.

Javascripti koodi
ECMAscript (anda talle tema tegelik nimi) on midagi pistmist Java keeles. See on loodud, et joosta sees brauseri aknad, navigatsiooni-või tegutsevad markup lehe luua dünaamilist sisu, vormid kinnitab või instantiate esemeid viisil, mis ei ole võimalik staatilise HTML. Samuti on konstrueeritud nii, et seda ei saa kirjutada, et kasutaja kohalikku failisüsteemi, arusaadavatel turvalisuse huvides, nii et see ei saa lihtsalt kasutada, et luua XML-failid kohapeal, kuigi seal on mõned back-uksed Microsofti tarkvara, mis võimaldavad muudetud leheküljed, salvestatakse kettale.

Reavahetused
XML-faile saab luua kasutades kõiki kolme standard newline esindused: CR (Mac), LF (Unix) või CR/LF (Windows). Kasutada midagi muud võib põhjustada määratlemata käitumine (nii vana DOS-i toimetajad, et kasutada LF/CR võivad luua kasutamiskõlbmatuks failid). XML-protsessorid normaliseerida kõik line-otsad LF.

Line-breaking oma toodangut reguleerib oma renderdamise mootor (nt brauser, typesetter, jne). Teie DTD või Schema võib määrata spetsiaalsed elemendid või üksused, mida kasutatakse harva, kui on sunnitud linebreak on vajalik, kuid see ei ole tavaliselt midagi teha XML (erand: rekonstrueerimine ajaloolisi dokumente, kasutades TEI).

Kaart
Et protsess mõned XML korduvalt, sa pead kasutama töötlemise keel, mis võimaldab silmuspõletamise või tsükliline käsitsemist kindlaks määratud sõlmed. Näiteks XSLT, väljund kõik peatükk pealkirjad teha sisukord (ie välja füüsilise dokumendi seisukoht), siis võiks öelda:

 
<xsl:for-each select="//chapter"> 
  <li> 
    <xsl:value-of select="title"/> 
  </li> 
</xsl:for-each>

Multimeedia
Sünkroonitud Mms Integratsiooni Keel (SMIL) annab XML-sõnavara lihtne authoring interaktiivseid audiovisuaalseid esitlusi. SMIL on tavaliselt kasutatakse ” rikas meedia/multimeedia esitlusi, mis ühendavad streaming audio ja video koos piltide, teksti või mõne muu meediumi tüüp.

Patentide, Autoriõiguse ja Intellektuaalse Omandi
Ma ei ole jurist, ja see ei ole juriidilist nõu. Kui sa oled mures, vt psühhiaater esimene.

Kuna USA (ja üha enam ka mujal) lõpetas mõistuse kontrollimine patenditaotlused, päris palju igaüks saab patendi midagi nendes riikides, olenemata sellest, kas või mitte, see on juba olemas. Kui teil on piisavalt intellektuaalselt pankrotti, siis saad saatmine arveid, et ettevõtted ja ka eraisikud nõudlik makse litsentsi tasud jätkuvat kasutamist.

XML koostati 1995. aastal, esimene number ilmus aastal 1996, et igaüks, väites, nad leiutasid teravanurgeliste-bracket enese määratlemine hierarhiliselt-nested struktureeritud markup pärast seda on ilmselt vähe elemente lühike Skeemi. XML baseerub SGML, mis on rahvusvaheline standard kodifitseeritud kui ISO 8879:1986, ja see eelnes paljude teiste tihedalt seotud markup süsteemid, et igaüks, väites, nad leiutasid selle pärast, et kuupäev on sama lai kui märgistuskeel.

Palju hilisem tuletis tehnoloogiaid, mis võlgnevad oma olemasolu, et SGML-ja XML-eeltöö üsna tõenäoliselt kehtivad patendid, samal viisil, et tulekahju ei olnud algselt patenteeritud, kuid tikud ja tulemasinad olid.

Patendid olid algselt mõeldud uue füüsilise leiutisi. Nende kasutamise meetodid ja algoritmid laiendatud mõiste realm ideid, mida paljud inimesed peavad samuti sügavalt kahtlane. Euroopa patentide looduslikud nähtused, nagu geene (mis on eelnevalt olemasolevad osad Looduse, nagu poliitikud ja tiigi saast), on mõttetu ja intellektuaalselt tühine, kuigi õiguslikult täitmisele pööratav USA-s ja mujal.

Autoriõiguse eksisteeri automaatselt kõike, mida soovite luua, kuid mõnedes riikides (eelkõige USA ja Prantsusmaa) te ei saa kehtestada seda, kui sa registreerid oma huvi. Autoriõiguse püsib aastaid pärast oma surma (EU: 75, eri mujal), et lasta oma järeltulijad kasu müüki oma töö.

Autoriõigus on jaoks füüsilises vormis intellektuaalse väljendust, nagu raamatud, ajalehed, kunstiteoste, veebilehtede, või arvuti programmid. See on olemas, et takistada teistel varastada oma tööd ja seda müüa. Saate hinnapakkumise jupid teiste inimeste tööd ilma loata, nagu rida luuletus, või baar, muusika, või lause pärit romaan, kui sa ütled, kelle ta on ja kust seda leida: vastasel juhul pead luba küsima eelnevalt. Autoriõigus annab juba rohkem kui piisav kaitse arvutiprogrammide kasutamine patentide neid tarbetuid overkill.

Intellektuaalomandi tuvastab teie kui omanik mõtteid ja ideid, mille võib leida nende füüsiline väljendus patentset leiutist või copyrightable väljaanded. Isegi kui sa müüa oma patentide, ja veel kaua pärast teie autoriõigused on lõppenud, saate veel näha, kui inimene, kes on unistanud, kuni idee, ja mõned riigid (näiteks Suurbritannia) võimaldab teil ametlikult kinnitada oma õigust olla nii kindlaks määratud, sõltumata sellest, mis juhtub raamat või gizzmo.

Sa peaksid alati tunnistama teiste intellektuaalse omandi õigusi, eriti kui te kasutate seda edendavaid oma eesmärk. Teeskleb, et kellegi teise smart ideed on teie oma on ilmselt hullem kuritegu kui üritad patendi tule, vee, ratta, või XML.

Torujuhtmete
Tehnika on vähendada keeruline järjestikuste ja paralleelsete töötlemise nõuete kogum komponente, mis võivad olla täitunud programmi kontrolli. Mõiste on võetud Unix-rajatise suunata väljund ühe käsu sisendi teise (kutsutud “toru”), mõju loomise ahelas või torujuhtme, mille kaudu andmete läbib oma teel allikast tulemuse.

W3C on Märkus kuni esitamise kohta XML Torujuhtme Määratlus Keel, mida võiks kasutada, et kindlaks määrata torustiku kaasaskantav, müüja-sõltumatult.

RSS
The Really Simple Syndication format oli mõeldud selleks, et võimaldada uudiste saidid protsessi uuendusi masin, ja see kujunenud semi-standardne vorming, blogid ja muud sagedamini muutmine saitide teatama maailma muutusi. Kahjuks oli see kunagi korralikult määratletud, ja on mitu kokkusobimatu ja dokumentideta versioonid. See oli umbes asendatakse tunduvalt parem keeles nimetatakse Aatomi, kuid Microsoft on viimasel ajal teatanud oma toetus RSS, nii et tundub, et võib-olla oleme me ummikus koos sidruni aastaid.

‘Newsreaders’ (RSS-lugejad) on olemas kõik, platvormid, nii iseseisvad ja brauseri pluginad. Ärge ajage need programmid kirjeldus on sama, mis on kavandatud pakkuma juurdepääsu Usenet News service, mis on teine asi täiesti (ja mis sul vaja lugeda aadressil comp.text.xml).

Renderdamise
Kasutades XSLT või XSL:FO ümberkujundamine (või muude sarnaste konverteerimise süsteem), teavet, mis on märgistatud üles XML võib osutuda peaaegu iga eesmärk: HTML, PDF, audio, Braille, ja peaaegu iga plain-text kujul (nt LATEX). Kuidas tundub (või helid) on tingitud kasutades laaditabelid või muu ümberkujundamise loogika aktiveeritud, mille märgistuskeel.

SML
Kosmoselaev Markup Language on rakendus, XML.

Standard ML programmeerimiskeel ei ole.

Kas sa mõtlesid, SGML?

SOAP
W3C standard “määratluse XML-põhist teavet, mida saab kasutada vahetamise struktureeritud ja trükitud teabe vahel eakaaslased detsentraliseeritud, hajutatud keskkond”. Kõige sagedamini kasutatakse Web Services for message-passing).

Algselt Simple Object Access Protocol, lühend nüüd on määramata, või on väljendatud Teenus-Orienteeritud Juurdepääsu Protokolli (Service-Oriented Access Protocol – SOAP). Guru99 on hea õpetus SOAP.

Otsing
Saate otsida üksikute XML-failid järjenumber, stand-alone, unindexed käsurea alusel, kasutades programmide nagu lxgrep või lxprintf, osad LTXML2 toolkit. Paljud toimetajad lisada otsingufunktsiooni, samuti

XSLT võimaldab piiratud otsingufunktsiooni, lihtsalt kasutades funktsioone, nagu sisaldab hakkab, ja lõpevad. XSLT2 lisab regulaaravaldisi. XQuery on täiemahuline otsingu keel XML-i.

Saxon XSLT protsessor kaasas rakendamise XQuery (ka XQL Sõbralik küsimusi), mis võib nõustuda päringut, kas käsurealt või failist. Saxon saab kasutada ka kontrolli faili, et määrata rühmade XML-faile, otsida koos.

Näiteks indekseeritud otsing (kiirus) sa pead XQuery otsingu tööriista, mida rakendatakse on indekseerimise mootor, mis loeb ja mõistab märgistuskeel. Need on tavaliselt rakendatud osana “emakeel” XML andmebaasi süsteem, nagu on olemas (ja paljud teised), mis kulgevad kas stand-alone või paralleelselt XML-server nagu Cocoon.

Traditsiooniline relatsiooniline andmebaaside (MySQL, Oracle jne) kipuvad salvestada XML nagu undistinguished stringid või Plekid, kasutades polt-XML taustaprogrammid hakkama xml impordi ja ekspordi. “Emakeel” XML andmebaasid on XML käitlemise sisseehitatud, on ja saab olema konfigureeritud detailsuse, salvestada kindlal element tasandil, mistõttu markup-tundlik otsimine palju efektiivsem.

Teenindavad XML
Vaata, Kas mul on vaja muuta minu server tarkvara tööd XML?

Sorteerimine
Omamoodi korduvad komplekt XML-elemente, XSL (T), kasutada xsl:sort element, näiteks

<xsl:for-each select="//acronym"> 
  <xsl:sort select="@abbrev"/>
  <xsl:value-of select="@abbrev"/> 
  <xsl:text>: </xsl:text> 
  <xsl:apply-templates/> 
</xsl:for-each>

Erimärke
XML on ainult kaks erilist markup tähemärki tavaline dokumendid:

  • Avatud nurksulgu või vähem-kui märk ( < ), mis algab start-tag-või lõpp-silt <report> või </table>;
  • The ampersand märk ( & ), mis algab üksus viide meeldib &aacute; á või &#x00A7; eest §.

Vastupidiselt üldlevinud arvamusele, sulgemis-angle bracket või suurem (>) ja semikooloni (;) ei ole erimärke normaalne tekst: omandab üksnes oma ajutise erilist tähendust, kui üks kahest markup tegelased on tekkinud.

Selles DTDs, protsendi märk (%) on eriline tähendus üksuse deklaratsioonid: see määrab (majandus) üksus parameetrina üksus, mis tähendab, et seda saab kasutada ainult sees DTD, mitte dokument, tekst, ja ainult andmete asendamine (mingi lihtne makro).

Hüüumärk (!) omandab erilise tähenduse kohe pärast vähem kui märk: kui järgneb ühe deklaratsiooni märksõnade DTD see märku algust Avaldus; siis järgneb kaks kriipsud see märku algust kommentaar (lõppes veel kaks kriipsud ja suurem-kui märk.

TMX
TMX on standardne meetod, et kirjeldada tõlkemälu andmeid, mis on vahetatud seas tööriistade ja/või tõlke müüjad inim-keele tõlge (osa OSCAR projekti LISA).

Tabelid
Saate määrata, tabeleid, mis tahes viisil te soovite XML-is (vt Ei XML lubage mul teha mu enda silte?) kuid seal on mõned olemasolevad tabel mudelid, mis on saanud nii laialdaselt kasutatud (ja toetab tarkvara), et seda oleks vaja väga kaalukas põhjus, et leiutada midagi uut. Seal on rohkem üksikasju (Flynn, 1998) §2.3.7.

HTML
HTML-tabelid leiutati Mosaic (nüüd Netscape) ja ilmus esimest HTML2 DTD. Kõik versioonid HTML-i ja XHTML-nad määratlevad väga lihtne, kuid praktiline mudel, väga vähe täpsustusi, sobib veebi kasutamise ja algeline trükkimine. Nende pealik eelis on see, et brauser raku kõrgused ja laiused (ja seega veergude laiused) laiendada või leping automaatselt, et see sobituks summa tekst sisaldas neid. Kõige muu tabel mudelid eeldada, laiused veerud ja kõrgus rakkude ette (mis sa teha saad, HTML, kuid see on harva kasutada).

CALS
Computer-Aided Logistika ja Toetada (Computer-Aided Logistics and Support – CALS) ja mitmed muud akronüümid aastate jooksul, oli (on) osa USA sõjaväe projekti, et tagada ühtne märgistus kõik dokumendid, algselt SGML, nüüd XML-i. Osana sellest tegevus, CAL-tabel mudel on muutunud kõige laialdasemalt kasutatav tehniline dokumentatsioon, eriti Interaktiivseid Elektroonilisi Tehnilised Juhendid (IETMs), millel on suur toetus kõigi suuremate toimetajad, ja see on vaikimisi tabel mudel DocBook DTD ja Schema. Kui CALS mõisted on väga võimas, kuid üsna keeruline, ja saab hakkama peaaegu kõik nõuded, mis ulatub, kohtuotsust ja viia.

SASOUT
See mudel on kasutatud laialdaselt sotsiaal-ja mujal määratleda tabelid põhinevad semantika andmete, mitte välimus. Korraga olid nad alternatiiv DocBook (võimaldanud lihtne parameeter üksuse vahetada).

TEI
Kui TEI mudel on mõeldud selleks, et võimaldada kodeerija esindama olemasolevate tabelite on transkribeeritud alates ajaloo, kirjandus, või arhiivi materjali, pigem kui tootmise uued andmed. Kui markup on samal tasemel lihtsus nagu HTML mudel, kuid see on mõeldud selleks, et võimaldada kaasamise palju tihedam markup ja vajalikud metaandmed teadus-tekste.

LATEX
LATEX mudel ei ole otseselt seotud XML-i kasutaja, välja arvatud juhul, kui LATEX on ühise eesmärgi muutusi alates XML kasutades XSLT selleks, et luua PDF faile. Nagu CALS, LATEX tabeleid saab hakkama peaaegu iga vormindamine, kuid vaikimisi reastamine eeldada, et iga veerg vorm on eelnevalt määratud, ja et iga rakk saab hõivata üks rida andmed: täiendav pakett (array) on vaja selleks, et hakkama multi-line rakke nii, et teised mudelid.

XML-ei ole vaja kasutada tabeleid märgi üles nimekirju, nagu seda tihti teha wordprocessors, sest töötlemise rajatised keeles nagu XSLT võimaldab teil muuta dokumendi kasutada mitte-tabeli meetodeid (nagu HTML divs). Tabel markup peaks seega piirduma “päris” tabelid (andmed on korraldatud ridade ja veergudena) ja ei looda lihtsalt, sest sa tahad midagi, mis kuvatakse tase on midagi muud: see on parem valida xml), mis on mõeldud selleks, et teha tööd korralikult, mitte kahjustada olemasolevaid rajatisi.

Wordprocessor kasutajad on tavaliselt teadlikud, et paljud struktuurid, mida nad praegu kasutavad wordprocessor tabelid on tegelikult segmenteeritud nimekirjad, mis wordprocessors ei suuda käitlemise õigesti. Üks peamisi põhjusi seda teha korralikult, et andmeid saab ümber töödelda mõtet, kui lugeda loomulik kord.

Teksti dokumendi vormindamine funktsioonid
Kuna XML on metalanguage, mis võimaldab teil määratleda ja nime oma teabe struktuurid, tal ei ole sisseehitatud teadmised midagi alustada. Seega ei ole omane arusaam, mis tahes dokument detaile nagu punktiseeritud nimekirjad, sektsioonid, joonealused märkused, või mis tahes ühise online funktsioone, nagu drop-down menüüd, vormid (sisendid, märkeruudud, raadionupud ja teksti alad), skripte, mouseovers, või muud kellad ja viled — need on asjad, mis teil on kasutada XML määratleda, DTD või Schema oma konkreetse rakenduse. Vastupidi jäetud mulje, mida mõned tootjad on need asjad ei ehitatud XML ise. Teil esmalt valida või kujundada dokumendi liik (Schema või DTD) esindada oma täpset teavet, siis võite luua efekte nagu eespool kasutades CSS stiil, või kirjalikult XSL[T] ümberkujundamise kohta oma XML, HTML, Word, LATEX, PDF, või mis iganes muu vorm on võimeline instantiating neid.

On veel native-XML ettepanekud ja soovitused aadressil W3C XML kujul käitlemine, XML Sidumine, XML Security, ja palju muid funktsioone, kuid need on arhitektuuri, mis võimaldavad mehhanismid, mitte tilk-asendajaid HTML.

UML
Unified Modeling Language on midagi pistmist XML, kuigi seal on palju kokkupuutepunkte, ja mõned tarkvara on saadaval, et väljendada mõned UML struktuuride XML eesmärgil muu protsessi sõnumid.

URI parsing vead
Vaata Semikooloni.

Muutujad
XML ei ole muutujate või parameetrite, samuti ei pea see väljad või arvestust. Need kõik on terminid programmeerimine ja andmebaasi tehnoloogia, ja ei ole täpne ekvivalendid XML-i.

XML tuvastab teie teavet elemendid ja atribuudid.

WAP
Wireless Application Protocol (WAP) on nüüd tegeleb Open Mobile Alliance.

Hästi arenenud
Hästi arenenud XML-i.

Valge-ruum
Vaata kuidas XML käepide valge-ruum minu dokumendid?.

XLL
XML-Ühendab Keel koosneb XLink spetsifikatsioon ja XPointer spetsifikatsioon. Lisateavet leiate XML Ühendab Töörühma juures W3C.

XLS
Microsoft varaliste arvutustabeli vormingus, mille on kirjutanud oma Excel arvutustabeli programmi. XLS faile ei XML-failid, kuid tänapäeva Excel versioonide salvestada oma andmeid .xlst faile Microsofti Office Open XML (OOXML).

Ärge ajage XLS koos XSL (vt Kuidas saan kontrollida vormingut XML?).

XML
See on XML-Sõbralik küsimusi. Kõik see on umbes XML. Sissejuhatav selgitus, t Põhitõdesid.

XML-i ja turvalisuse, privaatsuse ja identiteedi standardid
Eve

XML Protokoll
Seal on Töörühma Veebi Teenused W3C, ja osa nende ülesanne on töötada XML Protokolli. Vt http://www.w3.org/2000/xp/Group/ details.

XMLHTTP
Funktsiooni rakendada MSXML ja mujal, et võimaldada päringute teostamine, veebilehtede, binaarsed andmed, või kirjutasid vastuste alusel programmi kontrolli (näiteks kasutades curl, wget või koera shell script). Kasutada asynchronously aastal AJaX taotluste eel-tõmmata andmeid, säästes aega, et tundub, et rakendus töötab kohapeal.

XUL
XML-Kasutajaliidese Keeles, mis on kavandatud täpsustada kasutajaliides Mozilla brauser.

asp.net
ASP (Active Server Pages) on Microsofti keel teenivad dünaamilisi veebilehti, sarnane mõiste, JSP, PHP, ja teised. Iseenesest, ASP on midagi iseenesest teha XML-i, kuigi nagu iga server-side süsteem, seda saab kasutada teenindavad XML sama hästi kui muud tüüpi faili.

.NET on ise taotluse platvormi ja metoodika, web-teenuste arendamise kohta Microsofti serverid. Enamik web services on predicated kohta XML-kui “ühise vedaja” inter-äri sõnumid, nii .NET on oluline XML komponent.

Marc Hadley kirjutab:

Seal on palju alternatiive, ASP, millest enamik kasutavad sarnaseid lehel põhinev lähenemine. Java-põhised alternatiivide hulka kuuluvad Java Server Pages (JSP), Java Server Nägu (Java Server Faces – JSF) ja Cocoon (mis sisaldab eXtensible Server Pages — XSP). Populaarne skriptimise keel alternatiivideks Zope (Python) ja Rails (Ruby) [mis kõik on ulatuslik XML-i tugi. — Toim.]

5.4 Kadunud XML tarkvara
Mõned parimad tarkvara, mis on puudu

Kõige levinum põhjus on kaotanud hea tarkvara tundub olevat ettevõte, mis sai üle võetud süül oma, ettevõtte hai, kes ei teadnud, mida nad ostavad, või kes lihtsalt ei hooli. Sellistel juhtudel ei ole toote viga — sageli see oli populaarne, müüvad hästi; ma lihtsalt kukkus ebameeldiva ettevõtte jama.

Near&Far (MicroStar)
Standalone visuaalne (graafiline) SGML DTD disain vahend, mis algselt Microsoft Windows 95. N&F on väga lihtne prototüüp uue dokumendi liik, kuigi hiljem etappide arengu tavaliselt käsitsi häälestatud. See on ka suurepärane vahend väljapanek struktuuri äsja tekkinud DTD. Kui XML saabus, nad hoidsid sise SGML mudel, kuid tingimusel, et “päästa” XML süntaksit.

Paljud praegune disain vahendeid on sarnased varjatud funktsioonid ( XML Spy), kuid ei ole võrdväärset standalone vahend, sama kvaliteediga. Arengu kasutada RelaxNG luua eri formaadis oleks suur samm edasi.

MicroStar ostetud OpenText Corp, toote kukkus põrandale, just hetkel, kui see oleks olnud kõige kasulikum. Kui teil on koopia (üks oli põimitud WordPerfect SGML/XML editor), on see siiski täidab all XP, Codeweavers’ Wine all Linux.

DynaWeb (EBT)
Pere tooted: DynaBase, aluseks SGML andmebaasi; DynaWeb, Windows server graafiliselt juhitud stiililehe süsteemi teenindavad XML või SGML HTML ja suurepärane markup otsinguvahend; DynaTag, GUI süsteemi teisendamise Word ja Frame dokumendid, SGML või XML, mis põhineb algse vikerkaar tegija käsurea converter.

EBT üles Inso Corp pannakse see kokku pankrotiseaduse Corp, toote ignoreeritakse mitu aastat. Samas, lk Indo server nüüd väidab, et konkreetsed, kuid ei ole teada, kas toode on veel saadaval. Tundub, et nad pärinud mõned kasutajad, nii küll, et oli veel DynaWeb koolituse lehel.

Hea uudis on see, et Red Bridge Tarkvara nüüd istub vana EBT factory (Punane Sild aastal Providence, RI), müüa content management system, mis sisaldab DynaTag ja mõned muud elemendid originaal vahemikus.

Panorama (SoftQuad)
On SGML brauseri SoftQuad, SGML-süntaks stiililehe, mis töötas nii iseseisvad ja kui Netscape i plugin, mis põhineb Synex Vaateava. See on kasutajatele avatud otsene seos SGML dokumendid: Panorama oleks alla laadida nii näiteks ja DTD kaudu üksus teisendi, teostada tokenised sõeluda, ja kohaldada määratud laaditabeli.

Unikaalne varustus ümberlülitamine mitu stiili vahel, otsingu tulemus tihedus näitaja, ja võimet täita kahe otsaga HyTime lingid, mis las igaüks avaldab oma linke, isegi mitme otsaga linke, kuid isegi dokumentide vahel, et sa ei oma. Brauseri plugin oli vaba, ja täielik versioon sisaldas laaditabeli toimetaja.

SoftQuad faltered pärast Juri Rubinsky suri, võttis üle Corel (WordPerfect), kui toode on ignoreeritud.

SoftQuad Autor/Toimetaja SGML toimetaja toote transmuted e XMeTaL, mis on ikka veel saadaval vaid süsteemid JustSystems.

Kui teil on rohkem teavet, kasulikke tooteid, mis on puudu, võtke palun ühendust toimetaja.

Algselt lehekülg http://xml.silmaril.ie.

Tagasi esilehele