Issuu on Google+

Ein kurzer Einblick Wissenschaftliche Arbeit eingereicht bei Frau N. Ritz verfasst und vorgelegt von Christopher Pietsch Matrikelnummer: 322869

10.01.2007

XML Fachhochschule Aachen Studiengang Informatik


XML – Ein kurzer Einblick

Inhaltsverzeichniss 1

Einleitung ...............................................................1 1.1

Was ist XML?.......................................................1

1.2

SGML und das World Wide Web ................................2

2

Eigenschaften von XML-Dokumenten.............................3

3

Regeln von XML........................................................4

4

Vor- und Nachteile von XML ........................................4

5

Anwendungsbeispiele von XML ....................................5 5.1

Microsoft Office 12...............................................5

5.2

Google Earth ......................................................6

6

Schluss...................................................................6

7

Literaturverzeichnis..................................................7

8

Anhang...................................................................8

- Inhalt -


XML – Ein kurzer Einblick

1

-1-

Einleitung

Wer sich privat oder beruflich mit der HyperText Markup Language (HTML) und Co auseinandergesetzt hat, ist zwangsläufig auch auf die Extensible Markup Language (XML) oder zumindest auf die Extensible HyperText Markup Language (XHTML) gestoßen. Aber auch Computerlaien treffen immer häufiger, wenn auch unbewusst, auf XML. Es folgt zur Verdeutlichung ein fiktives Handlungsprotokoll eines Schülers: Thomas ruft als erstes seine Emails ab, schaut sich gleichzeitig die

neusten

Nachrichten

und

Blogeinträge

in

seinem

Emailprogramm per Really Simple Syndication (RSS) an. Danach sammelt Thomas Informationen in Google

Earth

für sein

Erdkundereferat. Welches er daraufhin in Word 12 verfasst. Speichern kann er neuerdings auch im Microsoft Office Open XML –Format (DOCX). X für XML: In allen drei Tätigkeiten spielt XML eine grundlegende Rolle zur Speicherung und Übertragung von Informationen. XML ist nicht nur irgendein theoretischer Begriff – wir kommen öfters mit XML in Kontakt als wir denken.

1.1 Was ist XML? XML steht für „Extensible Markup Language“ und beschreibt einen Metastandard für Dateiformate. Mit XML kann man eigene Auszeichnungssprachen definieren, deshalb spricht man bei XML auch von einer Metasprache. Eine Auszeichnungssprache oder auch Markup-Sprache hat die Eigenschaft, dass der Inhalt eines Dokuments durch MarkupElemente, so genannte Tags, strukturiert wird (vgl. [5]). Des Weiteren hat sich XML als ein einfaches, universales Format für

den

Austausch

strukturierter

Informationen

etabliert.

Wichtigstes und ursprüngliches Haupteinsatzgebiet ist das World Wide Web (WWW).


XML – Ein kurzer Einblick

-2-

1.2 SGML und das World Wide Web XML

ist eine vereinfachte Version der Standard Generalized

Markup Language (SGML), welche die International Standards Organisation (ISO) 1986 als Standard festlegte. SGML wurde vorrangig dafür verwendet, „Daten innerhalb von Firmen eines Industriezweigs und von Forschungseinrichtungen weiterzugeben. [4]“ Obwohl SGML durchaus ein mögliches Werkzeug zur Entwicklung des WWW war, wurde es nicht für diesen Zweck verwendet. Grund ist die enorme Komplexität von SGML. SGML hat zwar als Metasprache extrem viele Möglichkeiten, ist aber für den „normalen“ Gebrauch zu mächtig und kompliziert. HTML

hingegen

ist

einfach,

besitzt

jedoch

nicht

den

Leistungsumfang von SGML, und doch erfüllt sie ihren Zweck. Da die Nachfrage des WWW in den 90ern rasant anstieg, wuchs proportional auch der Bedarf nach neuen Möglichkeiten. Es war schnell klar, „dass HTML den künftigen Anforderungen alleine nicht genügen kann, und dass aber ein Standard gefunden werden musste, in den HTML integrierbar war, und der den Erfolg von HTML ausnutzen sollte. [6]“. Als Werkzeug zur Gestaltung und Entwicklung von Websites war HTML trotz aller Erweiterungen und zusätzlichen Hilfsmitteln wie Casade Style Sheets (CSS) noch immer zu starr und unflexibel. Es musste eine Definitionssprache für Auszeichnungssprachen her, die zum einen die Möglichkeiten von SGML besaß und zum anderen eine geringere Komplexität aufwies (vgl. [4]). Die Lösung war eine vereinfachte Version von SGML, genauer gesagt eine Teilmenge von SGML, die Metasprache XML. „Obwohl XML nur ca. 20 % der Komplexität von SGML hat, können damit ca. 80 % der Anwendungsfälle abgedeckt werden. [7]“. Als Produkt einer Arbeitsgruppe der World Wide Web Consortium (W3C) wurde 1998 schließlich XML offiziell freigegeben. Die Herkunft von XML ist also das WWW. Doch XML leistet viel mehr als nur irgendein WWW-Format. Es wird heutzutage als weltweite Norm zur Datenspeicherung verwendet.


XML – Ein kurzer Einblick

-3-

2 Eigenschaften von XML-Dokumenten Bei einem XML Dokument muss es sich nicht

zwangsläufig um

eine physikalisch vorhandene Datei handeln, ein XML Dokument kann auch ein Textfragment sein (vgl. [2]). Zur Verdeutlichung folgendes XML-Dokument: <?xml version=“1.0“ encoding=“UTF-8“ ?> <wa-hausarbeit> <!-- Beispiel Arbeitsphase --> <phase name=“materialsuche“> <ort>Bibliothek</ort> <zeitaufwand>2</zeitaufwand> </phase> </wa-hausarbeit> Das Beispiel zeigt die wichtigsten Bestandteile eines XMLDokuments: XML-Deklaration, Elemente, Attribute, Kommentare, und Texte. Nicht weiter verwunderlich ist die zu HTML ähnliche Form (siehe S. 2). Die in XML verwendeten Elemente werden ebenfalls durch die spitzen Klammern „<“ und „>“ eingeschlossen. Ein Element besteht aus einem Start-Tag und einem End-Tag (vgl. [2]). Der Name eines Elements kann frei gewählt werden, jedoch sind hierbei je nach Markup-Sprache bestimmte Konventionen einzuhalten. Im Innern eines Elementes darf ein weiteres Element, ein Text oder beides platziert werden. In dem Beispiel ist „phase“ ein Element von „wa-hausarbeit“, welches selbst wiederum ein Element ist. Dem Element „phase“ wird in dem Beispiel ein Attribut (name=“materialsuche“) übergeben. Ein Attribut setzt sich aus dem Attribut-Namen sowie dem Attribut-Wert zusammen (vgl. [9]). Innerhalb dem Elements “phase“ befinden sich wiederum 2 weitere Elemente: Ort und Zeitaufwand. Zusammenfassend hat somit das XML-Dokument die Information, dass zur Materialsuche 2 Stunden Zeit in der Bibliothek gebraucht wurde, gespeichert.


XML – Ein kurzer Einblick

-4-

3 Regeln von XML Ein XML-Dokument muss bestimmte Regeln einhalten. So muss es mindestens ein Wurzel-Element geben, welches alle anderen Elemente oder allen Text umfasst. Des Weiteren müssen alle Tags mit Inhalt ein Beginn- und ein End-Tag besitzen, welche wiederum korrekt verschachtelt sein müssen. Treffen diese Regeln zu, spricht man von einem „wohlgeformten“ XMLDokument. Neben diesen allgemeinen Regeln benötigt eine XML-konforme Markup-Sprache, wie XHTML, eine spezifische Grammatik. Diese wird in einer Schemasprache wie Document Type Definition (DTD), XMLSchema oder Regular Language Description for XML New Generation (RelaxNG) verfasst. Aufgabe

dieser

Schemasprachen

ist

es,

die

Namen

und

Inhaltsmodelle der Elemente und Attribute der dazugehörigen Markup-Sprache zu determinieren, damit diese auf Richtigkeit geprüft werden kann (Validierung). Ein XML-Dokument ist dann „valide“, wenn es mit den Regeln seines Schemas übereinstimmt und gleichzeitig wohlgeformt ist (vgl. [9]).

4 Vor- und Nachteile von XML Durch die Eigenschaft, ein text- und dateibasiertes Speichersystem zu sein, schafft XML die Möglichkeit, Informationen und Inhalte über das gesamte Internet zu verteilen. Zu den weiteren Vorteilen von XML-Dokumenten zählt, dass sie beliebig erweitert werden können, denn es besteht keine Begrenzung für Anzahl und Art der Tags. Im Gegensatz dazu kommen relationale Datenbanken nicht ohne Administratoren aus, die die starre Struktur verwalten. Diese Datenbanken sind z.B. auch nicht von außen durch Suchmaschinen zugänglich (vgl. [2]). Weiterhin besteht eine strikte Trennung zwischen Inhalt und Darstellung. XML-Dokumente lassen sich deshalb zur universalen Lieferung von Daten benutzen.


XML – Ein kurzer Einblick Nachteilig wirkt sich jedoch die Verarbeitungsgeschwindigkeit und die Speicherauslastung von Daten im XML-Format aus. Im Normalfall ist der Zugriff auf Informationen in Datenbanken schneller. Der Nachteil der Datei-Größe kann dagegen durch aktuelle Komprimierungsverfahren wie Zero Inflated Poisson (ZIP) oder GNU Zip (GZIP) kompensiert werden: Sie können XML-Dokumente schnell und effizient verdichten. Allerdings ist heutzutage Festplattenplatz eher weniger der limitierende Faktor. Ob für ein konkretes Projekt XML die richtige Wahl ist, hängt von der spezifischen Zielsetzung des Vorhabens und den damit verbundenen Erwartungen an das Speicherformat ab (vgl. [9]).

5 Anwendungsbeispiele von XML Die beschriebenen Vorteile machen XML zu einem interessanten Format zur strukturierten Speicherung oder auch zum Austausch von Inhalten und Daten. Diese Tatsache spiegelt sich in der ständig wachsenden Zahl von Auszeichnungssprachen wieder, die mit Hilfe von XML definiert sind (siehe Anhang). Der Erfolg von XML spiegelt sich aber nicht nur in der Menge von XML-konformen Sprachen wieder, XML hat insgesamt eine hohe Akzeptanz in der Branche gewonnen: IBM, SUN, Micrsosoft, Mozilla, SAP, etc. , um eine kleine Liste von Unternehmen zu nennen, setzen den XML-Standard aktiv ein. Im Folgenden werde ich auf die Beispiele Microsoft Office 12 und Google Earth genauer eingehen, da hinter ihnen große Konzerne stehen, denen eine art Vorreiterrolle zukommt.

5.1 Microsoft Office 12 Microsoft Office 12, welches Ende 2006 erschienen ist, stellt einen großen Erfolg für das Format XML dar. Denn bei der Speicherung der neuen Office Dokumente von Word, Excel und

-5-


XML – Ein kurzer Einblick

-6-

Powerpoint verwendet Microsoft nun nicht mehr das eigene traditionelle binäre Dateiformat, sondern greift auf das Office Open XML Format zurück. Open Office XML ist ein durch XML definiertes Format und damit ein offener Standard. Dieser Fakt ermöglicht es Anbietern oder Kunden von Microsoft, das Format in eigene Systeme zu integrieren. Microsoft will dazu kostenlose Lizenzen anbieten (vgl. [3]).

5.2 Google Earth Google Earth ist eine Software zur Darstellung eines Virtuellen Globus. Die Software stellt Satelliten- und Luftbilder mit überlagerten Geodaten dar. Das besondere von Google Earth ist, dass alle Daten aus dem Internet gestreamt werden, was wiederum hohe Ansprüche an das Transferformat stellt. Zum

Einsatz

kommt

Austauschformat

Keyhole

eine

Anwendung

Markup

Language

von 2.0

XML, (KML).

das Es

ermöglicht die Definition von geometrischen Objekten, wie Punkte, Linien oder Polygone. Praktische Anwendungen stellen Ortsmarkierungen,

Bildüberlagerungen,

Blickpunkte

und

3D-

Modellierung dar (vgl. [8], [1]).

6 Schluss Wir fassen Zusammen: XML ist ein universales Format, welches zur Speicherung und Übertragung von Informationen eingesetzt wird. Darüber hinaus besitzt XML die Fähigkeit, Sprachen mit eigener Grammatik zu definieren, die wiederum selbst XMLDokumente sind. XML ist so vielschichtig, dass ganze Bücher die nur von XML handeln am Ende immer noch nicht alles gesagt haben. Diese Arbeit versucht einen kleinen Einblick in das Wesen von XML sowie praktische Beispiele auf zu zeigen. Es ist beabsichtigt Fragen offen zu lassen um die Neugierde an der spannenden, aktuellen Entwicklung von XML zu wecken. Es gibt viel zu entdecken!


XML – Ein kurzer Einblick

7 Literaturverzeichnis [1] Mager, Alexander. Geodaten-und Landkartendiensteim Internet [Online]. 2006 [Zitiert am: 4. Januar 2007]. Verfügbar im World Wide Web: <http://www.unipotsdam.de/Geographie/geoinfo/lehre/kurse/ws0607/download/ka_ googleEarth/googleEarth_04.pdf>. [2] Meier, Stephan Nieder. Java und XML, Grundlagen. Bonn : Galileo Computing, 2006, Seite 24 [3] Persson, Christian. Heise online - Microsofts XML-Format für Office 12 soll offener Standard werden [Online]. 22. November 2005 [Zitiert am: 5. Januar 2007]. Verfügbar im World Wide Web: <http://www.heise.de/newsticker/meldung/66488>. [4] Rosenbaum, Oliver. Praxislösungen Informationstechnologie A-Z. Kissing : Interest, 2006, Band 4 von 4 [5] Unbekannt. Markup-Sprache. [Online]. [Zitiert am: 10. Januar 2007]. Verfügbar im World Wide Web: <http://www.eteaching.org/glossar/markup> [6] Unbekannt. SELFHTML: XML / Einführung in XML [Online]. [Zitiert am: 9. Januar 2007]. Verfügbar im Word Wide Web: <http://de.selfhtml.org/xml/intro.htm> [7] Unbekannt. Extensible Markup Language – Wikipedia [Online]. [Zitiert am: 10. Januar 2007]. Verfügbar im World Wide Web: <http://de.wikipedia.org/wiki/Xml> [8] Unbekannt. Keyhole Markup Language - Wikipedia [Online]. [Zitiert am: 5. Januar 2007]. Verfügbar im World Wide Web: <http://de.wikipedia.org/wiki/Keyhole_Markup_Language> [9] Unbekannt. XML [Online]. [Zitiert am: 8. Januar 2007]. Verfügbar im World Wide Web: <http://www.eteaching.org/technik/aufbereitung/text/xml/index_html>

-7-


XML – Ein kurzer Einblick

8 Anhang Auszug aus Wikipedia [7]: Liste von XML Sprachen. Text * XSL-FO (Textformatierung) * DocBook * DITA * XHTML (XML-konformes HTML) * TEI (Text Encoding Initiative) * NITF (News Industry Text Format) Grafik * SVG (Vektorgrafiken) * X3D (3D-Modellierungssprache) * Collada (Austauschformat für Daten zwischen verschiedenen 3D-Programmen) Geodate * Geography Markup Language (GML) * GPS Exchange Format (GPX): XML für GPS-Daten * Keyhole Markup Language (KML): Koordinaten-Spezifikation für Google Earth * OpenImmo : XML für Immobilien mit Geo-Daten Multimedia * SMIL (zeitsynchronisierte, multimediale Inhalte) * MPEG-7 (MPEG-7 Metadaten) * Laszlo (LZX) Sicherheit * SAML (sicherheitsbezogene Informationen beschreiben und übertragen) * XML Signature (XML-Schreibweise für digitale Signaturen) * XML Encryption

-8-


XML - Ein kurzer EInblick