XML ausführlich detailliert erklärt
Einführung in XML
Die Extensible Markup Language (XML) ist ein flexibles Textformat zur Darstellung strukturierter Daten. Sie ermöglicht den Austausch von Informationen zwischen unterschiedlichen Systemen und Anwendungen.
XML-Dokument
Ein XML-Dokument ist eine strukturierte Textdatei, die Daten in einer hierarchischen Baumstruktur organisiert. Es besteht aus Elementen, Attributen und Textinhalten, die durch Tags gekennzeichnet sind.
<?xml version="1.0" encoding="UTF-8"?>
<buch>
<titel>XML umfassend erklärt</titel>
<autor>Max Mustermann</autor>
<jahr>2023</jahr>
</buch>Bestandteile eines XML-Dokuments
- Deklaration: Gibt die XML-Version und die Zeichenkodierung an.
- Elemente: Grundbausteine des Dokuments, gekennzeichnet durch Öffnungs- und Schließ-Tags.
- Attribute: Eigenschaften eines Elements, definiert innerhalb des Start-Tags.
- Textinhalte: Die tatsächlichen Daten zwischen den Tags.
XSD Schema
Das XML Schema Definition (XSD) ist eine Sprache zur Definition der Struktur und Datentypen eines XML-Dokuments. Es dient der Validierung von XML-Daten gegen eine vorgegebene Struktur.
Eigenschaften von XSD
- Element- und Attributdefinition: Legt fest, welche Elemente und Attribute erlaubt sind.
- Datentypen: Bestimmt den Typ der Daten (z.B.
xs:string,xs:integer). - Strukturregeln: Definiert die Hierarchie und Sequenz von Elementen.
Beispiel eines XSD Schemas
<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
<xs:element name="buch">
<xs:complexType>
<xs:sequence>
<xs:element name="titel" type="xs:string"/>
<xs:element name="autor" type="xs:string"/>
<xs:element name="jahr" type="xs:integer"/>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>Parser
Ein XML-Parser ist ein Programm oder eine Bibliothek, die XML-Dokumente liest und in eine für Anwendungen verständliche Struktur umwandelt.
Arten von Parsern
- DOM-Parser: Lädt das gesamte XML-Dokument in den Arbeitsspeicher und erstellt eine Baumstruktur.
- SAX-Parser: Liest das Dokument sequentiell und eignet sich für große Dateien.
XSLT Stylesheet
XSLT (Extensible Stylesheet Language Transformations) ist eine Sprache zur Transformation von XML-Dokumenten in andere Formate, wie z.B. HTML, XML oder Text.
Verwendung von XSLT
- Datenformatierung: Anpassung der Darstellung von XML-Daten.
- Datenumwandlung: Konvertierung von XML-Strukturen in andere XML-Formate oder komplett andere Formate wie CSV.
Beispiel eines XSLT Stylesheets
<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:template match="/buch">
<html>
<body>
<h1><xsl:value-of select="titel"/></h1>
<p>Autor: <xsl:value-of select="autor"/></p>
<p>Erscheinungsjahr: <xsl:value-of select="jahr"/></p>
</body>
</html>
</xsl:template>
</xsl:stylesheet>Transformer
Ein Transformer verwendet ein XSLT Stylesheet, um ein XML-Dokument in ein anderes Format zu überführen. Dies erfolgt häufig in drei Schritten:
- Eingabe des XML-Dokuments.
- Anwendung des XSLT Stylesheets mittels Transformer.
- Ausgabe des transformierten Dokuments.
Verbindung zu HTML
Durch die Verwendung von XSLT können XML-Daten in HTML umgewandelt werden, um sie in Webbrowsern darstellbar zu machen.
Beispiel
- XML-Dokument: Enthält die Rohdaten.
- XSLT Stylesheet: Definiert das Layout und die Präsentation.
- Ergebnis: Eine HTML-Seite, die aus den XML-Daten generiert wurde.
Umwandlung in CSV
XML-Daten können mittels XSLT oder speziellen Skripten in das CSV (Comma-Separated Values)-Format konvertiert werden. Dies ist nützlich für den Import in Tabellenkalkulationsprogramme.
Schritte
- XML-Parser: Liest das XML-Dokument.
- Transformation: Formatiert die Daten als CSV.
- Export: Speichert die Daten in einer
.csv-Datei.
Integration in Spreadsheet
Tabellenkalkulationsprogramme wie Microsoft Excel oder LibreOffice Calc können sowohl CSV- als auch XML-Dateien importieren.
Möglichkeiten
- Direkter Import von CSV: Einfache Tabellenstrukturen werden übernommen.
- Import von XML mit Schema: Komplexere Datenstrukturen können anhand eines XSD Schemas korrekt in Tabellenzellen platziert werden.
Zusammenhänge der Komponenten
- XML-Dokumente bilden die Basis für den Datenaustausch.
- XSD Schemas definieren die Struktur dieser XML-Dokumente.
- Parser interpretieren und verarbeiten XML-Daten.
- XSLT Stylesheets transformieren XML in andere Formate wie HTML oder CSV.
- Transformer setzen diese Transformationen um.
- HTML stellt die aufbereiteten Daten im Web dar.
- CSV und Spreadsheets ermöglichen die Weiterverarbeitung von Daten in Tabellenform.