Galileo Computing < openbook > Galileo Computing - Professionelle Bücher. Auch für Einsteiger.
Professionelle Bücher. Auch für Einsteiger.

Inhaltsverzeichnis
Vorwort
1 Java ist auch eine Sprache
2 Sprachbeschreibung
3 Klassen und Objekte
4 Der Umgang mit Zeichenketten
5 Mathematisches
6 Eigene Klassen schreiben
7 Angewandte Objektorientierung
8 Exceptions
9 Generics, innere Klassen
10 Die Klassenbibliothek
11 Threads und nebenläufige Programmierung
12 Datenstrukturen und Algorithmen
13 Raum und Zeit
14 Dateien und Datenströme
15 Die eXtensible Markup Language (XML)
16 Grafische Oberflächen mit Swing
17 Grafikprogrammierung
18 Netzwerkprogrammierung
19 Verteilte Programmierung mit RMI und Web–Services
20 JavaServer Pages und Servlets
21 Applets
22 Midlets und die Java ME
23 Datenbankmanagement mit JDBC
24 Reflection und Annotationen
25 Logging und Monitoring
26 Sicherheitskonzepte
27 Java Native Interface (JNI)
28 Dienstprogramme für die Java-Umgebung
Stichwort

Download:
- ZIP, ca. 14,1 MB
Buch bestellen
Ihre Meinung?

Spacer
<< zurück
Java ist auch eine Insel (8. Auflage) von Christian Ullenboom
Programmieren mit der Java Standard Edition Version 6
Buch: Java ist auch eine Insel (8. Auflage)

Java ist auch eine Insel (8. Aufl.)
8., aktual. Auflage, geb., mit DVD
1.475 S., 49,90 Euro
Galileo Computing
ISBN 978-3-8362-1371-4
Pfeil 15 Die eXtensible Markup Language (XML)
Pfeil 15.1 Auszeichnungssprachen
Pfeil 15.1.1 Die Standard Generalized Markup Language (SGML)
Pfeil 15.1.2 Extensible Markup Language (XML)
Pfeil 15.2 Eigenschaften von XML-Dokumenten
Pfeil 15.2.1 Elemente und Attribute
Pfeil 15.2.2 Beschreibungssprache für den Aufbau von XML-Dokumenten
Pfeil 15.2.3 Schema – eine Alternative zu DTD
Pfeil 15.2.4 Namensraum (Namespace)
Pfeil 15.2.5 XML-Applikationen
Pfeil 15.3 Die Java-APIs für XML
Pfeil 15.3.1 Das Document Object Model (DOM)
Pfeil 15.3.2 Simple API for XML Parsing (SAX)
Pfeil 15.3.3 Pull-API StAX
Pfeil 15.3.4 Java Document Object Model (JDOM)
Pfeil 15.3.5 JAXP als Java-Schnittstelle zu XML
Pfeil 15.3.6 DOM-Bäume einlesen mit JAXP
Pfeil 15.4 Serielle Verarbeitung mit StAX
Pfeil 15.4.1 Unterschiede der Verarbeitungsmodelle
Pfeil 15.4.2 XML-Dateien mit dem Cursor-Verfahren lesen
Pfeil 15.4.3 XML-Dateien mit dem Iterator-Verfahren verarbeiten
Pfeil 15.4.4 Mit Filtern arbeiten
Pfeil 15.4.5 XML-Dokumente schreiben
Pfeil 15.5 Serielle Verarbeitung von XML mit SAX
Pfeil 15.5.1 Schnittstellen von SAX
Pfeil 15.5.2 SAX-Parser erzeugen
Pfeil 15.5.3 Operationen der Schnittstelle ContentHandler
Pfeil 15.5.4 ErrorHandler und EntityResolver
Pfeil 15.6 XML-Dateien mit JDOM verarbeiten
Pfeil 15.6.1 JDOM beziehen
Pfeil 15.6.2 Paketübersicht
Pfeil 15.6.3 Die Document-Klasse
Pfeil 15.6.4 Eingaben aus der Datei lesen
Pfeil 15.6.5 Das Dokument im XML-Format ausgeben
Pfeil 15.6.6 Der Dokumenttyp
Pfeil 15.6.7 Elemente
Pfeil 15.6.8 Zugriff auf Elementinhalte
Pfeil 15.6.9 Liste mit Unterelementen erzeugen
Pfeil 15.6.10 Neue Elemente einfügen und ändern
Pfeil 15.6.11 Attributinhalte lesen und ändern
Pfeil 15.6.12 XPath
Pfeil 15.7 Transformationen mit XSLT
Pfeil 15.7.1 Templates und XPath als Kernelemente von XSLT
Pfeil 15.7.2 Umwandlung von XML-Dateien mit JDOM und JAXP
Pfeil 15.8 Java Architecture for XML Binding (JAXB)
Pfeil 15.8.1 Beans für JAXB aufbauen
Pfeil 15.8.2 JAXBContext und die Marshaller/Unmarshaller
Pfeil 15.8.3 Weitere JAXB-Annotationen
Pfeil 15.9 HTML-Dokumente einlesen
Pfeil 15.10 Zum Weiterlesen


Galileo Computing - Zum Seitenanfang

15.3 Die Java-APIs für XML Zur nächsten ÜberschriftZur vorigen Überschrift

Für XML-basierte Daten gibt es drei Verarbeitungstypen:

  • DOM-orientierte APIs (repräsentieren den XML-Baum im Speicher): W3C-DOM, JDOM, dom4j, XOM …
  • Push-API (nach dem Callback-Prinzip ruft der Parser Methoden auf und meldet Elementvorkommen): SAX (Simple API for XML) ist der populäre Repräsentant.
  • Pull-API (wie ein Tokenizer wird über die Elemente gegangen): Dazu gehören XPP (XML Pull Parser), wie sie der StAX-Standard definiert.

Während DOM das gesamte Dokument in einer internen Struktur einliest und bereitstellt, verfolgt SAX einen ereignisorientierten Ansatz. Das Dokument wird in Stücken geladen, und immer dann, wenn ein angemeldetes Element beim Parser vorbeikommt, meldet er dies in Form eines Ereignisses, das für die Verarbeitung abgefangen werden kann.

Klassische Anwendungen für SAX und StAX:

  • Suche nach bestimmten Inhalten
  • Einlesen von XML-Dateien, um eine eigene Datenstruktur aufzubauen

Für einige Anwendungen ist es erforderlich, die gesamte XML-Struktur im Speicher zu verarbeiten. Für diese Fälle ist eine Struktur, wie sie DOM bietet, notwendig:

  • Sortierung der Struktur oder einer Teilstruktur der XML-Datei
  • Auflösen von Referenzen zwischen einzelnen XML-Elementen
  • interaktives Arbeiten mit der XML-Datei

Ob ein eigenes Programm DOM oder StAX einsetzt, ist von Fall zu Fall unterschiedlich. In manchen Fällen ist dies auch Geschmackssache, doch ärgerlicherweise unterscheidet sich das Programmiermodell, sodass eine Umstellung nicht so angenehm ist. Wünschenswert ist eine API, die einen unabhängigen Zugriff auf XML-Daten anbietet.


Galileo Computing - Zum Seitenanfang

15.3.1 Das Document Object Model (DOM) Zur nächsten ÜberschriftZur vorigen Überschrift

DOM ist eine Entwicklung vom W3C und wird von vielen Programmiersprachen unterstützt. Das Standard-DOM ist so konzipiert, dass es unabhängig von einer Programmiersprache ist und eine strikte Hierarchie erzeugt. DOM definiert eine Reihe von Schnittstellen, die durch konkrete Programmiersprachen implementiert werden.


Galileo Computing - Zum Seitenanfang

15.3.2 Simple API for XML Parsing (SAX) Zur nächsten ÜberschriftZur vorigen Überschrift

SAX ist zum schnellen Verarbeiten der Daten von David Megginson als Public Domain entworfen worden. SAX ist im Gegensatz zu DOM nicht so speicherhungrig, weil das XML-Dokument nicht vollständig im Speicher abgelegt ist, und daher auch für sehr große Dokumente geeignet. Da SAX auf einem Ereignismodell basiert, wird die XML-Datei wie ein Datenstrom gelesen, und für erkannte Elemente wird ein Ereignis ausgelöst. Dies ist aber mit dem Nachteil verbunden, dass wahlfreier Zugriff auf ein einzelnes Element nicht ohne Zwischenspeicherung möglich ist.


Galileo Computing - Zum Seitenanfang

15.3.3 Pull-API StAX Zur nächsten ÜberschriftZur vorigen Überschrift

Im Gegensatz zu SAX, bei dem Methoden bereitgestellt werden, die beim Parsen aufgerufen werden, wird bei der Pull-API aktiv der nächste Teil eines XML-Dokuments angefordert. Das Prinzip entspricht dem Iterator-Design-Pattern, das auch von der Collection-API bekannt ist. Es werden die beiden grundsätzlichen Verarbeitungsmodelle »Iterator« und »Cursor« unterschieden. Die Verarbeitung mit dem Iterator ist flexibler, aber auch ein bisschen aufwändiger. Die Cursor-Verarbeitung ist einfacher und schneller, aber nicht so flexibel. Beide Formen sind sich sehr ähnlich. Hier werden beide Verfahren vorgestellt.


Galileo Computing - Zum Seitenanfang

15.3.4 Java Document Object Model (JDOM) Zur nächsten ÜberschriftZur vorigen Überschrift

JDOM ist eine einfache Möglichkeit, XML-Dokumente leicht und effizient mit einer schönen Java-API zu nutzen. Im Gegensatz zu SAX und DOM, die unabhängig von einer Programmiersprache sind, wurde JDOM speziell für Java entwickelt. Während das Original-DOM keine Rücksicht auf die Java-Datenstrukturen nimmt, nutzt JDOM konsequent die Collection-API. Auch ermöglicht JDOM eine etwas bessere Performance und eine bessere Speichernutzung als beim Original-DOM.


Galileo Computing - Zum Seitenanfang

15.3.5 JAXP als Java-Schnittstelle zu XML Zur nächsten ÜberschriftZur vorigen Überschrift

Die angesprochenen Technologien wie DOM, SAX, XPath, StAX sind erst einmal pure APIs. Für die APIs sind grundsätzlich verschiedene Implementierungen denkbar, jeweils mit Schwerpunkten wie Performance, Speicherverbrauch, Unicode-4-Unterstützung und so weiter. Zwei Parser-Implementierungen sind zum Beispiel:

  • Xerces (http://xerces.apache.org/xerces2-j/). Die Standardimplementierung in der aktuellen Laufzeitumgebung von Sun ab Version 5. XSL-Stylesheet-Transformationen werden standardmäßig über einen »Compiling XSLT Processor« (XSLTC) verarbeitet.

Der Nachteil bei der direkten Nutzung der Parser ist die Abhängigkeit von bestimmten Klassen. Sun hat daher eine API mit dem Namen Java API for XML Parsing (JAXP) entworfen, die als Abstraktionsschicht über folgenden Technologien liegt:

  • DOM Level 3
  • SAX 2.0.2
  • StAX
  • XSLT 1.0
  • XPath 1.0

Der unterstützte XML-Standard ist 1.0 sowie 1.1. Die Parser validieren mit DTD oder W3C XML Schema und können mit XInclude Dokumente integrieren. Von DOM wird DOM Level 3 Core und DOM Level 3 Load and Save unterstützt.

JAX 1.3 ist Teil von Java 5, und die aktuelle Version JAXP 1.4 ist Teil von Java 6 – in der Version 1.4 ist nicht viel hinzugekommen. Mehr Informationen zu den Versionen und Implementierungen geben die Webseiten https://jaxp.dev.java.net/ und http://java.sun.com/webservices/jaxp/docs.html.

Mit JAXP können Entwickler also einfach zwischen verschiedenen Parsern und XSLT-Transformern wählen, ohne den eigentlichen Code zu verändern. Das ist das gleiche Prinzip wie bei den Datenbanktreibern.


Galileo Computing - Zum Seitenanfang

15.3.6 DOM-Bäume einlesen mit JAXP topZur vorigen Überschrift

Um einen DOM-Baum einzulesen, soll unser folgendes Beispiel mit JAXP arbeiten. Eine Fabrik liefert uns einen XML-Parser, sodass wir den DOM-Baum einlesen können.

Listing 15.5 com/tutego/insel/dom/DOMParty.java

package com.tutego.insel.dom; 
 
import java.io.File; 
import javax.xml.parsers.*; 
import org.w3c.dom.Document; 
 
public class DOMParty 
{ 
  public static void main( String[] args ) throws Exception 
  { 
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); 
    DocumentBuilder builder = factory.newDocumentBuilder(); 
    Document document = builder.parse( new File("party.xml") ); 
    System.out.println( document.getFirstChild().getTextContent() ); 
  } 
}

Die Parser sind selbstständig bei DocumentBuilderFactory angemeldet, und newInstance() liefert eine Unterklasse des DocumentBuilder.



Ihr Kommentar

Wie hat Ihnen das <openbook> gefallen? Wir freuen uns immer über Ihre freundlichen und kritischen Rückmeldungen.






<< zurück
  Zum Katalog
Zum Katalog: Java ist auch eine Insel





Java ist auch eine Insel
Jetzt bestellen


 Ihre Meinung?
Wie hat Ihnen das <openbook> gefallen?
Ihre Meinung

 Tipp
Zum Katalog: Coding for Fun





 Coding for Fun


 Buchempfehlungen
Zum Katalog: Objektorientierte Programmierung





 Objektorientierte
 Programmierung


Zum Katalog: Einstieg in Eclipse 3.4






 Einstieg in
 Eclipse 3.4


Zum Katalog: Java 6 lernen mit Eclipse






 Java 6 lernen
 mit Eclipse


Zum Katalog: NetBeans Platform 6






 NetBeans
 Platform 6


Zum Katalog: Java und XML






 Java und XML


Zum Katalog: Visual C# 2008






 Visual C# 2008


Zum Katalog: IT-Handbuch für Fachinformatiker






 IT-Handbuch für
 Fachinformatiker


Zum Katalog: C++ von A bis Z






 C++ von A bis Z


 Shopping
Versandkostenfrei bestellen in Deutschland und Österreich
InfoInfo




Copyright © Galileo Press 2009
Für Ihren privaten Gebrauch dürfen Sie die Online-Version natürlich ausdrucken. Ansonsten unterliegt das <openbook> denselben Bestimmungen, wie die gebundene Ausgabe: Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Alle Rechte vorbehalten einschließlich der Vervielfältigung, Übersetzung, Mikroverfilmung sowie Einspeicherung und Verarbeitung in elektronischen Systemen.


[Galileo Computing]

Galileo Press, Rheinwerkallee 4, 53227 Bonn, Tel.: 0228.42150.0, Fax 0228.42150.77, info@galileo-press.de