Galileo Computing < openbook > Galileo Computing - Professionelle Bücher. Auch für Einsteiger.
Professionelle Bücher. Auch für Einsteiger.

Inhaltsverzeichnis
Vorwort
1 Java ist auch eine Sprache
2 Sprachbeschreibung
3 Klassen und Objekte
4 Der Umgang mit Zeichenketten
5 Mathematisches
6 Eigene Klassen schreiben
7 Angewandte Objektorientierung
8 Exceptions
9 Generics, innere Klassen
10 Die Klassenbibliothek
11 Threads und nebenläufige Programmierung
12 Datenstrukturen und Algorithmen
13 Raum und Zeit
14 Dateien und Datenströme
15 Die eXtensible Markup Language (XML)
16 Grafische Oberflächen mit Swing
17 Grafikprogrammierung
18 Netzwerkprogrammierung
19 Verteilte Programmierung mit RMI und Web–Services
20 JavaServer Pages und Servlets
21 Applets
22 Midlets und die Java ME
23 Datenbankmanagement mit JDBC
24 Reflection und Annotationen
25 Logging und Monitoring
26 Sicherheitskonzepte
27 Java Native Interface (JNI)
28 Dienstprogramme für die Java-Umgebung
Stichwort

Download:
- ZIP, ca. 14,1 MB
Buch bestellen
Ihre Meinung?

Spacer
<< zurück
Java ist auch eine Insel (8. Auflage) von Christian Ullenboom
Programmieren mit der Java Standard Edition Version 6
Buch: Java ist auch eine Insel (8. Auflage)

Java ist auch eine Insel (8. Aufl.)
8., aktual. Auflage, geb., mit DVD
1.475 S., 49,90 Euro
Galileo Computing
ISBN 978-3-8362-1371-4
Pfeil 15 Die eXtensible Markup Language (XML)
Pfeil 15.1 Auszeichnungssprachen
Pfeil 15.1.1 Die Standard Generalized Markup Language (SGML)
Pfeil 15.1.2 Extensible Markup Language (XML)
Pfeil 15.2 Eigenschaften von XML-Dokumenten
Pfeil 15.2.1 Elemente und Attribute
Pfeil 15.2.2 Beschreibungssprache für den Aufbau von XML-Dokumenten
Pfeil 15.2.3 Schema – eine Alternative zu DTD
Pfeil 15.2.4 Namensraum (Namespace)
Pfeil 15.2.5 XML-Applikationen
Pfeil 15.3 Die Java-APIs für XML
Pfeil 15.3.1 Das Document Object Model (DOM)
Pfeil 15.3.2 Simple API for XML Parsing (SAX)
Pfeil 15.3.3 Pull-API StAX
Pfeil 15.3.4 Java Document Object Model (JDOM)
Pfeil 15.3.5 JAXP als Java-Schnittstelle zu XML
Pfeil 15.3.6 DOM-Bäume einlesen mit JAXP
Pfeil 15.4 Serielle Verarbeitung mit StAX
Pfeil 15.4.1 Unterschiede der Verarbeitungsmodelle
Pfeil 15.4.2 XML-Dateien mit dem Cursor-Verfahren lesen
Pfeil 15.4.3 XML-Dateien mit dem Iterator-Verfahren verarbeiten
Pfeil 15.4.4 Mit Filtern arbeiten
Pfeil 15.4.5 XML-Dokumente schreiben
Pfeil 15.5 Serielle Verarbeitung von XML mit SAX
Pfeil 15.5.1 Schnittstellen von SAX
Pfeil 15.5.2 SAX-Parser erzeugen
Pfeil 15.5.3 Operationen der Schnittstelle ContentHandler
Pfeil 15.5.4 ErrorHandler und EntityResolver
Pfeil 15.6 XML-Dateien mit JDOM verarbeiten
Pfeil 15.6.1 JDOM beziehen
Pfeil 15.6.2 Paketübersicht
Pfeil 15.6.3 Die Document-Klasse
Pfeil 15.6.4 Eingaben aus der Datei lesen
Pfeil 15.6.5 Das Dokument im XML-Format ausgeben
Pfeil 15.6.6 Der Dokumenttyp
Pfeil 15.6.7 Elemente
Pfeil 15.6.8 Zugriff auf Elementinhalte
Pfeil 15.6.9 Liste mit Unterelementen erzeugen
Pfeil 15.6.10 Neue Elemente einfügen und ändern
Pfeil 15.6.11 Attributinhalte lesen und ändern
Pfeil 15.6.12 XPath
Pfeil 15.7 Transformationen mit XSLT
Pfeil 15.7.1 Templates und XPath als Kernelemente von XSLT
Pfeil 15.7.2 Umwandlung von XML-Dateien mit JDOM und JAXP
Pfeil 15.8 Java Architecture for XML Binding (JAXB)
Pfeil 15.8.1 Beans für JAXB aufbauen
Pfeil 15.8.2 JAXBContext und die Marshaller/Unmarshaller
Pfeil 15.8.3 Weitere JAXB-Annotationen
Pfeil 15.9 HTML-Dokumente einlesen
Pfeil 15.10 Zum Weiterlesen


Galileo Computing - Zum Seitenanfang

15.5 Serielle Verarbeitung von XML mit SAX Zur nächsten ÜberschriftZur vorigen Überschrift

Die Verarbeitung von XML-Dateien mit SAX ist vor dem Erscheinen von StAX die schnellste und speicherschonendste Methode gewesen. Der Parser liest die XML-Datei seriell und ruft für jeden Bestandteil der XML-Datei eine spezielle Methode auf. Der Nachteil ist, dass immer nur ein kleiner Bestandteil einer XML-Datei betrachtet wird und nicht die gesamte Struktur zur Verfügung steht.


Galileo Computing - Zum Seitenanfang

15.5.1 Schnittstellen von SAX Zur nächsten ÜberschriftZur vorigen Überschrift

Die bei der Verarbeitung mit SAX anfallenden Ereignisse sind in verschiedenen Schnittstellen festgelegt. Die wichtigste Schnittstelle ist org.xml.sax.ContentHandler. Die Schnittstelle legt die wichtigsten Operationen für die Verarbeitung fest, denn die später realisierten Methoden ruft der Parser beim Verarbeiten der XML-Daten auf.

Die Klasse org.xml.sax.helpers.DefaultHandler ist eine leere Implementierung aller Operationen aus ContentHandler. Zusätzlich implementiert DefaultHandler die Schnittstellen DTDHandler, EntityResolver und ErrorHandler. Auf diese Schnittstellen wird hier nicht näher eingegangen. Eine genaue Beschreibung ist in dem JAXP-Tutorial von Sun (http://java.sun.com/webservices/jaxp/docs.html) zu finden.


Galileo Computing - Zum Seitenanfang

15.5.2 SAX-Parser erzeugen Zur nächsten ÜberschriftZur vorigen Überschrift

Um zum Parsen einer Datei zu kommen, führt der Weg über zwei Fabrikmethoden.

Listing 15.11 com/tutego/insel/sax/SaxParty.java, main()

SAXParserFactory factory = SAXParserFactory.newInstance(); 
SAXParser saxParser = factory.newSAXParser(); 
DefaultHandler handler = new PartyHandler(); 
saxParser.parse( new File("party.xml"), handler );

Mit dem SAXParser erledigt parse() das Einlesen. Die Methode benötigt die Datei und eine Implementierung der Callback-Methoden, die wir als PartyHandler bereitstellen.


Galileo Computing - Zum Seitenanfang

15.5.3 Operationen der Schnittstelle ContentHandler Zur nächsten ÜberschriftZur vorigen Überschrift

DefaultHandler ist eine Klasse, die alle Operationen aus EntityResolver, DTDHandler, ContentHandler und ErrorHandler leer implementiert. Unsere Unterklasse PartyHandler erweitert die Klasse DefaultHandler und überschreibt interessantere Methoden, die wir mit Leben füllen wollen.

Listing 15.12 com/tutego/insel/sax/PartyHandler.java

package com.tutego.insel.sax; 
 
import org.xml.sax.Attributes; 
import org.xml.sax.helpers.DefaultHandler; 
 
class PartyHandler extends DefaultHandler 
{

Beim Start und Ende des Dokuments ruft der Parser die Methoden startDocument() und endDocument() auf. Unsere überschriebenen Methoden geben nur eine kleine Meldung auf dem Bildschirm aus:

  @Override 
  public void startDocument() 
  { 
    System.out.println( "Document starts." ); 
  } 
 
  @Override 
  public void endDocument() 
  { 
    System.out.println( "Document ends." ); 
  }

Sobald der Parser ein Element erreicht, ruft er die Methode startElement() auf. Der Parser übergibt der Methode die Namensraumadresse, den lokalen Namen, den qualifizierenden Namen und Attribute.

  @Override 
  public void startElement( String namespaceURI, String localName, 
                            String qName, Attributes atts ) 
  { 
    System.out.println( "namespaceURI: " + namespaceURI ); 
    System.out.println( "localName: " + localName ); 
    System.out.println( "qName: " + qName ); 
 
    for ( int i = 0; i < atts.getLength(); i++ ) 
      System.out.printf( "Attribut no. %d: %s = %s%n", i, 
                         atts.getQName( i ), atts.getValue( i ) ); 
  }

Unsere Methode gibt alle notwendigen Informationen eines Elements aus. Falls kein spezieller Namensraum vergeben ist, sind die Strings namespaceURI und localName leer. Der String qName ist immer gefüllt. Die Attribute enthält der Container Attributes. Das schließende Tag eines Elements verarbeitet die Methode endElement(String namespaceURI, String localName, String qName). Bis auf die Attribute sind auch bei dem schließenden Tag alle Informationen für die Identifizierung des Elements vorhanden. Auch hier sind die Strings namespaceURI und localName leer, falls kein spezieller Namensraum verwendet wird.

Den Inhalt eines Elements verarbeitet unsere letzte Methode characters():

  @Override 
  public void characters( char[] ch, int start, int length ) 
  { 
    System.out.println( "Characters:" ); 
 
    for ( int i = start; i < (start + length); i++ ) 
      System.out.printf( "%1$c (%1$x) ", (int) ch[i] ); 
 
    System.out.println(); 
  } 
}

Es ist nicht festgelegt, ob der Parser den Text an einem Stück liefert oder in kleinen Stücken. [Die Eigenschaft nennt sich »Character Chunking«: http://www.tutego.com/blog/javainsel/2007/01/character-chunking-bei-sax.html.] Zur besseren Sichtbarkeit geben wir neben dem Zeichen selbst auch seinen Hexadezimalwert aus. So beginnt die Ausgabe mit den Zeilen:

Document starts. 
namespaceURI: 
localName: 
qName: party 
Attribut no. 0: datum = 31.12.01 
Characters: 
 
 (a) 
 (a)   (20)   (20)   (20) 
namespaceURI: 
localName: 
qName: gast 
Attribut no. 0: name = Albert Angsthase 
Characters: 
 
 (a)   (20)   (20)   (20)   (20)   (20)   (20) 
namespaceURI: 
localName: 
qName: getraenk 
Characters: 
W (57) e (65) i (69) n (6e) 
Characters: 
 
 (a)   (20)   (20)   (20)   (20)   (20)   (20) 
namespaceURI: 
localName: 
qName: getraenk 
Characters: 
B (42) i (69) e (65) r (72)

Galileo Computing - Zum Seitenanfang

15.5.4 ErrorHandler und EntityResolver topZur vorigen Überschrift

Immer dann, wenn der Parser einen Fehler melden muss, ruft er die im ErrorHandler deklarierten Operationen auf.

  • void warning( SAXParseException exception )
  • void error( SAXParseException exception )
  • void fatalError( SAXParseException exception )

Da der DefaultHandler die Methoden warning() und error() leer implementiert, fällt kein Fehler wirklich auf; nur bei fatalError() leitet die Methode den empfangenen Fehler mit throw weiter. Das heißt aber auch, dass zum Beispiel schwache Validierungsfehler nicht auffallen. Eine Implementierung kann aber wie folgt aussehen:

public void error( SAXParseException e ) throws SAXException 
{ 
  throw new SAXException( saxMsg(e) ); 
} 
private String saxMsg( SAXParseException e ) 
{ 
  return   "Line: " + e.getLineNumber() + ", Column: " 
         + e.getColumnNumber() + ", Error: " + e.getMessage(); 
}

Die Klasse DefaultHandler implementiert ebenso die Schnittstelle EntityResolver, aber auch hier einfach die eine Methode InputSource resolveEntity (String publicId, String systemId) mit einem return null. Das heißt, die Standardimplementierung löst keine Entities auf. Eigene Implementierungen sehen meist im Kern so aus:

InputStream stream = MyEntityResolver.class.getResourceAsStream( dtd ); 
return new InputSource( new InputStreamReader( stream ) );

Die Variable dtd ist mit dem Pfadnamen einer DTD belegt, die im Klassenpfad liegen muss.



Ihr Kommentar

Wie hat Ihnen das <openbook> gefallen? Wir freuen uns immer über Ihre freundlichen und kritischen Rückmeldungen.






<< zurück
  Zum Katalog
Zum Katalog: Java ist auch eine Insel





Java ist auch eine Insel
Jetzt bestellen


 Ihre Meinung?
Wie hat Ihnen das <openbook> gefallen?
Ihre Meinung

 Tipp
Zum Katalog: Coding for Fun





 Coding for Fun


 Buchempfehlungen
Zum Katalog: Objektorientierte Programmierung





 Objektorientierte
 Programmierung


Zum Katalog: Einstieg in Eclipse 3.4






 Einstieg in
 Eclipse 3.4


Zum Katalog: Java 6 lernen mit Eclipse






 Java 6 lernen
 mit Eclipse


Zum Katalog: NetBeans Platform 6






 NetBeans
 Platform 6


Zum Katalog: Java und XML






 Java und XML


Zum Katalog: Visual C# 2008






 Visual C# 2008


Zum Katalog: IT-Handbuch für Fachinformatiker






 IT-Handbuch für
 Fachinformatiker


Zum Katalog: C++ von A bis Z






 C++ von A bis Z


 Shopping
Versandkostenfrei bestellen in Deutschland und Österreich
InfoInfo




Copyright © Galileo Press 2009
Für Ihren privaten Gebrauch dürfen Sie die Online-Version natürlich ausdrucken. Ansonsten unterliegt das <openbook> denselben Bestimmungen, wie die gebundene Ausgabe: Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Alle Rechte vorbehalten einschließlich der Vervielfältigung, Übersetzung, Mikroverfilmung sowie Einspeicherung und Verarbeitung in elektronischen Systemen.


[Galileo Computing]

Galileo Press, Rheinwerkallee 4, 53227 Bonn, Tel.: 0228.42150.0, Fax 0228.42150.77, info@galileo-press.de