23.13 Einführung in SQL 

SQL ist die bedeutendste Abfragesprache für relationale Datenbanken, in der Benutzer angeben, auf welche Daten sie zugreifen möchten. [Bei einer OODB ist dies OQL und bei XML-Datenbanken in der Regel XQuery.] Obgleich die Bezeichnung »Abfragesprache« etwas irreführend klingt, beinhaltet sie auch Befehle zur Datenmanipulation und Datendefinition, um beispielsweise neue Tabellen zu erstellen. Nachdem Anfang der 1970er Jahre das relationale Modell für Datenbanken populär geworden war, entstand im IBM-Forschungslabor San José (jetzt Almaden) ein Datenbanksystem namens »System R«. Das relationale Modell wurde 1970 von Dr. Edgar F. Codd [1981 erhielt er für seine Arbeit mit relationalen Datenbanken den Turing-Award – eine Art Nobelpreis für Informatiker.] entwickelt. System R bot eine Abfragesprache, die SEQUEL (Structured English Query Language) genannt wurde. Später wurde SEQUEL in SQL umbenannt. Da sich relationale Systeme großer Beliebtheit erfreuten, wurde 1986 die erste SQL-Norm vom ANSI-Konsortium verabschiedet. 1988 wurde der Standard geändert, und 1992 entstand die zweite Version von SQL (SQL-2 beziehungsweise SQL-92 genannt). Da die wichtigen Datenbanken alle SQL-2 verarbeiten, kann ein Programm über diese Befehle die Datenbank steuern, ohne verschiedene proprietäre Schnittstellen nutzen zu müssen. Dennoch können über SQL die speziellen Leistungen einer Datenbank genutzt werden.
Sprache | Entwicklung |
SQUARE |
1975 |
SEQUEL |
1975, IBM Research Labs San José |
SEQUEL2 |
1976, IBM Research Labs San José |
SQL |
1982, IBM |
ANSI-SQL |
1986 |
ISO-SQL (SQL 89, SQL-1) |
1989, drei Sprachen: Level 1, Level 2, +IEF |
SQL-2 (bzw. SQL-92) |
1992 |
SQL-3 (auch SQL-1999) |
1999 |
Damit sich ein Datenbanktreiber JDBC-kompatibel nennen kann, muss er mindestens SQL-92 unterstützen. Das bedeutet jedoch nicht, dass die existierenden Treiber alle Eigenschaften von SQL-92 implementieren müssen; über Kannst-du-Methoden lässt sich der Treiber fragen, ob er Eigenschaften unterstützt oder nicht.
23.13.1 Ein Rundgang durch SQL-Abfragen 

Da das Wort »Abfragesprache« eine Art Programmiersprache suggeriert, sind wir an einem Beispiel interessiert. Um es vorwegzusagen: Es gibt nur eine Handvoll wichtiger Befehle, und SELECT, UPDATE und CREATE decken schon einen Großteil davon ab. Obwohl die Groß- und Kleinschreibung der Befehle unbedeutend ist, sind sie zwecks besserer Lesbarkeit im Folgenden großgeschrieben.
Beispiel Eine einfache Abfrage in SQL: SELECT Lfr_Name FROM Lieferanten Die Tabellen und Spalten sind auch für die folgenden Beispiele fiktiv. |
Tabellen nehmen die Benutzerdaten auf, und mit dem Kommando FROM wählen wir die Tabelle Lieferanten aus, die für die Berechnung erforderlich ist. Die Tabelle Lieferanten enthält drei Attribute (die Spalten), die wir mit SELECT auswählen. In einer Datenbank werden normalerweise mehrere Tabellen verwendet, ein so genanntes Datenbankschema. Jede Tabelle gehört zu genau einem Schema.
SQL-Abfragen sind nahe an der Umgangssprache formuliert. Im oberen Beispiel liest sich die Abfrage einfach als: »Wähle die Spalte Lfr_Name aus der Tabelle Lieferanten«. Der Designer einer Datenbank muss sich natürlich vor der Umsetzung der Tabellen und somit der Relationen gründlich Gedanken machen. Eine spätere Änderung der Struktur wird nämlich teuer. So muss schon am Anfang einkalkuliert werden, welche Daten in welchen Ausprägungen auftreten können. Nach Statistiken der amerikanischen Library of Congress verdoppelt sich insgesamt alle fünf Jahre die Informationsmenge. Was wäre, wenn diese Informationen alles Einträge in einer endlos verzweigten Datenbank wären und jemand feststellen würde, dass das Tabellenschema ungünstig ist? Datenbankdesigner nennen den Vorgang von einem ersten Modell bis zur fertigen Relation Normalisierung.
Bevor wir mit den einzelnen Sprachelementen von SQL fortfahren, an dieser Stelle einige Regeln für SQL-Ausdrücke:
- Die SQL-Anweisungen sind unabhängig von der Groß- und Kleinschreibung. Im Text sind die SQL-Kommandos großgeschrieben, damit die Ausdrücke besser lesbar sind.
- Leerzeichen, Return und Tabulatoren sind in einer Abfrage bedeutungslos. Im Folgenden werden zur besseren Lesbarkeit Zeilenumbrüche verwendet.
- SQL-Anweisungen werden mit einer Zeichenkette abgeschlossen. Sie unterscheidet sich aber von Datenbank zu Datenbank. Häufig ist dies ein Semikolon; es kann aber auch ein \go sein. Wir werden die Anweisungen in den Beispielen nicht abschließen, da JDBC diesen Abschluss automatisch vornimmt.
Wir werden uns im Folgenden etwas intensiver um SQL-Abfragen kümmern. Es zeigt sich, dass eine einzelne SQL-Anweisung sehr ausdrucksstark sein kann. JDBC hat mit dieser Ausdrucksstärke aber nichts zu schaffen, es kennt nicht einmal ihre Korrektheit. JDBC leitet den SQL-Befehl einfach an den Treiber, und dieser leitet das Kommando an die Datenbank weiter.
SQL gliedert sich in eine Reihe von unterschiedlichen Abfragetypen – die einen sind mehr mit der Modifikation von Daten, die anderen eher mit deren Abfrage beschäftigt. Anbei die wichtigsten drei Sprachen:
- DDL (Data Definition Language). Erstellen der Tabellen, Beziehungen (mit Schlüsseln) und Indizes. Typische SQL-Anweisungen sind: CREATE/DROP DATABASE, CREATE/DROP INDEX, CREATE/DROP SYNONYM, CREATE/DROP TABLE, CREATE/DROP VIEW.
- DML (Data Manipulation Language). Daten hinzufügen und löschen. Typische SQL-Anweisungen sind hier: INSERT, DELETE, UPDATE.
- DQL (Data Query Language). Daten auswählen und filtern. Die typischste SQL-Anweisung ist SELECT mit den Spezialisierungen ALL, DISTINCT, ORDER BY, GROUP BY, HAVING, Unterabfragen (IN, ANY, ALL, EXISTS), Schnittmengen und Joins.
23.13.2 Datenabfrage mit der Data Query Language (DQL) 

DQL sind Abfragekommandos, um auf die Inhalte zuzugreifen. In SQL steckt auch schon das Wort »Query«, unsere Abfrage. Das wichtigste Element ist hierbei das oben bereits erwähnte SELECT.
SELECT {Feldname, Feldname,..|*} ( * = alle Felder ) FROM Tabelle [, Tabelle, Tabelle....] [WHERE {Bedingung}] [ORDER BY Feldname [ASC|DESC]...] [GROUP BY Feldname [HAVING {Bedingung}]]
Das Angenehme an SQL ist die Tatsache, dass wir uns nicht um das Wie kümmern müssen, sondern nur um das Was. Wir fragen also etwa: »Welche Lieferanten wohnen in Aalen?«, und formulieren:
SELECT Lfr_Name FROM Lieferanten WHERE Wohnort='Aalen'
Dabei ist es uns egal, wie die Datenbankimplementierung mit dieser Abfrage umgeht. Hier unterscheiden sich auch die Anbieter in ihrer Leistungsfähigkeit und in den Preisen.
Kümmern wir uns nun um die verschiedenen Schreibweisen von SELECT. Geben wir in SELECT einen Spaltennamen oder Spaltenindex an, so bekommen wir nur die Ergebnisse dieser Spalte zurück. Eine Abfrage mit »*« liefert alle Spalten zurück. Damit wir also nicht nur den Namen des Kunden bekommen, sondern auch die anderen Angaben – um ihm gleich einen Auftrag zu geben –, schreiben wir Folgendes, um eine Liste aller Lieferanten in Aalen zu erhalten:
SELECT * FROM Lieferanten WHERE Wohnort='Aalen'
Wir sehen, dass es keinen Unterschied macht, ob die Abfragen in mehrere Zeilen aufgespaltet sind oder in einer Zeile stehen.
Zeilen ausfiltern und logische Operatoren
Die SELECT-Anweisung geht über die Spalten, und die WHERE-Angabe filtert Zeilen nach einem Kriterium heraus. Wir haben zunächst mit einer Gleich-Abfrage gearbeitet. SQL kennt die üblichen Vergleichsoperatoren: = gleich, <> ungleich, > größer, < kleiner, >= größer gleich, <= kleiner gleich. Vergleiche werden mit einem einfachen Gleichheitszeichen und nicht durch == formuliert. Die Vergleichsoperatoren lassen sich durch die Operatoren AND, OR und NOT weiter verfeinern. Bei numerischen Daten können wir auch die Rechenoperatoren (+, –, *, /) anwenden. An Stelle vielfacher AND-Abfragen lässt sich mit zwei SQL-Anweisungen auch der Wertebereich weiter einschränken. Die Einschränkung BETWEEN Wert1 AND Wert2 testet, ob sich ein Vergleichswert zwischen Wert1 und Wert2 befindet. Und IN (Werteliste) prüft, ob der Vergleichswert in der angegebenen Werteliste liegt. Für Zeichenketten spielt noch LIKE eine Rolle, da hier ein Mustervergleich vorgenommen werden kann. IS NULL erlaubt die Abfrage nach einem NULL-Wert in der Spalte.
Wenn wir diese SQL-Anweisung von der Datenbank ausführen lassen, wollen wir die Daten gern entsprechend dem Preis sortiert haben. Dazu lässt sich die SELECT-Anweisung mit einem ORDER BY versehen. Dahinter folgt die Spalte, nach der sortiert wird. Jetzt wird die Tabelle aufsteigend sortiert, also der kleinste Wert unten. Wünschen wir die Sortierung absteigend, dann setzen wir noch DESC hintenan.
Wir wollen nun die Informationen mehrerer Tabellen miteinander verbinden. Dazu führen wir eine Tupel-Variable ein. Diese kann eingesetzt werden, wenn sich Attribute nicht eindeutig den Relationen zuordnen lassen. Dies ist genau dann der Fall, wenn zwei Relationen verbunden werden sollen und beide den gleichen Attributnamen besitzen.
Beispiel Die SQL-Anweisung zeigt die Verwendung der Variablen, die hier jedoch nicht erforderlich ist, weil wir nur eine Tabelle verwenden. SELECT L.Lfr_Name, L.Wohnort FROM Lieferanten L WHERE L.Wohnort = 'Aalen' |
Der Buchstabe »L« ist hier nur eine Abkürzung, eine Art Variable. Abkürzungen für Spalten werden in SQL auch mit AS abgetrennt, etwa so:
FROM Lieferant AS L
Dann lässt sich auf die Spalte Lieferant in der Tabelle Lieferanten kurz mit L zugreifen.
Gruppenfunktionen
Mit Gruppenfunktionen (auch Aggregationsfunktionen) lassen sich zum Beispiel Durchschnittswerte oder Minima über Spalten beziehen. Sie liefern genau einen Wert, beziehen sich jedoch auf mehrere Tabellenzeilen. Die folgende Abfrage zählt alle Anbieter aus Aalen:
SELECT COUNT(*) FROM Lieferanten WHERE Wohnort = 'Aalen'
Die Spalten, die die Gruppenfunktion bearbeiten, stehen in Klammern hinter dem Namen. Die SQL-Standardfunktionen (es gibt datenbankabhängig noch viel mehr) sind in der folgenden Tabelle aufgeführt:
AVG |
Durchschnittswert |
COUNT |
Anzahl aller Einträge |
MAX |
Maximalwert |
MIN |
Minimalwert |
SUM |
Summe aller Einträge in einer Spalte |
23.13.3 Tabellen mit der Data Definition Language (DDL) anlegen 

Die SQL-Anweisung CREATE TABLE legt eine neue Tabelle (Relation) an. Dazu gibt die Anweisung die Spalten (Attribute) mit ihren Wertebereichen an. Optional lassen sich Integritäts-bedingungen definieren, etwa, ob eine Spalte mit einem Eintrag belegt sein muss (NOT NULL) oder welcher Fremdschlüssel eingetragen ist.
CREATE TABLE Tabelle (Spaltendefinition [,Spaltendefinition] ... [, Primärschlüsseldefinition] [, Fremdschlüsseldefinition [,Fremdschlüsseldefinition] ... ] ) [IN Tabellenspace] [INDEX IN Tabellenspace2] [LONG IN Tabellenspace3];