Galileo Computing < openbook > Galileo Computing - Professionelle Bücher. Auch für Einsteiger.
Professionelle Bücher. Auch für Einsteiger

Java ist auch eine Insel von Christian Ullenboom
Programmieren für die Java 2-Plattform in der Version 5 (Tiger-Release)
Buch: Java ist auch eine Insel
gp Kapitel 16 Netzwerkprogrammierung
  gp 16.1 Grundlegende Begriffe
    gp 16.1.1 Internet-Standards und RFC
  gp 16.2 URL-Verbindungen und URL-Objekte
    gp 16.2.1 Die Klasse URL
    gp 16.2.2 Informationen über eine URL
    gp 16.2.3 Der Zugriff auf die Daten über die Klasse URL
    gp 16.2.4 Verbindungen durch einen Proxy-Server
  gp 16.3 Die Klasse URLConnection
    gp 16.3.1 Methoden und Anwendung von URLConnection
    gp 16.3.2 Protokoll- und Content-Handler
    gp 16.3.3 Bilder-Handler
    gp 16.3.4 Zusammenfassung Content- und Protokoll-Handler
    gp 16.3.5 Im Detail: vom URL zu URLConnection
    gp 16.3.6 Der Protokoll-Handler für Jar-Dateien
    gp 16.3.7 Autorisierte URL-Verbindungen mit Basic Authentication
  gp 16.4 Das Common Gateway Interface
    gp 16.4.1 Parameter für ein CGI-Programm
    gp 16.4.2 Kodieren der Parameter für CGI-Programme
    gp 16.4.3 Eine Suchmaschine ansprechen
  gp 16.5 Host- und IP-Adressen
    gp 16.5.1 Lebt der Rechner?
    gp 16.5.2 Das Netz ist Klasse …
    gp 16.5.3 IP-Adresse des lokalen Hosts
    gp 16.5.4 Die Methode getAllByName()
  gp 16.6 NetworkInterface
  gp 16.7 Mit dem Socket zum Server
    gp 16.7.1 Das Netzwerk ist der Computer
    gp 16.7.2 Standarddienste unter Windows nachinstallieren
    gp 16.7.3 Eine Verbindung zum Server aufbauen
    gp 16.7.4 Server unter Spannung: die Ströme
    gp 16.7.5 Die Verbindung wieder abbauen
    gp 16.7.6 Ein kleines Echo – lebt der Rechner noch?
    gp 16.7.7 Blockierendes Lesen
    gp 16.7.8 Informationen über den Socket
    gp 16.7.9 Mit telnet an den Ports horchen
  gp 16.8 Client/Server-Kommunikation
    gp 16.8.1 Warten auf Verbindungen
    gp 16.8.2 Ein Multiplikations-Server
    gp 16.8.3 Von außen erreichbar sein
  gp 16.9 SLL-Verbindungen mit JSSE
  gp 16.10 Apache Jakarta Commons HttpClient und Net
    gp 16.10.1 Jakarta Commons HttpClient
    gp 16.10.2 Jakarta Commons Net
  gp 16.11 E-Mail
    gp 16.11.1 Wie eine E-Mail um die Welt geht
    gp 16.11.2 Das Simple Mail Transfer Protocol und RFC 822
    gp 16.11.3 POP (Post Office Protocol)
    gp 16.11.4 E-Mails versenden mit der JavaMail API von SUN
    gp 16.11.5 MimeMultipart-Nachrichten schicken
    gp 16.11.6 E-Mails mittels POP3 abrufen
    gp 16.11.7 Ereignisse und Suchen
  gp 16.12 Arbeitsweise eines Web-Servers
    gp 16.12.1 Das Hypertext Transfer Protocol (HTTP)
    gp 16.12.2 Anfragen an den Server
    gp 16.12.3 Die Antworten vom Server
  gp 16.13 Datagram-Sockets
    gp 16.13.1 Die Klasse DatagramSocket
    gp 16.13.2 Datagramme und die Klasse DatagramPacket
    gp 16.13.3 Auf ein hereinkommendes Paket warten
    gp 16.13.4 Ein Paket zum Senden vorbereiten
    gp 16.13.5 Methoden der Klasse DatagramPacket
    gp 16.13.6 Das Paket senden
    gp 16.13.7 Die Zeitdienste und ein eigener Server und Client
  gp 16.14 Tiefer liegende Netzwerkeigenschaften
    gp 16.14.1 Internet Control Message Protocol (ICMP)
    gp 16.14.2 MAC-Adresse
  gp 16.15 Multicast-Kommunikation


Galileo Computing

16.3 Die Klasse URLConnectiodowntop

Die Objekte der Klasse URLConnection sind für den Empfang der Inhalte der URL-Objekte verantwortlich. Die Klasse ist abstrakt, und die Unterklassen implementieren die Protokolle, mit denen die Verbindung zum Inhalt aufgebaut wird. Die Unterklassen bedienen sich dabei der Objekte der Klasse URLStreamHandler, mit denen der eigentliche Inhalt ausgelesen wird.


Galileo Computing

16.3.1 Methoden und Anwendung von URLConnection  downtop

Die Klasse URLConnection ist ein wenig HTTP-lastig, denn viele Methoden haben nur für URLs auf Web-Seiten eine Bedeutung. So stellt die Klasse Methoden bereit, um die HTTP-Header zu lesen. Das ist etwas untypisch für andere Protokolle, die vielleicht keine Header setzen. Da eine Datei, die vom Web-Server kommt, den Inhalt (engl. content) immer ankündigt, kann die Klasse URLConnection mit einem Content-Handler den Inhalt erkennen.


Beispiel   Um zu erfahren, wann die Datei auf dem Server gelandet ist, kann getDate() beziehungsweise getLastModified() verwendet werden.

Listing 16.3   UrlConnectionHeader.java


import java.util.*;
import java.net.*;

public class UrlConnectionHeader
{
  public static void main( String args[] ) throws Exception
  {
    String host = InetAddress.getByName("194.64.249.245").getHostName();
    System.out.println( host );
    URL url = new URL( "http://java-tutor.com/index.html"; );

    URLConnection con = url.openConnection();
    System.out.println( con );

    System.out.println( "Date            : " + new Date(con.getDate()) );

    System.out.println( "Last Modified   : " + new Date(con.getLastModified()) );

    System.out.println( "Content encoding: " + con.getContentEncoding() );

    System.out.println( "Content type    : " + con.getContentType() );

    System.out.println( "Content length  : " + con.getContentLength() );
  }
}
Die Programmzeilen würden etwa folgende Ausgabe erzeugen:

194.64.249.245
sun.net.www.protocol.http.HttpURLConnection:http://java-tutor.com/index.html
Date            : Fri Jul 23 10:09:26 CEST 2004
Last Modified   : Thu Jul 15 10:44:43 CEST 2004
Content encoding: null
Content type    : text/html
Content length  : 14531

Die Methoden und Attribute von URLConnection

Die meisten der Header-Attribute werden durch getHeaderField() verarbeitet. getHeaderFieldInt() ist eine Hilfsfunktion und bedient sich getHeaderField() wie folgt: Integer.parseInt(getHeaderField(name)). Ebenso wandelt getHeaderFieldDate() mittels getHeaderField() den String zuerst in ein long um und konvertiert ihn anschließend in ein Date-Objekt. Sehen wir uns zwei weitere Methoden an:


public String getContentType() {
  return getHeaderField("content-type");
}

public long getLastModified() {
  return getHeaderFieldDate("last-modified", 0);
}

Wie nun getHeaderField() wirklich implementiert ist, können wir nicht sehen, da es sich dabei um Funktionen handelt, die von den Unterklassen überschrieben werden. Prinzipiell ist die URLConnection-Klasse zwar für alle Protokolle gleichwertig, doch an anderer Stelle wurde schon erwähnt, dass sie eher zu Gunsten von HTTP entscheidet. Deshalb muss ein Rückgabewert von getLastModified() von einer FTP-Verbindung mit Vorsicht genossen werden.

Abbildung
Hier klicken, um das Bild zu Vergrößern


Galileo Computing

16.3.2 Protokoll- und Content-Handler  downtop

Falls ein passender Content-Handler eingetragen ist, bietet getContent() Zugriff auf den Inhalt eines URL-Objekts. Mit einer kleinen Zeile können wir erfragen, welches Handler-Objekt eine URL-Klasse für den Datenstrom einsetzt:


Object o = u.getContent();
System.out.println( "Schnapp: Ich habe einen " + o.getClass().getName() );

getContent() erkennt nun am Content-Type oder an den ersten Bytes den Typ der Datei. Dann konvertiert ein Content-Handler die Bytes seines Datenstroms in ein Java-Objekt. Der Protokoll-Handler überwacht die Verbindung zum Server und stellt dann die Verbindung zu einem konkreten Content-Handler her, der die Konvertierung in ein Objekt übernimmt.


Galileo Computing

16.3.3 Bilder-Handler  downtop

Für Bilder ist ein Handler eingetragen, der als Rückgabewert ein URLImageSource liefert. Mit wenigen Zeilen können wir dann ein Bild in Form eines Image-Objekts erzeugen, das auf dem Server weilt:


public static Image fetchImage( String url )
  throws MalformedURLException, IOException
{
  URL u = new URL( url );
  Toolkit tk = Toolkit.getDefaultToolkit();
  return tk.createImage( (ImageProducer)u.getContent() );
}

Wenn wir konkret ein Bild über eine URL laden wollen, dann bietet sich sicherlich die einfachere Methode getImage(URL) an.

Die Vorgehensweise, mit getContent() an Daten zu gelangen, funktioniert für alle Objekte – natürlich muss ein passendes Protokoll installiert sein. Für Content-Handler gilt das Gleiche wie für Protokoll-Handler: Unterschiedliche Umgebungen implementieren unterschiedliche Handler. Für HTML-Dateien liefert getContent() ein Objekt vom Typ sun.net.www.MeteredStream zurück und für normale Textdateien ein sun.net.www.content.text.PlainTextInputStream-Objekt, also nur Datenströme. Für Texte und HTML-Seiten können wir dann mit Hilfe des InputStreams (MeteredStream und PlainTextInputStream sind Unterklassen) die Datei auslesen. Leider gibt es keine Methode in der Bibliothek, die sofort die Daten in einem String bereitstellt.


Galileo Computing

16.3.4 Zusammenfassung Content- und Protokoll-Handler  downtop

gp  Content-Handler: Durch einen Content-Handler wird die Funktionalität der URL-Klasse erweitert. Es können Quellen verschiedener MIME-Typen durch die Methode getContent() als Objekte zurückgegeben werden. Leider beschreibt die Java-Spezifikation nicht, welche Content-Handler bereitgestellt werden müssen. Für GIFs und JPEGs gibt es Handler, die gleich ImageProducer anlegen.
gp  Protokoll-Handler: Auch ein Protokoll-Handler erweitert die Möglichkeiten der URL-Klassen. Das Protokoll ist der erste Teil einer URL und gibt bei Übertragungen wie »http« die Kommunikationsmethode an. Auch hier gibt es keine verbindliche Verpflichtung, diese bei einer JVM auszuliefern. So unterstützt das JDK Protokolle wie »file«, »ftp«, »jar«, »mailto«, doch schon Netscape benutzt andere Implementierungen der Klasse URLConnection. Noch anders sieht es beim Microsoft Explorer aus. Also hilft nur das Selberprogrammieren.


abstract class java.net.  URLConnection  

gp  Object getContent() throws IOException, UnknownServiceException
Liefert den Inhalt, auf den die URL verweist. UnknownServiceException ist eine Unterklasse von IOException, es reicht also ein catch auf IOException aus.


final class java.net.  URL  
implements Serializable

gp  final Object getContent() throws IOException
Liefert den Inhalt, auf den die URL verweist. Die Methode ist eine Abkürzung für openConnection().getContent(). Wegen der Umleitung auf das URLConnection-Objekt kann auch hier eine UnknownServiceException auftauchen.

Galileo Computing

16.3.5 Im Detail: vom URL zu URLConnection  downtop

Im Konstruktor des URL-Objekts wird festgelegt, um welches Protokoll es sich handelt, etwa um HTTP. Dann wird die statische Funktion getURLStreamHandler(Protokoll) aufgerufen. Sie ist die eigentliche Arbeitsstelle und findet eine entsprechende Klasse, die das Protokoll behandelt. Das funktioniert so: An das Präfix sun.net.www.protocol. wird der Name des Handlers (zum Beispiel ftp, http) und anschließend ein .Handler angehängt. Nun wird über Class.forName(clsName) nachgesehen, ob die Klasse schon im System geladen wurde. Wenn nicht, dann versucht der Klassenlader über loadClass(clsName) an die Klasse zu kommen. Falls die Klasse geladen werden konnte, wird sie mit newInstance() initialisiert und als URLStreamHandler zurückgegeben. Der Konstruktor von URL merkt sich diesen Handler in einer internen Variablen handler. Die Methode würde null zurückliefern, falls sie mit dem Protokoll nichts anzufangen weiß – dies bekämen wir zu spüren, denn eine null heißt MalformedURLException().

openConnection() von URL macht nichts weiter, als vom jeweiligen Handler wiederum openConnection() aufzurufen. Die Handler wissen für ihr Protokoll, wie die Verbindung aufzubauen ist. Denn für Web-Seiten mit dem HTTP-Protokoll sieht dies anders aus als eine Dateiübertragung mit dem FTP-Protokoll.


public URLConnection openConnection() throws java.io.IOException
{
  return handler.openConnection( this );
}

Der Handler übernimmt selbst das Öffnen. Zurückgegeben wird ein Objekt vom Typ URLConnection, und wir können damit auf die Referenz lesend (wir holen uns also Informationen beispielsweise von der Web-Seite) und schreibend (zum Beispiel für eine CGI-Abfrage) reagieren. Die Klasse URLConnection ist selbst abstrakt, und die Unterklassen implementieren ihr eigenes Protokoll.

Es muss betont werden, dass bei der Erzeugung eines URLConnection-Objekts noch keine Verbindung aufgebaut wird. Dies folgt mit den Methoden getOutputStream() oder getInputStream(). Der Handler von URLConnection ist vom Typ URLStreamHandler, eine abstrakte Superklasse, die von allen Stream-Protokoll-Handlern implementiert wird. Leider können wir diese Implementierung nicht im Quelltext sehen.



abstract class java.net.  URLConnection  

gp  URLConnection openConnection() throws IOException
Liefert ein URLConnection-Objekt, das die Verbindung zum entfernten Objekt vertritt. openConnection() wird vom Protokoll-Handler immer dann aufgerufen, wenn eine neue Verbindung geöffnet wird.

Galileo Computing

16.3.6 Der Protokoll-Handler für Jar-Dateien  downtop

Wir haben gesehen, dass url.openConnection() den Datenstrom öffnet und einen passenden Protokoll-Behandler sucht. Um die typischen Behandler-Eigenschaften zu nutzen, passen wir den Typ der Rückgabe an, so dass wir zum Beispiel eine URLConnection zu einer HttpURLConnection aufwerten, wenn wir wissen, dass der zu erwartende Behandler eine HTTP-Verbindung übernimmt.

So wie HttpURLConnection das Protokoll HTTP übernimmt, kümmert sich die JarURLConnection um das Protokoll »jar«, was sich auf Java-Archive bezieht. Das Format für die URL beginnt mit dem Namen des Protokolls, dem hinter dem Doppelpunkt die URL folgt. Der Abschluss bildet zwingend die Zeichenfolge »!/«.


URL url = new URL("jar:http://midlet.org/repository/anfy/amark/Amark.jar?md=65!/");

Des Weiteren lässt sich im Archiv eine bestimmte Datei auswählen. Die Angabe folgt dann hinter dem Trenner »!/«.


String host = "http://midlet.org/repository/anfy/amark/Amark.jar?md=65";;
String path = "a/a.class";
URL url = new URL( "jar:" + host + "!/" + path );

Nach dem Aufbau des URL-Objekts liefert url.openConnection() das URLConnection-Objekt, was wir aber explizit an JarURLConnection anpassen. Das bietet die Möglichkeit, mit getJarFile() auf das Java-Archiv zuzugreifen.


JarURLConnection conn = (JarURLConnection) url.openConnection();
JarFile jarFile = conn.getJarFile();

Das JarFile repräsentiert die Datei mit ihren Dateien, die vom Typ JarEntry sind. Mit der Funktion getEntry(String) lässt sich eine bestimmte Datei auswählen. Eine Liste der eingebundenen Dateien liefert entries() über eine Enumeration.


for ( Enumeration it = jarFile.entries(); it.hasMoreElements(); )
{
  JarEntry entry = ( JarEntry ) it.nextElement();

  if ( ! entry.isDirectory() )
    System.out.println( entry + ", " + entry.getSize() );
}

Auf unserem Beispiel liefert die Schleife die Ausgabe, die beginnt mit


a/a.class, 7504
b/a.class, 1308
b/b.class, 3293

Während getJarFile() das gesamte Archiv repräsentiert, kann ja in der URL gleich eine ganz konkrete Datei ausgewählt sein. Dann ist JarFile gar nicht nötig, denn das Interesse ist dann bei einer konkreten Datei. Die liefert getJarEntry() auf dem JarURLConnection-Objekt wieder als JarEntry-Objekt.

So viele Methoden bietet JarURLConnection nicht an, doch getManifest(), was ein Manifest-Objekt liefert, kann nützlich sein, um an die Beschreibung des Archivs zu gelangen.

Um den Inhalt zu beziehen, vermuten wir bei JarEntry eine Funktion, die einen Strom liefert. Das ist aber nicht so. Stattdessen gibt es eine Funktion getInputStream() bei JarFile, die als Parameter den JarEntry erwartet.


JarFile jarFile = conn.getJarFile();
ZipEntry entry = jarFile.getEntry( "a/a.class" );
InputStream in = new BufferedInputStream( jarFile.getInputStream(entry) );

Galileo Computing

16.3.7 Autorisierte URL-Verbindungen mit Basic Authentication  toptop

URL-Verbindungen können durch die Basic Authentication geschützt sein. Anwender bemerken dies, wenn sich ein Eingabedialog öffnet, der die Eingabe eines Namens und eines Passworts erzwingt. Die Web-Seite http://www.rahul.net/joeuser/ demonstriert diesen Eingabedialog. Der Benutzername »joeuser« und das Passwort »a.b.C.D« zeigen eine Web-Seite nach der Identifizierung.

Wollen wir ein Programm in Java schreiben, welches ein URL-Objekt auf eine Seite mit einer Authentifizierung lenkt, so hätten wir ohne die Behandlung des Logins ein Problem. Wenn wir das mit einer URL-Verbindung machen wollen, dann müssen wir verstehen, wie eine Authentifizierung abläuft. Glücklicherweise muss ein Java-Programm dazu wenig machen. Der Server schickt eine Anforderung an den Benutzernamen und das Passwort zum Client, und dieser muss der Aufforderung nachgehen. Ist unser Java-Programm der Client, muss unser Programm den Benutzernamen und das Passwort zurückschicken. Dazu verwendet das HTTP-Protokoll eine einfache Kodierung im Base64-Format. Das ist eine sehr einfache Verschlüsselung. Sind die beiden Komponenten zu einer Kennung verbunden, wird diese zum Server zurückgeschickt, bei unserem Benutzer joeuser ist das die Kennung:


Basic am9ldXNlcjphLmIuQy5E

Es bleibt ein Java-Programm, welches die Authorization »einschaltet«. Dazu setzen wir auf einem aktuellen URLConnection-Objekt conn eine passende Eigenschaft:


conn.setDoInput( true );
conn.setRequestProperty( "Authorization", kennung );
conn.connect();

Die Kennung ist in dem Format, wie unser Beispiel gerade gezeigt hat. Das letzte Geheimnis bleibt die sonderbare Kodierung Base64. Eine Reihe von Implementierungen ist im Internet verfügbar. Sun bringt ebenfalls im (eigentlich privaten) Paket sun.misc eine Klasse BASE64Encoder mit. Die nachfolgende Klasse implementiert ein Beispiel:

Listing 16.4   BasicAuth.java


import java.net.*;
import java.io.*;

public class BasicAuth
{
  public static InputStream openAuthorizedStream( URL url,
    String name, String passwd ) throws IOException
  {
    URLConnection conn = url.openConnection();
    conn.setDoInput( true );
    conn.setRequestProperty( "Authorization",
                            userNamePasswordBase64(name,passwd) );
    conn.connect();
    return conn.getInputStream();
  }

  private static String userNamePasswordBase64( String username, String password )
  {
    String s = username + ":" + password;

    String encs = new sun.misc.BASE64Encoder().encode(s.getBytes());

    return "Basic " + encs;
  }

  public static void main( String args[] ) throws Exception
  {
    URL url = new URL( "http://www.rahul.net/joeuser/"; );

    BufferedReader in = new BufferedReader( new InputStreamReader(
      openAuthorizedStream( url, "joeuser", "a.b.C.D" )) );

    System.out.println( in.readLine() );
    System.out.println( in.readLine() );
  }
}

Über die Implementierung der Sicherheit auf der Server-Seite verrät die Seite http://www. rahul.net/howto/basicauth.html etwas mehr.






1   Wer sich mit der Implementierung von Protokoll-Handlern näher auseinandersetzen möchte, der findet unter http://java.sun.com/people/brown/ eine Implementierung vom Finger-Protokoll-Handler.





Copyright © Galileo Press GmbH 2004
Für Ihren privaten Gebrauch dürfen Sie die Online-Version natürlich ausdrucken. Ansonsten unterliegt das <openbook> denselben Bestimmungen, wie die gebundene Ausgabe: Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Alle Rechte vorbehalten einschließlich der Vervielfältigung, Übersetzung, Mikroverfilmung sowie Einspeicherung und Verarbeitung in elektronischen Systemen.


[Galileo Computing]

Galileo Press GmbH, Gartenstraße 24, 53229 Bonn, Tel.: 0228.42150.0, Fax 0228.42150.77, info@galileo-press.de