Java ist auch eine Insel (2. Aufl.) – 17.28 Text in HTML-konformen Text umwandeln

Java ist auch eine Insel (2. Aufl.) von Christian Ullenboom
Programmieren für die Java 2-Plattform in der Version 1.4

Kapitel 17 Servlets und Java Server Pages
	17.1 Dynamische Webseiten und Servlets
	17.2 Vom Client zum Server und wieder zurück
		17.2.1 Der bittende Client
		17.2.2 Was erzeugt ein Webserver für eine Antwort?
		17.2.3 Wer oder was ist MIME?
	17.3 Servlets und Java Server Pages entwickeln und testen
		17.3.1 Servlet-Container
		17.3.2 Webserver mit Servlet-Funktionalität
		17.3.3 Tomcat
	17.4 Java Server Pages
		17.4.1 JSP mit Tomcat nutzen
	17.5 Skript-Elemente
		17.5.1 Scriptlets
		17.5.2 Ausdrücke
		17.5.3 Deklarationen
		17.5.4 Kommentare und Quoting
	17.6 Webapplikationen
	17.7 Implizite Objekte
	17.8 Entsprechende XML-Tags
	17.9 Was der Browser mit auf den Weg gibt – HttpServletRequest
		17.9.1 Verarbeiten der Header
		17.9.2 Hilfsfunktion im Umgang mit Headern
		17.9.3 Übersicht der Browser-Header
	17.10 Formulardaten
	17.11 Das HttpServletResponse-Objekt
		17.11.1 Automatisches Neuladen
		17.11.2 Seiten umlenken
	17.12 JSP-Direktiven
		17.12.1 page-Direktiven im Überblick
		17.12.2 include-Direktive
	17.13 Aktionen
		17.13.1 Aktion include
		17.13.2 Aktion forward
		17.13.3 Aktion plugin
	17.14 Beans
		17.14.1 Beans in JSP-Seiten anlegen, Attribute setzen und erfragen
		17.14.2 Der schnelle Zugriff auf Parameter
	17.15 Kleine Kekse: die Klasse Cookies
		17.15.1 Cookies erzeugen und setzen
		17.15.2 Cookies vom Servlet einlesen
		17.15.3 Kleine Helfer für Cookies
		17.15.4 Cookie-Status ändern
		17.15.5 Langlebige Cookies
		17.15.6 Ein Warenkorbsystem
	17.16 Sitzungsverfolgung (Session Tracking)
		17.16.1 Das mit einer Sitzung verbundene Objekt HttpSession
		17.16.2 Werte mit einer Sitzung assoziieren und auslesen
		17.16.3 URL-Rewriting
		17.16.4 Zusätzliche Informationen
	17.17 Tag-Libraries
		17.17.1 Standard Tag Library (JSTL) der Apache-Gruppe
		17.17.2 Beispiel mit einer Taglib-Direktive
	17.18 Das erste Servlet kompilieren und ausführen
		17.18.1 Servlets kompilieren
		17.18.2 Wohin mit dem Servlet?
	17.19 Der Lebenszyklus eines Servlets
		17.19.1 Initialisierung in init()
		17.19.2 Abfragen bei service()
		17.19.3 Mehrere Anfragen beim Servlet und die Thread-Sicherheit
		17.19.4 Das Ende eines Servlets
	17.20 Das HttpServletResponse-Objekt
		17.20.1 Wir generieren eine Webseite
		17.20.2 Binärdaten senden
		17.20.3 Komprimierte Daten mit Content-Encoding
		17.20.4 Noch mehr über Header, die der Server setzt
	17.21 Servlets und Sessions
	17.22 Weiterleiten und Einbinden von Servlet-Inhalten
	17.23 Inter-Servlet-Kommunikation
		17.23.1 Daten zwischen Servlets teilen
	17.24 Internationalisierung
		17.24.1 Die Länderkennung des Anfragers auslesen
		17.24.2 Länderkennung für die Ausgabe setzen
		17.24.3 Westeuropäische Texte senden
	17.25 Sonstiges zu den Servern
		17.25.1 Den internen Compiler bei Tomcat für JSP ändern
	17.26 Tomcat: Spezielles
		17.26.1 Tomcat als Service unter Windows NT ausführen
		17.26.2 MIME-Types mit Tomcat verbinden
		17.26.3 Servlets beim Start laden
	17.27 Ein Servlet generiert WAP-Seiten für das Handy
		17.27.1 Ein WAP-Handy simulieren
		17.27.2 Übersicht der wichtigsten Tags
		17.27.3 Der Gateway
		17.27.4 WML-Seiten aufbauen
		17.27.5 Interessante Links zum Thema Servlets/JSP
	17.28 Text in HTML-konformen Text umwandeln

17.28 Text in HTML-konformen Text umwandeln

Beliebiger Text kann nicht ohne weiteres in eine HTML-Datei wandern, da viele Symbole für den Browser von besonderer Bedeutung sind. Daher müssen wir sie vorher konvertieren. Ein einfaches Programm zur HTML-Ausgabe haben wir im Zusammenhang mit Datenströmen kennen gelernt. Wir wollen dies nun weiterführen und eine statische Funktion escape(String) angeben, die eine Zeichenkette nimmt und als Rückgabewert eine HTML-reine Zeichenkette liefert.

Listing 17.27 HTMLEscape.java

public class HTMLEscape
{
  public static String escape( String s )
  {
    int len = s.length();
    StringBuffer sb = new StringBuffer(len*5/4);

    for ( int i = 0; i < len; i++ )
    {
      char c = s.charAt( i );
      String elem = htmlchars[c&0xff];

      sb.append( elem == null ? ""+c : elem );
     }
     return sb.toString();
  }

  private static String htmlchars[] = new String[256];

  static
  {
    String entry[] = {
      "nbsp", "iexcl", "cent", "pound", "curren", "yen", "brvbar",
      "sect", "uml", "copy", "ordf", "laquo", "not", "shy", "reg",
      "macr", "deg", "plusmn", "sup2", "sup3", "acute", "micro",
      "para", "middot", "cedil", "sup1", "ordm", "raquo", "frac14",
      "frac12", "frac34", "iquest",
      "Agrave", "Aacute", "Acirc", "Atilde", "Auml", "Aring", "AElig",
      "CCedil", "Egrave", "Eacute", "Ecirc", "Euml", "Igrave", "Iacute",
      "Icirc", "Iuml", "ETH", "Ntilde", "Ograve", "Oacute", "Ocirc",
      "Otilde", "Ouml","times", "Oslash", "Ugrave", "Uacute", "Ucirc",
      "Uuml", "Yacute", "THORN", "szlig",
      "agrave", "aacute", "acirc", "atilde", "auml", "aring", "aelig",
      "ccedil", "egrave", "eacute", "ecirc", "euml", "igrave", "iacute",
      "icirc", "iuml", "eth", "ntilde", "ograve", "oacute", "ocirc",
      "otilde", "ouml", "divid", "oslash", "ugrave", "uacute", "ucirc",
      "uuml", "yacute", "thorn", "yuml"
    };

    htmlchars['&'] = "&amp;";
    htmlchars['<'] = "&lt;";
    htmlchars['>'] = "&gt;";

    for ( int c = '\u00A0', i=0 ; c <= '\u00FF'; c++, i++ )
      htmlchars[c] = "&"+entry[i]+";";

    for ( int c = '\u0083', i=131 ; c <= '\u009f'; c++, i++ )
      htmlchars[c] = "&#"+i+";";

    htmlchars['\u0088']=htmlchars['\u008D']=htmlchars['\u008E'] = null;
    htmlchars['\u008F']=htmlchars['\u0090']=htmlchars['\u0098'] = null;
    htmlchars['\u009D'] = null;
  }

  public static void main( String args[] )
  {
    String s = "Das ist <B><I>HTML in Tags</I></B>!";

    System.out.println( "-> " + s );
    System.out.println( "<- " + HTMLEscape.escape(s) );
  }
}

Unsere Klasse initialisiert zunächst im static-Block einmalig eine Umwandlungstabelle. Da wir nicht mehr als 256 Zeichen erwarten, assoziieren wir mit einem Zeichen entweder ein druckbares gültiges Zeichen oder ein Sonderzeichen, das durch ein Kürzel der Art &XXX; ausgedrückt wird. In einem Feld von 256 Strings speichern wir daher entweder das Kürzel oder lassen das Feldelement uninitialisiert, dann aber steht dort null, und wir wissen, dass sich dahinter das Originalzeichen verbirgt. In der escape()-Funktion laufen wir dann die Zeichenkette ab und sehen für jedes Zeichen im Feld nach, ob sich dort ein Kürzel befindet. Wenn ja, dann setzen wir es in das Ergebnis ein. Wenn wir das Ganze noch als OutputStreamFilter oder Writer implementierten, würde dies die Sache noch mehr vereinfachen.

<< zurück

<top>

vor >>