HTML Dokument


HTML Dokument – korrekt definiert

Kommunikation zwischen Browser und Server
Eine korrekt programmierte HTML-Datei enthält immer drei Teile: Die „Dokumenttyp-Angabe“, „Head“ und „Body“. Um zu verstehen, warum das so ist, sehen wir uns doch einmal an, was geschieht, wenn man über den Browser eine Internetseite aufruft. Ganz gleich, ob Sie nun eine Internetadresse (URL) direkt in die Adresszeile Ihres Browsers eingeben, ob Sie eine Seite aus Ihrer Bookmarkliste heraus aufrufen oder ob Sie auf einen Link in einem bereits geöffneten Dokument klicken, geschieht immer das gleiche: Ihr Browser klopft bei einen Server an und bittet ihn, ihm Daten auszuhändigen. Wie es sich im zivilisierten Internet gehört, stellt sich Ihr Browser erst einmal vor: Mein Name ist Netscape, am liebsten spreche ich Deutsch und noch ein paar andere Formalitäten werden ausgetauscht. Dann entscheidet der Server, was er dem Browser an Daten ausliefert und weil auch der Server an Höflichkeit nicht zurückstehen will, sagt er dem Browser, was dieser jetzt zu erwarten hat.

Dokumenttyp-Angabe
Da HTML stets weiterentwickelt wird, legen Sie mit der Dokumenttyp-Angabe fest, auf welche Version sich Ihre Programmierung stützt. Wenn Sie heute eine Webseite programmieren, beziehen Sie sich unter Umständen auf Tags, die es in zehn Jahren vieleicht gar nicht mehr gibt. Damit Ihre Seite dann immer noch gelesen werden kann, findet Ihr Browser mit der Dokumenttyp-Angabe die passende Referenz. Eine solche Angabe sieht beispielsweise so aus: <!DOCTYPE HTML PUBLIC „-//W3C//DTD HTML 4.01 Transitional//EN“ „http://www.w3.org/TR/html4/loose.dtd“>. Was das alles im Detail bedeutet, braucht erst mal nicht zu interessieren. Wichtig ist nur, dass Sie sich mit dieser Angabe auf HTML der Version 4.01 beziehen und kein „striktes“ HTML programmieren, der Browser bei der Interpretation Ihrer Seite also etwas nachsichtiger umgeht.

„Head“ oder Kopf der HTML-Datei
Nachdem sich Browser und Server auf eine gemeinsame Sprache geeinigt haben, schickt der Server nun seine Daten. Der Klammerstruktur der HTML-Programmierung getreu wird die folgende Seite von einem <html></html> eingefasst, denn nun folgt das eigentliche HTML-Dokument. Es beginnt mit dem sogenannten Kopf der Seite, der von den Tags <head></head>eingefasst ist. In diesem Teil stehen eine Menge Dinge, die am Bildschirm hinterher nicht zu sehen sind, die aber das Dokument näher beschreiben. Man findet im Head Angaben zu den Stichwörtern der Datei, dem Titel, in welcher Sprache sie abgefasst ist, eine Beschreibung des Inhalts und so weiter. Man kann an dieser Stelle als HTML-Programmierer viele Angaben machen, man muss es aber nicht. Sinnvoll sind jedoch Angaben zum Titel (<title>), den Stichwörtern und eine kurze Zusammenfassung (sog. „Meta-Angaben keywords und description“) der Seite, denn das sind Daten, auf die die Suchmaschinen-Crawler, das sind kleine Programme, die von den Suchmaschinen ausgesandt werden, um Inhalte im Internet zu sammeln, zurückgreifen und die bei der Listung ihrer Homepage in den Suchmaschinen eine Rolle spielen.

Sichtbarer Inhalt im „Body-Teil“
Zwischen den <body></body> Tags der Seite stehen nun alle Inhalte, die man auch später auf dem Bildschirm sieht. Dorthin tragen wir auch unser kleines Textelement ein und erhalten folgenden HTML-Code für unsere erste korrekte Webseite:

<!DOCTYPE HTML PUBLIC „-//W3C//DTD HTML 4.01 Transitional//EN“ „http://www.w3.org/TR/html4/loose.dtd“>
<html>
<head>
<title>HTML Tutorial (erscheint auch als Fensterbeschreibung im Betriebssystem)</title>
<meta name=“description“ content=“was hier steht, liest man später in der Regel auch in der Suchmaschine“>
<meta name=“keywords“ content=“HTML lernen programmieren (diese Stichwörter wertet die Suchmaschine aus)“>
</head>
<body>
<p><font face=“arial“ size=“2″>Hallo Welt</font></p>
</body>
</html>

Mit dem <font>-Tag enthält unser HTML-Dokument allerdings einen Befehl, der als „deprecated“ eingestuft wird, was nichts anderes bedeutet, als dass es diesen Befehl nicht mehr lang geben wird. Solche Befehle sind irgendwann mal als Notlösung in die HTML-Programmierung eingeführt worden und sollen nun nach und nach durch Entsprechungen in CSS ersetzt werden, weswegen Sie, wie in diesem Fall die Schriftformatierungen, auch gleich in CSS vornehmen sollten.