Tips, Tricks und Hilfsmittel

[Umleitung mit index.html] • [Apache Webserver] • [Suchmaschinen antriggern] • [Stand der letzten Aktualisierung]

Die üblichen Monster-Programme haben von der Gestaltung der HTML-Tags eine ziemlich eigenwillige Vorstellung. Die meisten Seiten entstanden daher mit dem kostenlosen AOL-Press 2.0 und mit Ulli Meybohms Phase 5 HTML-Editor (Freeware). Letzterer ist für eine größere Anzahl von HTML-Seiten (ich habe inzwischen 90 davon) sehr geeignet.

Hinweis: Im Internet arbeiten meist UNIX-Server. Denen ist die Groß- und Kleinschrteibung nicht egal. Für einen UNIX-Server können zwei Dateien mit dem Namen "A.TXT" und "a.TXT" existieren. Daher muß auch bei Links auf solche Dateien darauf geachtet werden, daß die Groß- und Kleinschreibung korrekt im Link angegeben wird.

Umleitung mit index.html

Wenn man einem Browser einen Pfad ohne Dateinamen gibt, dann liefert der Server -je nach Einstellung- ersatzweise eine Standardseite zurück. Die meisten Server liefern als Standardseite eine Datei mit dem Namen ‘index.htm’, ‘index.html’ oder ‘default.htm’. Wenn der Server diese nicht findet, kommt es auf die definierten Zugriffsrechte an, ob der Browser eine Fehlerseite bekommt oder ob er ein ‘dir’ bzw. ‘ls’ (Verzeichnisauflistung) ausgibt.

Um unnötige Fehler zu vermeiden und jedem Surfer den optimalen Zutritt zu meinen Seiten zu gewähren, enthält jedes meiner Unterverzeichnisse eine Datei (82 Bytes) index.html, die folgenden HTML-Code enthält:

<HTML><HEAD> <META HTTP-EQUIV="REFRESH" CONTENT="0; URL=../index.html"> </HEAD></HTML>

Sinngemäß kann man auch eine Umleitung für die ‘default.htm’ anlegen. Diese ‘index.html’ leitet automatisch und sofort (=nach 0 sec.) zur Datei index.html/default.htm im übergeordneten Verzeichnis um.

Vorteile:

Bei Angabe des Verzeichnisses ohne Dateinamen springt index.html auf die Datei index.html im übergeordneten Verzeichnis, diese springt wiederum zum übergeordneten Verzeichnis ... usw., bis die Startseite index.html erreicht wird.
Falls einmal der Link zu einer Seite in einem bestimmten Unterverzeichnis verloren geht (Dateinamensänderung) gibt der schlaue Surfer den Namen des Verzeichnisses an und erhält durch meine index-Konstruktion wieder Kontakt zu meiner Startseite.
Das Browsen in meinen Unterverzeichnissen wird außerdem vermieden.
Diese index.html kann stehen, wo sie will. Sie verweist immer auf eine gültige Seite, auch wenn ganze Unterverzeichnise auf dem Web-Server verschoben werden.
Die übrigen HTML-Seiten können als Startseite immer
<A HREF="index.html" TARGET="_top">Startseite</A>
referenzieren. Auch wenn die HTML-Seiten verschoben werden bleibt Dank der index.html die Referenz immer gültig.

Apache Webserver

Damit ein Server im Internet Seiten liefern kann, braucht er ein Programm, welches unter der Bezeichnung 'Web-Server' bekannt ist. Microsoft liefert dazu den 'Internet Information Server' (IIS), kostenlos und ausgezeichnet ist allerdings der 'Apache Webserver' der nicht nur für Windows-Server, sondern auch für Linux-Server eingesetzt wird

Wer bei Puretec und Strato ist, kann seine Seiten mit einer kleinen Datei weiter gegen fehlerhafte Links absichern, indem er in sein oberstes Verzeichnis auf dem Webserver eine Textdatei mit folgenden Zeilen anlegt:

ErrorDocument 401 http://www.ArsTechnica.de/index.html

ErrorDocument 403 http://www.ArsTechnica.de/index.html

ErrorDocument 404 http://www.ArsTechnica.de/index.html

Diese Datei wird dann in '.htaccess' umbenannt (Kleinschreibung und Punkt am Anfang ist wichtig) und auf den Server kopiert. Diese Datei wirkt immer, wenn der Server eigentlich die Fehlermeldungen 'Error ...' ausgeben will, weil irgend etwas mit der Seite oder ihrem Namen nicht stimmt.
Statt den Besucher mit einer fehlermeldung zu beglücken, wird dieser nun auf die Startseite geschickt.

Suchmaschinen antriggern

Immer wieder wird von Problemen mit Suchmaschinen berichtet, die Seiten nicht richtig indizieren wollen oder die eigene Seite nicht angemessen ausweisen. Dazu kann man folgendes sagen:

Die ersten Plätze auf der Trefferliste einer Suchmaschine lassen sich kaufen.
Suchmaschinen kann man neugierig machen, z.B. durch intensive Verlinkung der eigenen Seiten. Ein Hilfsmittel können ‘versteckten’ Links sein:
<A HREF="MeineSeite.html"></A>
Diese Art von Links stören die Seite nicht, weil sie für den Besucher unsichtbar sind. Sie kommen aber in der Auflistung der Links des Document-Objekts vor und können damit von der Suchmaschine gelesen werden.
Mit einer der der Meta-Anweisungen kann man das Verhalten von Suchmaschinen beeinflussen:
<META NAME="ROBOTS" CONTENT="ALL"> oder
<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW"> oder
<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW"> oder
<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW"> oder
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">
Außerdem kann man in ein spezielles Verzeichnis die Datei ‘robots.txt’ legen, die den Text
User-Agent: * Disallow: /
enthält und für dieses Verzeichnis das Durchsuchen verbietet (wenn man z.B. Bewerbungsunterlagen ins Netz stellt, auf die man in eMails hinweist). Eine zusätzliche Datei mit dem Namen ‘index.htm’ oder ‘index.html’ verhindert außerdem das Anzeigen des Verzeichnisinhaltes.
Weitere META-Tags können die Suchmaschinen unterstützen. Auf dieser Seite sind es folgende Tags:
<META HTTP-EQUIV="CONTENT-TYPE" CONTENT="text/html; charset=iso-8859-1"> <META NAME="REVISIT-AFTER" CONTENT="6 MONTHS"> <META NAME="AUTHOR" CONTENT="Ralf Pfeifer"> <META NAME="ROBOTS" CONTENT="ALL"> <META NAME="LANGUAGE" CONTENT="Deutsch,German"> <META NAME="CONTENT-LANGUAGE" CONTENT="de"> <META NAME="KEYWORDS" LANG="de" CONTENT="HTML, Tips, Tipps, Homepage, Tricks, JavaScript">
Gerade bei den Keywords, sollte man auf die Rechtschreibung (alt/neu) und verwandte Begriffe achten.

Automatisch die Fußzeile anhängen

In der Fußzeile jeder HTML-Seite habe ich noch einen weiteren JavaScript-Befehl eingebaut:
<SCRIPT LANGUAGE="JavaScript1.1" TYPE="text/javascript" SRC="../../global/fusszeile.js"></SCRIPT>

Dadurch wird ein Skript aufgerufen, welches aktuelle Informationen wie z.B. letzte Aktualisierung der HTML-Datei und die URL der Seite angegeben. Natürlich kann man so etwas auch mit einem Server Side Include (SSI) und einer entsprechenden shtml-Seite erreichen. Doch das hat vor allem einen Nachteil: Der Empfänger erhält eine HTML-Seite und die eMail-Adresse liegt für die Suchmaschinen der Spammer, die immer nach validen Adressen suchen, offen. Bei einem Skript, welches die eMail-Adresse erst generiert, ist das schon schwieriger.