Die üblichen Monster-Programme haben von der Gestaltung der HTML-Tags eine ziemlich eigenwillige Vorstellung. Die meisten Seiten entstanden daher mit dem kostenlosen AOL-Press 2.0 und mit Ulli Meybohms Phase 5 HTML-Editor (Freeware). Letzterer ist für eine größere Anzahl von HTML-Seiten (ich habe inzwischen 90 davon) sehr geeignet.
Hinweis: Im Internet arbeiten meist UNIX-Server. Denen ist die Groß- und Kleinschrteibung nicht egal. Für einen UNIX-Server können zwei Dateien mit dem Namen "A.TXT" und "a.TXT" existieren. Daher muß auch bei Links auf solche Dateien darauf geachtet werden, daß die Groß- und Kleinschreibung korrekt im Link angegeben wird.
|
Wenn man einem Browser einen Pfad ohne Dateinamen gibt, dann liefert der Server -je nach Einstellung- ersatzweise eine Standardseite zurück. Die meisten Server liefern als Standardseite eine Datei mit dem Namen index.htm, index.html oder default.htm. Wenn der Server diese nicht findet, kommt es auf die definierten Zugriffsrechte an, ob der Browser eine Fehlerseite bekommt oder ob er ein dir bzw. ls (Verzeichnisauflistung) ausgibt.
Um unnötige Fehler zu vermeiden und jedem Surfer den optimalen Zutritt zu meinen Seiten zu gewähren, enthält jedes meiner Unterverzeichnisse eine Datei (82 Bytes) index.html, die folgenden HTML-Code enthält:
<HTML><HEAD>
<META HTTP-EQUIV="REFRESH" CONTENT="0; URL=../index.html">
</HEAD></HTML>
Sinngemäß kann man auch eine Umleitung für die default.htm anlegen. Diese index.html leitet automatisch und sofort (=nach 0 sec.) zur Datei index.html/default.htm im übergeordneten Verzeichnis um.
Vorteile:
<A HRE
F="index.html" TARGET="_top"
>Startseite</A>
referenzieren. Auch wenn die HTML-Seiten verschoben werden bleibt Dank der index.html die Referenz immer gültig.
|
Wer bei Puretec und Strato ist, kann seine Seiten mit einer kleinen Datei weiter gegen fehlerhafte Links absichern, indem er in sein oberstes Verzeichnis auf dem Webserver eine Textdatei mit folgenden Zeilen anlegt:
ErrorDocument 401 http://www.ArsTechnica.de/index.html
ErrorDocument 403 http://www.ArsTechnica.de/index.html
ErrorDocument 404 http://www.ArsTechnica.de/index.html
Diese Datei wird dann in '.htaccess' umbenannt (Kleinschreibung und Punkt am Anfang
ist wichtig) und auf den Server kopiert. Diese Datei wirkt immer, wenn der Server
eigentlich die Fehlermeldungen 'Error ...' ausgeben will, weil irgend etwas mit der
Seite oder ihrem Namen nicht stimmt.
Statt den Besucher mit einer fehlermeldung zu beglücken, wird dieser nun auf die
Startseite geschickt.
|
Immer wieder wird von Problemen mit Suchmaschinen berichtet, die Seiten nicht richtig indizieren wollen oder die eigene Seite nicht angemessen ausweisen. Dazu kann man folgendes sagen:
<A HREF="MeineSeite.html"></A>
Diese Art von Links stören die Seite nicht, weil sie für den Besucher unsichtbar sind. Sie kommen aber in der Auflistung der Links des Document-Objekts vor und können damit von der Suchmaschine gelesen werden.
<META NAME="ROBOTS" CONTENT="ALL">
oder
<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">
oder
<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">
oder
<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">
oder
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">
Außerdem kann man in ein spezielles Verzeichnis die Datei
robots.txt legen, die den Text
User-Agent: *
Disallow: /
enthält und für dieses Verzeichnis das Durchsuchen verbietet (wenn man z.B. Bewerbungsunterlagen ins Netz stellt, auf die man in eMails hinweist). Eine zusätzliche Datei mit dem Namen index.htm oder index.html verhindert außerdem das Anzeigen des Verzeichnisinhaltes.
<META HTTP-EQUIV="CONTENT-TYPE" CONTENT="text/html; charset=iso-8859-1">
<META NAME="REVISIT-AFTER" CONTENT="6 MONTHS">
<META NAME="AUTHOR" CONTENT="Ralf Pfeifer">
<META NAME="ROBOTS" CONTENT="ALL">
<META NAME="LANGUAGE" CONTENT="Deutsch,German">
<META NAME="CONTENT-LANGUAGE" CONTENT="de">
<META NAME="KEYWORDS" LANG="de" CONTENT="HTML, Tips, Tipps, Homepage, Tricks, JavaScript">
Gerade bei den Keywords, sollte man auf die Rechtschreibung (alt/neu) und verwandte Begriffe achten.
|
In der Fußzeile jeder HTML-Seite habe ich noch einen weiteren
JavaScript-Befehl eingebaut:
<SCRIPT LANGUAGE="JavaScript1.1" TYPE="text/javascript" SRC="../../global/fusszeile.js"></SCRIPT>
Dadurch wird ein Skript aufgerufen, welches aktuelle Informationen wie z.B. letzte Aktualisierung der HTML-Datei und die URL der Seite angegeben. Natürlich kann man so etwas auch mit einem Server Side Include (SSI) und einer entsprechenden shtml-Seite erreichen. Doch das hat vor allem einen Nachteil: Der Empfänger erhält eine HTML-Seite und die eMail-Adresse liegt für die Suchmaschinen der Spammer, die immer nach validen Adressen suchen, offen. Bei einem Skript, welches die eMail-Adresse erst generiert, ist das schon schwieriger.