Sonderzeichen in HTML-Dateien (Basiswissen + Erklärungen)
Ein HTML-Dokument ist ein Textdokument. In dem Dokument stehen Inhalte und Anweisungen. Die Anweisungen stehen in spitzen Klammern, das wissen sie bereits.!
|
|
Notierung von Sonderzeichen in HTML-Seiten
|
Eigentlich ist ihnen klar: Man kann z.B. nicht so ohne weiteres die öffnende spitze Klammer (<) im Text verwenden, würde der Browser doch sofort einen HTML-Befehl vermuten. Daher müssen solche Zeichen über eine andere Notation eingetragen werden. Aber auch andere Sonderzeichen lassen sich so einfügen. |
|
Bjørn Nordstrøm Café Sowiso 5 < 8; 25,70 € ± 2 178,25 m²
Eine Liste der wichtigsten Sonderzeichen (auch als PDF-Datei) finden sie hier
Erst einmal die Grundlagen über Text in HTML-Seiten
Vor der Erklärung zu den Sonderzeichen kommen zur Erläuterung des Prinzips erst mal die Grundlagen zu 'normalen' Zeichen. Wenn sie gleich zur Notation von Sonderzeichen springen möchten, lesen sie unten weiter.
Ganz tief in den Anweisungen für den Computer sind die Befehle zum Anzeigen der HTML-Seite in viel kleinere Stückchen einzelner Anweisungen aufgegliedert. Um zum Beispiel den Buchstaben 'a' innerhalb der Seite darzustellen erhält er die Anweisung, aus einer Liste von Zeichen das Zeichen 97 anzuzeigen und alles Notwendige zu tun, das dieses Zeichen auf dem Bildschirm am richtigen Platz, in der richtigen Größe und Farbe angezeigt wird. Das regelt der Rechner wiederum in Zusammenarbeit mit der Grafikkarte.
Wir müssen hier lediglich behalten, dass das darzustellende Zeichen einer Tabelle entnommen wird. Diese Tabelle ist die Zeichensatztabelle. Davon gibt es, abhängig von der verwendeten Sprache, viele unterschiedliche (lateinische Sprachen, griechisch, japanisch, ...).
In der HTML-Datei stehen also aus der Sicht des Computers nicht ihre eingegebenen Buchstaben und Satzzeichen, sondern Byte für Byte numerische Werte wie 097, 075, 168 oder 032 (übrigens werden die Zeichen auf dem Weg von der Tastatur zum Rechner genauso übermittelt).
Der Browser versucht nun beim Aufbau der Seite herauszufinden, nach welchem Zeichensatz er diese numerischen Angaben interpretieren soll. Ob beispielsweise nach einem westeuropäischen, einem griechischen oder einem japanischen Zeichensatz. Dazu liest er die Angaben im HEAD-Bereich der HTML-Datei.
Werden dort keine Angaben gefunden, verfährt er nach seinen Grundeinstellungen und das kann schiefgehen.
In den Browsereinstellungen (Ansicht - Zeichenkodierung) könnte der Seitenbesucher das zwar auch selbst einstellen oder korrigieren, aber das sollte man ihm doch lieber abnehmen. Schließlich ist das unser Job und wir sind verantwortlich. Ausnahmen gibts allerdings. Nicht immer liegt die Schuld für eine falsche Kodierung beim Webmaster!
Angaben zum Zeichensatz im HEAD
Nun wirds wieder englisch! Ich habe eben von einer Zeichensatztabelle gesprochen. In der vorwiegend englischsprachigen Computerwelt heist dieses Verzeichnis 'ChracterSet' [engl. character = Buchstabe]. Eine Tabelle mit einem 'Satz von Buchstaben'.
Welcher characterset für eine Webseite verwendet werden soll sollte man im Kopf der HTML-Seite vermerken. Dort taucht dann das Kürzel charset auf
<meta http-equiv="content-type" content="text/html; charset=iso-8859-1">
... bedeutet: Verwende zur Interpretation der Werte die Zeichentabelle für "Latin-1"
Weitere Info: SELFHTML - Internationalisierung - Zeichensätze
Sonderzeichen
Beispiele:
Preis: 25 £ Preis: 25 € Preis: 25 ¥ Preis: 78 ¢
... und auch unsere deutschen Umlaute und das scharfe S sind Sonderzeichen. Die Arbeit sie entsprechend einzutragen, nehmen uns meistens die HTML-Editoren ab. Falls nicht, müssen sie das Sonderzeichen als 'benanntes Zeichen' oder in numerischer Notation einfügen.
| Zeichen |
Beschreibung |
Benannt |
Num. Code |
| ¢ |
Cent-Zeichen |
¢ |
¢ |
| £ |
Pfund-Zeichen |
£ |
£ |
| € |
Euro-Zeichen |
€ |
€ |
| ¥ |
Yen-Zeichen |
¥ |
¥ |
|
Eine Liste der wichtigsten Sonderzeichen (auch als PDF-Datei) finden sie hier
Sonderzeichen, können auf 2 Weisen eingefügt werden:
a numerische Noation
Seit HTML 4.0 kann jedes Zeichen aus dem Zeichenvorrat nach ISO 10646 (deckungsgleich mit dem Unicode-Standard) notiert werden. Eine solche numerische Notationen kann mit dezimalen oder hexadezimalen Angaben gemacht werden:
dezimal: &#[Nummer]; oder
hexadezimal: &#[x][Nummer];
Notierung
| erzeugt | Wert | Beschreibung |
|
Ÿ | Ÿ
|
dezimal 376
| Das Ÿ (Y mit Trema) ist ein sehr seltener Buchstabe im Deutschen und Französischen. Im Walisischen kommt er häufiger vor. |
|
² | ²
|
dezimal 178
| Das ² ist die hochgestellte Ziffer Zwei. Anwendungsbeispiel 4² = 16 oder 25 m² |
|
ó | ó
|
dezimal 243
| Im Polnischen wird der Buchstabe ó wie ein deutsches U ausgesprochen. |
|
Ÿ | Ÿ
|
hexadezimal 178
| Das Ÿ (Y mit Trema) ist ein sehr seltener Buchstabe im Deutschen und Französischen. Im Walisischen kommt er häufiger vor. |
|
² | ²
|
hexadezimal B2
| Das ² ist die hochgestellte Ziffer Zwei. Anwendungsbeispiel 4² = 16 oder 25 m² |
|
ó | ó
|
hexadezimal F3
| Im Polnischen wird der Buchstabe ó wie ein deutsches U ausgesprochen. |
b Benannte Zeichen (named entities)
Zeichen-Entität-Referenzen [engl.: character entity references], werden auch Entities genannt!
named entities bedeutet: "benannte Zeichen". Das Schema für eine solche Notationen ist:
&[Name];
Beispiel einer Notation in HTML:
Notierung
| |
Zeichen | Bezeichnung |
|
© | erzeugt: | © | copy
|
|
€ | erzeugt: | € | Euro
|
|
& | erzeugt: | & | ampersand
|
|
→ | erzeugt: | → | PfeilRechts
|
Darf ich sie zu einem Ausflug einladen?
Falls sie das bereits kennen, mag es eine Hilfe sein wenn es darum geht Sonderzeichen in hexadezimaler oder dezimaler Schreibweise in ihr HTML-Dokument einzutragen.
In einem Windows-System steht ihnen unter 'Zusatzprogramme' / 'Hilfen' eine Zeichentabelle zur Verfügung. In der Textverarbeitung 'Word' gibt es ebefalls eine Möglichkeit über einen Menübefehl Sinderzeichen einzufügen. Beide Male wird ihnen eine Zeichentabelle angeboten.

Die Position(snummer) innerhalb der Zeichentabelle wird ebenfalls angezeigt. In dem Screenshot hier in der unteren rechten Ecke. Genau das ist der Wert, den sie verwenden können.
Das sie in Word dieses Zeichen mittels festgehalterner ALT-Taste und Eingabe der Zahl über den Nummernblock einfügen können, wissen ja schon. Dann erzähle ich ihnen ja auch nichts Neues.
Versuchen sie es einmal: ALT-Taste festhalten und auf dem Nummernblock 0169 (4 Ziffern) eintippen. Das Ergenos sollte ein © sein.
Alternativ: Menü 'Einfügen' Auswahl 'Zeichen' (versionsabhängig)

|