Sonderzeichen in HTML-Dateien (Basiswissen + Erklärungen)
Ein HTML-Dokument ist ein Textdokument. In dem Dokument stehen Inhalte und Anweisungen. Die Anweisungen stehen in spitzen Klammern, das wissen sie bereits.!
|
|
Notierung von Sonderzeichen in HTML-Seiten
|
Eigentlich ist ihnen klar: Man kann z.B. nicht so ohne weiteres die öffnende spitze Klammer (<) im Text verwenden, würde der Browser doch sofort einen HTML-Befehl vermuten. Daher müssen spitze Klammern über eine andere Notation eingetragen werden. Aber auch andere Sonderzeichen lassen sich so einfügen. |
|
Bjørn Nordstrøm Café Sowiso
5 < 8; 25,70 € ± 2 178,25 m ²
Sonderzeichen
Beispiele:
Preis: 25 £ Preis: 25 € Preis: 25 ¥ Preis: 78 ¢
... und auch unsere deutschen Umlaute und das scharfe S sind Sonderzeichen. Die Arbeit sie entsprechend einzutragen, nehmen uns meistens die HTML-Editoren ab. Falls nicht, müssen sie das Sonderzeichen als 'benanntes Zeichen' oder in numerischer Notation einfügen.
| Zeichen |
Beschreibung |
Benannt |
Num. Code |
| ¢ |
Cent-Zeichen |
¢ |
¢ |
| £ |
Pfund-Zeichen |
£ |
£ |
| € |
Euro-Zeichen |
€ |
€ |
| ¥ |
Yen-Zeichen |
¥ |
¥ |
|
Eine Liste der wichtigsten Sonderzeichen (auch als PDF-Datei) finden sie hier
Sonderzeichen, können auf 2 Weisen eingefügt werden:
a numerische Noation
Seit HTML 4.0 kann jedes Zeichen aus dem Zeichenvorrat nach ISO 10646 (deckungsgleich mit dem Unicode-Standard) notiert werden. Eine solche numerische Notationen kann mit dezimalen oder hexadezimalen Angaben gemacht werden:
dezimal: &#[Nummer]; oder
hexadezimal: &#[x][Nummer];
Notierung
| erzeugt | Wert | Beschreibung |
| dezimale Nummerierung |
|
Ÿ | Ÿ
|
dezimal 376
| Das Ÿ (Y mit Trema) ist ein sehr seltener Buchstabe im Deutschen und Französischen. Im Walisischen kommt er häufiger vor. |
|
² | ²
|
dezimal 178
| Das ² ist die hochgestellte Ziffer Zwei. Anwendungsbeispiel 4² = 16 oder 25 m² |
|
ó | ó
|
dezimal 243
| Im Polnischen wird der Buchstabe ó wie ein deutsches U ausgesprochen. |
| hexadezimale Nummerierung |
|
Ÿ | Ÿ
|
hexadezimal 178
| Das Ÿ (Y mit Trema) ist ein sehr seltener Buchstabe im Deutschen und Französischen. Im Walisischen kommt er häufiger vor. |
|
² | ²
|
hexadezimal B2
| Das ² ist die hochgestellte Ziffer Zwei. Anwendungsbeispiel 4² = 16 oder 25 m² |
|
ó | ó
|
hexadezimal F3
| Im Polnischen wird der Buchstabe ó wie ein deutsches U ausgesprochen. |
b Benannte Zeichen (named entities)
Zeichen-Entität-Referenzen [engl.: character entity references], werden auch Entities genannt!
named entities bedeutet: "benannte Zeichen". Das Schema für eine solche Notationen ist:
&[Name];
Beispiel einer Notation in HTML:
Notierung
| |
Zeichen | Bezeichnung |
|
© | erzeugt: | © | copy
|
|
€ | erzeugt: | € | Euro
|
|
& | erzeugt: | & | ampersand
|
|
→ | erzeugt: | → | PfeilRechts
|
Liste der benannten Sonderzeichen
Buchstaben und Zeichensatz
Ganz tief in den Anweisungen für den Computer sind die Befehle zum Anzeigen der HTML-Seite in viel kleinere Stückchen einzelner Anweisungen aufgegliedert. Um zum Beispiel den Buchstaben 'b' innerhalb der Seite darzustellen erhält er die Anweisung, aus einer Liste von Zeichen das Zeichen 98 anzuzeigen und alles Notwendige zu tun, das dieses Zeichen auf dem Bildschirm am richtigen Platz, in der richtigen Größe und Farbe angezeigt wird. Das regelt der Rechner wiederum in Zusammenarbeit mit der Grafikkarte.
Die muss eine Menge Bildschirmpünktchen anspechen, um einen Buchstaben darzustellen.
|
|
Um das Zeichen 98 der Zeichentabelle für "Latin-1" darzustellen, wird die Grafikkarte nach dem Beispiel oben 126 Bildschimpünktchen in Farbe und Intensität unterschiedlich 'ausleuchten'.
Wir müssen hier lediglich behalten, dass das darzustellende Zeichen einer Tabelle entnommen wird. Diese Tabelle ist die Zeichensatztabelle. Davon gibt es, abhängig von der verwendeten Sprache, viele unterschiedliche (lateinische Sprachen, griechisch, japanisch, ...).
In der HTML-Datei stehen also aus der Sicht des Computers nicht ihre eingegebenen Buchstaben und Satzzeichen, sondern Byte für Byte numerische Werte wie 097, 075, 168 oder 032 (übrigens werden die Zeichen auf dem Weg von der Tastatur zum Rechner genauso übermittelt).
Der Browser versucht nun beim Aufbau der Seite herauszufinden, nach welchem Zeichensatz er diese numerischen Angaben interpretieren soll. Ob beispielsweise nach einem westeuropäischen, einem griechischen oder einem japanischen Zeichensatz. Dazu liest er die Angaben im HEAD-Bereich der HTML-Datei.
Werden dort keine Angaben gefunden, verfährt er nach seinen Grundeinstellungen und das kann schiefgehen.
In den Browsereinstellungen (Ansicht - Zeichenkodierung) könnte der Seitenbesucher das zwar auch selbst einstellen oder korrigieren, aber das sollte man ihm doch lieber abnehmen. Schließlich ist das unser Job und wir sind verantwortlich. Ausnahmen gibts allerdings. Nicht immer liegt die Schuld für eine falsche Kodierung beim Webmaster!
Angaben zum Zeichensatz im HEAD
Nun wirds wieder englisch! Ich habe eben von einer Zeichensatztabelle gesprochen. In der vorwiegend englischsprachigen Computerwelt heist dieses Verzeichnis 'ChracterSet' [engl. character = Buchstabe]. Eine Tabelle mit einem 'Satz von Buchstaben'.
Welchern Characterset für eine Webseite verwendet werden soll, sollte der Browser im Head-Bereich der HTML-Seite finden. Dazu wird eine META-Angabe notiert. Dort taucht dann das Kürzel charset auf
<html>
<head>
<titel>Gerbils mongolische Wüstenrennmäuse - Haltung und Pflege</titel>
...
<meta http-equiv="content-type" content="text/html; charset=iso-8859-1">
<meta http-equiv="Content-Style-Type" content="text/css">
<link rel="shortcut icon" type="image/x-icon" href="favicon.ico">
...
... bedeutet: Verwende zur Interpretation der Werte die Zeichentabelle für "Latin-1"
Weitere Info: SELFHTML - Internationalisierung - Zeichensätze
Darf ich sie zu einem Ausflug einladen?
Falls sie das bereits kennen, mag es eine Hilfe sein wenn es darum geht Sonderzeichen in hexadezimaler oder dezimaler Schreibweise in ihr HTML-Dokument einzutragen.
In einem Windows-System steht ihnen unter 'Zusatzprogramme' / 'Hilfen' eine Zeichentabelle zur Verfügung. In der Textverarbeitung 'Word' gibt es ebefalls eine Möglichkeit über einen Menübefehl Sinderzeichen einzufügen. Beide Male wird ihnen eine Zeichentabelle angeboten. Diese Zeichentabelle ist möglicherweise eine Hilfe, wenn Sie auf der Suche nach einem 'exotischen' Sonderzeichen sind.

Beispiel ein Halb: ½ = ½
Die Position(snummer) innerhalb der Zeichentabelle wird ebenfalls angezeigt. In dem Screenshot hier in der unteren rechten Ecke. Genau das ist der Wert, den sie verwenden können.
Das sie in Word dieses Zeichen mittels festgehalterner ALT-Taste und Eingabe der Zahl über den Nummernblock einfügen können, wissen ja schon. Dann erzähle ich ihnen ja auch nichts Neues.
Versuchen sie es einmal in Ihrem Schreibprogramm: ALT-Taste festhalten und auf dem Nummernblock 0169 (4 Ziffern) einzutippen. Das Ergebos sollte ein © sein. Eine Zauberei die Schüler der AG-Computer immer wieder fasziniert und viele Erwachsene Nutzer nicht kennen.
Alternativ: Menü 'Einfügen' Auswahl 'Zeichen' (versionsabhängig)

|