Sonderzeichen
    


WWW.WEB-TOOLBOX.NET

ZURÜCK SITEMAP  

 Sonderzeichen in HTML-Dateien   (Basiswissen + Erklärungen)

Ein HTML-Dokument ist ein Textdokument. In dem Dokument stehen Inhalte und Anweisungen. Die Anweisungen stehen in spitzen Klammern, das wissen sie bereits.!

Notierung von Sonderzeichen in HTML-Seiten

Eigentlich ist ihnen klar: Man kann z.B. nicht so ohne weiteres die öffnende spitze Klammer (<) im Text verwenden, würde der Browser doch sofort einen HTML-Befehl vermuten. Daher müssen solche Zeichen über eine andere Notation eingetragen werden. Aber auch andere Sonderzeichen lassen sich so einfügen.


Bjørn Nordstrøm    Café Sowiso    5 < 8;    25,70    ± 2   178,25 m²

Eine Liste der wichtigsten Sonderzeichen (auch als PDF-Datei) finden sie hier



   Erst einmal die Grundlagen über Text in HTML-Seiten

Vor der Erklärung zu den Sonderzeichen kommen zur Erläuterung des Prinzips erst mal die Grundlagen zu 'normalen' Zeichen. Wenn sie gleich zur Notation von Sonderzeichen springen möchten, lesen sie unten weiter.

Ganz tief in den Anweisungen für den Computer sind die Befehle zum Anzeigen der HTML-Seite in viel kleinere Stückchen einzelner Anweisungen aufgegliedert. Um zum Beispiel den Buchstaben 'a' innerhalb der Seite darzustellen erhält er die Anweisung, aus einer Liste von Zeichen das Zeichen 97 anzuzeigen und alles Notwendige zu tun, das dieses Zeichen auf dem Bildschirm am richtigen Platz, in der richtigen Größe und Farbe angezeigt wird. Das regelt der Rechner wiederum in Zusammenarbeit mit der Grafikkarte.


Wir müssen hier lediglich behalten, dass das darzustellende Zeichen einer Tabelle entnommen wird. Diese Tabelle ist die Zeichensatztabelle. Davon gibt es, abhängig von der verwendeten Sprache, viele unterschiedliche (lateinische Sprachen, griechisch, japanisch, ...).

In der HTML-Datei stehen also aus der Sicht des Computers nicht ihre eingegebenen Buchstaben und Satzzeichen, sondern Byte für Byte numerische Werte wie 097, 075, 168 oder 032 (übrigens werden die Zeichen auf dem Weg von der Tastatur zum Rechner genauso übermittelt).

Der Browser versucht nun beim Aufbau der Seite herauszufinden, nach welchem Zeichensatz er diese numerischen Angaben interpretieren soll. Ob beispielsweise nach einem westeuropäischen, einem griechischen oder einem japanischen Zeichensatz. Dazu liest er die Angaben im HEAD-Bereich der HTML-Datei.

Werden dort keine Angaben gefunden, verfährt er nach seinen Grundeinstellungen und das kann schiefgehen.

In den Browsereinstellungen (Ansicht - Zeichenkodierung) könnte der Seitenbesucher das zwar auch selbst einstellen oder korrigieren, aber das sollte man ihm doch lieber abnehmen. Schließlich ist das unser Job und wir sind verantwortlich. Ausnahmen gibts allerdings. Nicht immer liegt die Schuld für eine falsche Kodierung beim Webmaster!


  Angaben zum Zeichensatz im HEAD

Nun wirds wieder englisch! Ich habe eben von einer Zeichensatztabelle gesprochen. In der vorwiegend englischsprachigen Computerwelt heist dieses Verzeichnis 'ChracterSet' [engl. character = Buchstabe]. Eine Tabelle mit einem 'Satz von Buchstaben'.

Welcher characterset für eine Webseite verwendet werden soll sollte man im Kopf der HTML-Seite vermerken. Dort taucht dann das Kürzel charset auf

<meta http-equiv="content-type" content="text/html; charset=iso-8859-1">
... bedeutet: Verwende zur Interpretation der Werte die Zeichentabelle für "Latin-1"

Weitere Info: SELFHTML - Internationalisierung - Zeichensätze
 

  Sonderzeichen

Beispiele:

Preis: 25 £   Preis: 25   Preis: 25 ¥   Preis: 78 ¢


... und auch unsere deutschen Umlaute und das scharfe S sind Sonderzeichen. Die Arbeit sie entsprechend einzutragen, nehmen uns meistens die HTML-Editoren ab. Falls nicht, müssen sie das Sonderzeichen als 'benanntes Zeichen' oder in numerischer Notation einfügen.

Zeichen Beschreibung Benannt Num. Code
¢ Cent-Zeichen &cent; &#162;
£ Pfund-Zeichen &pound; &#163;
Euro-Zeichen &euro; &#8364;
¥ Yen-Zeichen &yen; &#165;

Eine Liste der wichtigsten Sonderzeichen (auch als PDF-Datei) finden sie hier



   Sonderzeichen, können auf 2 Weisen eingefügt werden:

a  numerische Noation

Seit HTML 4.0 kann jedes Zeichen aus dem Zeichenvorrat nach ISO 10646 (deckungsgleich mit dem Unicode-Standard) notiert werden. Eine solche numerische Notationen kann mit dezimalen oder hexadezimalen Angaben gemacht werden:

dezimal:  &#[Nummer];  oder  hexadezimal:  &#[x][Nummer];

Notierung
erzeugtWertBeschreibung
&#376;Ÿ
dezimal 376 Das Ÿ (Y mit Trema) ist ein sehr seltener Buchstabe im Deutschen und Französischen. Im Walisischen kommt er häufiger vor.
&#178;²
dezimal 178 Das ² ist die hochgestellte Ziffer Zwei. Anwendungsbeispiel
4² = 16 oder 25 m²
&#243;ó
dezimal 243 Im Polnischen wird der Buchstabe ó wie ein deutsches U ausgesprochen.
&#x178;Ÿ
hexadezimal 178 Das Ÿ (Y mit Trema) ist ein sehr seltener Buchstabe im Deutschen und Französischen. Im Walisischen kommt er häufiger vor.
&#xB2;²
hexadezimal B2 Das ² ist die hochgestellte Ziffer Zwei. Anwendungsbeispiel
4² = 16 oder 25 m²
&#xF3;ó
hexadezimal F3 Im Polnischen wird der Buchstabe ó wie ein deutsches U ausgesprochen.




b   Benannte Zeichen (named entities)

Zeichen-Entität-Referenzen [engl.: character entity references], werden auch Entities genannt!

named entities bedeutet: "benannte Zeichen". Das Schema für eine solche Notationen ist:

&[Name];

Beispiel einer Notation in HTML:

Notierung
  ZeichenBezeichnung
&copy;erzeugt:©  copy
&euro;erzeugt:  Euro
&amp;erzeugt:&  ampersand
&rarr;erzeugt:  PfeilRechts



   Darf ich sie zu einem Ausflug einladen?

Falls sie das bereits kennen, mag es eine Hilfe sein wenn es darum geht Sonderzeichen in hexadezimaler oder dezimaler Schreibweise in ihr HTML-Dokument einzutragen.

In einem Windows-System steht ihnen unter 'Zusatzprogramme' / 'Hilfen' eine Zeichentabelle zur Verfügung. In der Textverarbeitung 'Word' gibt es ebefalls eine Möglichkeit über einen Menübefehl Sinderzeichen einzufügen. Beide Male wird ihnen eine Zeichentabelle angeboten.



Die Position(snummer) innerhalb der Zeichentabelle wird ebenfalls angezeigt. In dem Screenshot hier in der unteren rechten Ecke. Genau das ist der Wert, den sie verwenden können.

Das sie in Word dieses Zeichen mittels festgehalterner ALT-Taste und Eingabe der Zahl über den Nummernblock einfügen können, wissen ja schon. Dann erzähle ich ihnen ja auch nichts Neues.


Versuchen sie es einmal: ALT-Taste festhalten und auf dem Nummernblock 0169 (4 Ziffern) eintippen. Das Ergenos sollte ein © sein.

Alternativ: Menü 'Einfügen' Auswahl 'Zeichen' (versionsabhängig)






19.6.2002   

NACH OBEN