ASCII, Sonderzeichen, HTML, keystrokes, Beispiel, example
 Sonderzeichen
    
 HomeHTML • Sonderzeichen  

 Sonderzeichen in HTML-Dateien   (Basiswissen + Erklärungen)

Ein HTML-Dokument ist ein Textdokument. In dem Dokument stehen Inhalte und Anweisungen. Die Anweisungen stehen in spitzen Klammern, das wissen sie bereits.!

Notierung von Sonderzeichen in HTML-Seiten

Eigentlich ist ihnen klar: Man kann z.B. nicht so ohne weiteres die öffnende spitze Klammer (<) im Text verwenden, würde der Browser doch sofort einen HTML-Befehl vermuten. Daher müssen spitze Klammern über eine andere Notation eingetragen werden. Aber auch andere Sonderzeichen lassen sich so einfügen.


Bjørn Nordstrøm    Café Sowiso

5 < 8;    25,70    ± 2   178,25 m ²




  Sonderzeichen

Beispiele: Preis: 25 £   Preis: 25   Preis: 25 ¥   Preis: 78 ¢

... und auch unsere deutschen Umlaute und das scharfe S sind Sonderzeichen. Die Arbeit sie entsprechend einzutragen, nehmen uns meistens die HTML-Editoren ab. Falls nicht, müssen sie das Sonderzeichen als 'benanntes Zeichen' oder in numerischer Notation einfügen.

Zeichen Beschreibung Benannt Num. Code
¢ Cent-Zeichen &cent; &#162;
£ Pfund-Zeichen &pound; &#163;
Euro-Zeichen &euro; &#8364;
¥ Yen-Zeichen &yen; &#165;

Eine Liste der wichtigsten Sonderzeichen (auch als PDF-Datei) finden sie hier






   Sonderzeichen, können auf 2 Weisen eingefügt werden:

a  numerische Noation

Seit HTML 4.0 kann jedes Zeichen aus dem Zeichenvorrat nach ISO 10646 (deckungsgleich mit dem Unicode-Standard) notiert werden. Eine solche numerische Notationen kann mit dezimalen oder hexadezimalen Angaben gemacht werden:

dezimal:  &#[Nummer];  oder  hexadezimal:  &#[x][Nummer];

Notierung
erzeugtWertBeschreibung
dezimale Nummerierung
&#376;Ÿ
dezimal 376 Das Ÿ (Y mit Trema) ist ein sehr seltener Buchstabe im Deutschen und Französischen. Im Walisischen kommt er häufiger vor.
&#178;²
dezimal 178 Das ² ist die hochgestellte Ziffer Zwei. Anwendungsbeispiel
4² = 16 oder 25 m²
&#243;ó
dezimal 243 Im Polnischen wird der Buchstabe ó wie ein deutsches U ausgesprochen.
hexadezimale Nummerierung
&#x178;Ÿ
hexadezimal 178 Das Ÿ (Y mit Trema) ist ein sehr seltener Buchstabe im Deutschen und Französischen. Im Walisischen kommt er häufiger vor.
&#xB2;²
hexadezimal B2 Das ² ist die hochgestellte Ziffer Zwei. Anwendungsbeispiel
4² = 16 oder 25 m²
&#xF3;ó
hexadezimal F3 Im Polnischen wird der Buchstabe ó wie ein deutsches U ausgesprochen.




b   Benannte Zeichen (named entities)

Zeichen-Entität-Referenzen [engl.: character entity references], werden auch Entities genannt!

named entities bedeutet: "benannte Zeichen". Das Schema für eine solche Notationen ist:

&[Name];

Beispiel einer Notation in HTML:

Notierung
  ZeichenBezeichnung
&copy;erzeugt:©  copy
&euro;erzeugt:  Euro
&amp;erzeugt:&  ampersand
&rarr;erzeugt:  PfeilRechts


Liste der benannten Sonderzeichen



   Buchstaben und Zeichensatz

Ganz tief in den Anweisungen für den Computer sind die Befehle zum Anzeigen der HTML-Seite in viel kleinere Stückchen einzelner Anweisungen aufgegliedert. Um zum Beispiel den Buchstaben 'b' innerhalb der Seite darzustellen erhält er die Anweisung, aus einer Liste von Zeichen das Zeichen 98 anzuzeigen und alles Notwendige zu tun, das dieses Zeichen auf dem Bildschirm am richtigen Platz, in der richtigen Größe und Farbe angezeigt wird. Das regelt der Rechner wiederum in Zusammenarbeit mit der Grafikkarte.

Die muss eine Menge Bildschirmpünktchen anspechen, um einen Buchstaben darzustellen.

Um das Zeichen 98 der Zeichentabelle für "Latin-1" darzustellen, wird die Grafikkarte nach dem Beispiel oben 126 Bildschimpünktchen in Farbe und Intensität unterschiedlich 'ausleuchten'.



Wir müssen hier lediglich behalten, dass das darzustellende Zeichen einer Tabelle entnommen wird. Diese Tabelle ist die Zeichensatztabelle. Davon gibt es, abhängig von der verwendeten Sprache, viele unterschiedliche (lateinische Sprachen, griechisch, japanisch, ...).

In der HTML-Datei stehen also aus der Sicht des Computers nicht ihre eingegebenen Buchstaben und Satzzeichen, sondern Byte für Byte numerische Werte wie 097, 075, 168 oder 032 (übrigens werden die Zeichen auf dem Weg von der Tastatur zum Rechner genauso übermittelt).

Der Browser versucht nun beim Aufbau der Seite herauszufinden, nach welchem Zeichensatz er diese numerischen Angaben interpretieren soll. Ob beispielsweise nach einem westeuropäischen, einem griechischen oder einem japanischen Zeichensatz. Dazu liest er die Angaben im HEAD-Bereich der HTML-Datei.

Werden dort keine Angaben gefunden, verfährt er nach seinen Grundeinstellungen und das kann schiefgehen.

In den Browsereinstellungen (Ansicht - Zeichenkodierung) könnte der Seitenbesucher das zwar auch selbst einstellen oder korrigieren, aber das sollte man ihm doch lieber abnehmen. Schließlich ist das unser Job und wir sind verantwortlich. Ausnahmen gibts allerdings. Nicht immer liegt die Schuld für eine falsche Kodierung beim Webmaster!


  Angaben zum Zeichensatz im HEAD

Nun wirds wieder englisch! Ich habe eben von einer Zeichensatztabelle gesprochen. In der vorwiegend englischsprachigen Computerwelt heist dieses Verzeichnis 'ChracterSet' [engl. character = Buchstabe]. Eine Tabelle mit einem 'Satz von Buchstaben'.

Welchern Characterset für eine Webseite verwendet werden soll, sollte der Browser im Head-Bereich der HTML-Seite finden. Dazu wird eine META-Angabe notiert. Dort taucht dann das Kürzel charset auf

<html>
<head>
<titel>Gerbils mongolische Wüstenrennmäuse - Haltung und Pflege</titel>
...
<meta http-equiv="content-type" content="text/html; charset=iso-8859-1">
<meta http-equiv="Content-Style-Type" content="text/css">
<link rel="shortcut icon" type="image/x-icon" href="favicon.ico">
...
... bedeutet: Verwende zur Interpretation der Werte die Zeichentabelle für "Latin-1"

Weitere Info: SELFHTML - Internationalisierung - Zeichensätze
 




   Darf ich sie zu einem Ausflug einladen?

Falls sie das bereits kennen, mag es eine Hilfe sein wenn es darum geht Sonderzeichen in hexadezimaler oder dezimaler Schreibweise in ihr HTML-Dokument einzutragen.

In einem Windows-System steht ihnen unter 'Zusatzprogramme' / 'Hilfen' eine Zeichentabelle zur Verfügung. In der Textverarbeitung 'Word' gibt es ebefalls eine Möglichkeit über einen Menübefehl Sinderzeichen einzufügen. Beide Male wird ihnen eine Zeichentabelle angeboten. Diese Zeichentabelle ist möglicherweise eine Hilfe, wenn Sie auf der Suche nach einem 'exotischen' Sonderzeichen sind.



Beispiel ein Halb:  ½ = &#189;

Die Position(snummer) innerhalb der Zeichentabelle wird ebenfalls angezeigt. In dem Screenshot hier in der unteren rechten Ecke. Genau das ist der Wert, den sie verwenden können.

Das sie in Word dieses Zeichen mittels festgehalterner ALT-Taste und Eingabe der Zahl über den Nummernblock einfügen können, wissen ja schon. Dann erzähle ich ihnen ja auch nichts Neues.


Versuchen sie es einmal in Ihrem Schreibprogramm: ALT-Taste festhalten und auf dem Nummernblock 0169 (4 Ziffern) einzutippen. Das Ergebos sollte ein © sein. Eine Zauberei die Schüler der AG-Computer immer wieder fasziniert und viele Erwachsene Nutzer nicht kennen.

Alternativ: Menü 'Einfügen' Auswahl 'Zeichen' (versionsabhängig)






19.6.2002   

NACH OBEN