Der Browser muss verstehen, welche Zeichensätze (Zeichenkodierung) er verwenden soll. Es ist notwendig, damit die HTML-Seite korrekt angezeigt wird.

UTF-8 ist die Standardzeichencodierung für HTML5. Allerdings war es früher anders. ASCII war der Zeichensatz davor. Und ISO-8859-1 war der Standardzeichensatz von 2.0 bis HTML 4.01.

Aber es gab immer noch Probleme mit der Kodierung und als UTF-8 zusammen mit HTML5 und XML kam, wurden viele Probleme gelöst.

Lassen Sie uns mehr Details über Zeichensätze betrachten.

ASCII

ASCII war der erste Zeichenkodierungsstandard (auch Zeichensatz genannt).

Es wird eigentlich abgekürzt von American Standard Code for Information Interchange. Es basiert ursprünglich auf dem englischen Alphabet und kodiert 128 Zeichen in 7-Bit-Binärzahlen, da es bekannt ist, dass die ganze Computerinformation in der Elektronik als binäre Einsen und Nullen (01000101) aufgezeichnet wird.

html-ascii-character-set

Oben können Sie ein ASCII-Diagramm sehen.

Das größte Problem für ASCII ist, dass es keine nicht-englischen Buchstaben gab. Es wird immer noch häufig verwendet, insbesondere in Großrechnern.

Klicken Sie hier, um mehr über ASCII zu erfahren.

ANSI

ANSI, das auch Windows-1252 genannt wurde, war der Standardzeichensatz für Windows bis Windows 95. Es ist eine Erweiterung von ASCII, die internationale Zeichen hinzufügt. Es unterstützte 256 Zeichen bei Verwendung eines vollen Bytes (8-Bit).

ANSI wurde von allen Browsern unterstützt, da es als Standardzeichensatz von Windows angekündigt wurde.

ISO-8859-1

ISO-8859-1 wurde zur Standardzeichenkodierung in HTML2.0, da die meisten Länder andere Zeichen als ASCII verwenden. Es ist auch eine Erweiterung von ASCII, genau wie ANSI, und es fügt internationale Zeichen hinzu. ISO-885-1 verwendet auch das volle Byte, um doppelt so viele Zeichen anzuzeigen wie ASCII.

Klicken Sie hier, um mehr über ISO-8859-1 zu erfahren.

Wenn eine HTML4-Seite eine andere Zeichenkodierung als ISO-8859-1 verwendet, muss diese im Tag <meta> platziert werden.

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

Unicode UTF-8

UTF-8 ist die Standardzeichenkodierung für HTML5.

Da die oben genannten Zeichensätze begrenzt sind, hat das Unicode-Konsortium einen Unicode-Standard entwickelt.

Dieser Unicode-Standard enthält fast alle Zeichen, Satzzeichen und Symbole, die weltweit verwendet werden.

In HTML wird das Attribut charset verwendet, um die Zeichenkodierung hinzuzufügen.

<meta charset="UTF-8">

Übe dein Wissen

Welche der folgenden Aussagen über HTML-Zeichen sind korrekt?
Finden Sie das nützlich?