HTML-Zeichensätze
Der Browser muss wissen, welchen Zeichensatz (Zeichenkodierung) er verwenden soll. Dies ist erforderlich, um eine HTML-Seite korrekt anzuzeigen.
UTF-8 ist die standardmäßige Zeichenkodierung für HTML5. Früher war das jedoch anders. ASCII war davor der Zeichensatz. Und ISO-8859-1 war der Standardzeichensatz von HTML 2.0 bis HTML 4.01.
Es gab jedoch weiterhin Probleme mit der Kodierung, und als UTF-8 zusammen mit HTML5 und XML auftauchte, wurden viele Probleme gelöst.
Sehen wir uns die Zeichensätze genauer an.
ASCII
ASCII war der erste Standard für Zeichenkodierung, der auch als Zeichensatz bezeichnet wird. Die Abkürzung steht für American Standard Code for Information Interchange.
Für jedes speicherbare Zeichen definierte ASCII eine eindeutige Binärzahl, um Groß- und Kleinbuchstaben (a-z, A-Z), die Zahlen von 0-9 und Sonderzeichen zu unterstützen. Es basiert ursprünglich auf dem englischen Alphabet und kodiert 128 Zeichen in eine 7-Bit-Binärzahl. Das funktioniert, weil alle Computerinformationen in der Elektronik als binäre Einsen und Nullen (01000101) gespeichert werden.
Unten sehen Sie eine ASCII-Tabelle.

Das größte Problem von ASCII ist, dass es keine nicht-englischen Buchstaben enthielt. Es wird immer noch verwendet, besonders in Großrechnern.
Hier klicken, um mehr über ASCII zu erfahren.
ANSI
ANSI, das auch Windows-1252 genannt wurde, war bis Windows 95 der Standardzeichensatz für Windows. Es ist eine Erweiterung von ASCII, die internationale Zeichen hinzufügt. Es unterstützte 256 Zeichen mithilfe eines vollständigen Bytes (8 Bit).
ANSI wurde von allen Browsern unterstützt, da es als Standardzeichensatz von Windows angekündigt wurde.
ISO-8859-1
ISO-8859-1 wurde in HTML 2.0 zur standardmäßigen Zeichenkodierung, da die meisten Länder Zeichen verwenden, die sich von ASCII unterscheiden. Es ist ebenfalls eine Erweiterung von ASCII, genau wie ANSI, und fügt internationale Zeichen hinzu. ISO-8859-1 verwendet ebenfalls ein vollständiges Byte, um doppelt so viele Zeichen wie ASCII darzustellen.
Hier klicken, um mehr über ISO-8859-1 zu erfahren.
HTML 4-Zeichensätze
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1" />Wenn eine HTML-4-Seite eine andere Zeichenkodierung als ISO-8859-1 verwendet, muss diese im <meta>-Tag definiert werden.
HTML 4-Zeichensätze
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8" />Alle HTML-4-Parser unterstützen UTF-8.
HTML 5-Zeichensätze
<meta charset="UTF-8" />Platzieren Sie dieses Tag so früh wie möglich innerhalb des <head>-Elements, damit der Browser die Kodierung korrekt liest.
Unicode UTF-8
UTF-8 ist die standardmäßige Zeichenkodierung für HTML5.
Da die oben genannten Zeichensätze begrenzt sind, entwickelte das Unicode-Konsortium einen Unicode-Standard.
Dieser Unicode-Standard enthält fast alle Zeichen, Satzzeichen und Symbole, die weltweit verwendet werden.
In HTML gibt das Attribut charset die Zeichenkodierung an.
TIP
Alle HTML5-Parser unterstützen UTF-8. Beachten Sie, dass XML-Parser strikt UTF-8 oder UTF-16 erfordern.
Practice
Was ist über HTML-Zeichensätze wahr?