How-to articles, tricks, and solutions about UNICODE

„Unicode-Fehler „unicodeescape“-Codec kann Bytes nicht decodieren … Kann Textdateien in Python 3 nicht öffnen

Dieser Fehler tritt auf, wenn versucht wird, eine Datei zu öffnen, die Escape-Zeichen (wie \) im Dateipfad enthält und die Escape-Zeichen von Python nicht ordnungsgemäß interpretiert werden.

Konvertieren Sie eine Unicode-Zeichenfolge in eine Zeichenfolge in Python (mit zusätzlichen Symbolen)

Sie können die Methode .encode() verwenden, um einen Unicode-String in einen String mit zusätzlichen Symbolen in Python zu konvertieren.

Unicode (UTF-8) Lesen und Schreiben in Dateien in Python

Um eine Datei im Unicode (UTF-8) Encoding in Python zu lesen, können Sie die integrierte Funktion open() verwenden und die Kodierung als "utf-8" angeben.

UnicodeDecodeError, ungültiges Fortsetzungsbyte

Hier ist ein Beispiel für einen Python-Codeschnipsel, der einen Fehler "UnicodeDecodeError: invalid continuation byte" verursachen kann:

UnicodeDecodeError: 'charmap'-Codec kann Byte X an Position Y nicht dekodieren: Zeichen wird <undefined> zugeordnet

Dieser Fehler tritt auf, wenn versucht wird, einen String mit dem 'charmap' Codec zu decodieren, der in der Regel für die Windows-1252 Zeichenkodierung verwendet wird.

UnicodeEncodeError: Der 'ASCII'-Codec kann das Zeichen u'\xa0' an Position 20 nicht codieren

Dieser Fehler wird ausgelöst, wenn versucht wird, einen Unicode-String mit dem ASCII-Codec zu kodieren, und der String ein Zeichen enthält, das nicht im ASCII-Bereich (0-127) liegt.

Was genau machen "u"- und "r"-String-Präfixe und was sind rohe String-Literale?

In Python bezeichnet das "r" Präfix vor einem String, dass es sich um einen rohen String-Literal handelt.

Was macht das Zeichen 'b' vor einem String-Literal?

Der Buchstabe 'b' vor einem String-Literal gibt an, dass der String ein Bytes-Literal ist.