UnicodeDecodeError: 'utf8'-Codec kann Byte 0xa5 an Position 0 nicht decodieren: ungültiges Startbyte

Dieser Fehler tritt auf, wenn versucht wird, eine Byte-Zeichenfolge mit dem UTF-8-Codec zu decodieren und das Byte an der angegebenen Position kein gültiger Startbyte für ein UTF-8-codiertes Zeichen ist.

Hier ist ein Beispiel dafür, wie dieser Fehler auftreten kann:

try:
    byte_string = b'\xa5' # enthält einen ungültigen Startbyte für UTF-8
    text = byte_string.decode('utf8')
except Exception as e:
    print(e)

Versuch es selber!

Um diesen Fehler zu behandeln, können Sie den errors-Parameter der decode()-Methode verwenden, um anzugeben, wie mit ungültigen Bytes verfahren werden soll. Beispielsweise können Sie ungültige Bytes ignorieren, indem Sie Folgendes verwenden:

byte_string = b'\xa5'
text = byte_string.decode('utf8', errors='ignore')
print('done')
print(text) # prints nothing

Versuch es selber!

Eine weitere Möglichkeit besteht darin, ungültige Bytes durch ein Ersatzzeichen, wie das Unicode-Ersatzzeichen (U+FFFD), zu ersetzen:

byte_string = b'\xa5'
text = byte_string.decode('utf8', errors='replace')
print('done')
print(text)

Versuch es selber!

Es ist wichtig zu beachten, dass die obigen Lösungen nur verwendet werden können, wenn Sie sicher sind, dass die Kodierung der Byte-Zeichenfolge wirklich UTF-8 ist. Wenn nicht, sollten Sie andere Kodierungen ausprobieren oder eine Bibliothek verwenden, die die Kodierung erkennen kann.

UnicodeDecodeError: 'utf8'-Codec kann Byte 0xa5 an Position 0 nicht decodieren: ungültiges Startbyte

Ähnliche Quellen