Arbeiten mit UTF-8-Codierung in Python-Quelle

Hier ist ein Code-Schnipsel, der zeigt, wie man mit UTF-8-Kodierung in einer Python-Quelldatei arbeitet:

# Encode a string in UTF-8
string = "Hello, 世界"
encoded_string = string.encode("utf-8")
print(encoded_string) # b'Hello, \xe4\xb8\x96\xe7\x95\x8c'

# Decode a UTF-8 encoded string
decoded_string = encoded_string.decode("utf-8")
print(decoded_string) # 'Hello, 世界'

In diesem Beispiel wird die Methode encode() verwendet, um einen String in eine UTF-8 kodierte Bytefolge zu konvertieren, und die Methode decode() wird verwendet, um eine UTF-8 kodierte Bytefolge wieder in einen String zurückzukonvertieren.

Man kann auch Dateien lesen und mit utf-8-Kodierung schreiben

with open("file.txt", "w", encoding="utf-8") as f:
    f.write("Hello, 世界")

with open("file.txt", "r", encoding="utf-8") as f:
    print(f.read()) # 'Hello, 世界'