Wie UTF-8 codiert ignorieren, in Python

August 21

Die Programmiersprache Python hat viele leistungsstarke Textverarbeitung Funktionen direkt eingebaut sein. Beispielsweise können Sie Zeichen mit dem Unicode UTF-8-Format codieren. Das Format UTF-8 enthält alle Zeichen in den Unicode-Zeichensatz, der deckt alle Zeichen aus allen Sprachen, Vergangenheit und Gegenwart. Mit UTF-8 können Sie in jeder Sprache verfassten Text bearbeiten. Sie können Text in UTF-8 mit der integrierten codieren-Funktion codieren. Dies kann einen Unicode-Fehler auslösen. Um Unicode-Fehler zu vermeiden, können Sie das Schlüsselwort "ignorieren" in die Encodierung-Funktion übergeben.

Anweisungen

1 Öffnen Sie den Leerlauf Text-Editor, der mit der Python-Download kommt. Finden Sie die IDLE Texteditor in Programmdateien (oder Anwendungen für Macintosh), im Python Verzeichnis. Eine leere Quellcodedatei wird im Leerlauf Text-Editor-Fenster geöffnet.

2 Deklarieren Sie eine String-Variable mit dem Namen "Z" und weisen Sie ihm einen beliebigen Text wie folgt:

StringText = 'Text'

3 Codieren Sie die Zeichenfolge unter Verwendung des UTF-8-Codierungsschemas. Wenn ein Codierung Fehler vorliegt, wird die Funktion eine UnicodeError-Ausnahme ausgelöst. Wenn Sie das Gefühl, dass Ihr Programm UnicodeError Ausnahmen sicher sperren kann, können Sie diese ignorieren. Zu diesem Zweck, "ignorieren" die Übergabe an die Funktion wie folgt:

stringText.encode ('Utf-8', 'ignorieren')

4 Drucken Sie die codierte Zeichenfolge mithilfe der print-Anweisung:

Print(stringText)

5 Führen Sie das Programm durch Drücken der Taste "F5". Das Programm wird den codierten Text an die Konsole ausgegeben.