Exportieren von HTML auf Text

May 19

Exportieren von HTML auf Text ist ein einfach, wenn langwierige Prozess. HTML-Dateien sind Text-Dateien mit der Erweiterung .html oder .htm. Es gibt mehrere Möglichkeiten, um HTML zu entfernen und den Text der Webseite zu behalten. Die HTML-Tags müssen aus der Datei entfernt werden. Software von Drittanbietern kann die Datei von HTML-Tags Streifen; ein Benutzer kann löschen Sie die Tags in einem Texteditor oder kopieren Sie den Text aus einem Browser und ohne Formatierung in einen Texteditor einfügen.

Anweisungen

Kopieren Sie und fügen Sie den Text

1 Öffnen Sie die HTML-Datei im Browser durch Klick auf "Datei" und "Datei öffnen."

2 Markieren Sie den Text, klicken Sie auf die Seite und ziehen den Cursor über den Text, um Text zu markieren. Drücken Sie "STRG-C" ("Cmd-C" auf einem Mac), um den Text zu kopieren.

3 Öffnen Sie den Text-Editor wie Notepad unter Windows oder TextEdit in Mac OS X. Klicken Sie auf "Bearbeiten" und wählen Sie "Einfügen." Ein einfachen Text-Editor wie Editor wird automatisch Streifen das HTML Tags aus dem Text. Jedoch wenn Sie ein mächtiger Textverarbeitungsprogramm als Texteditor wie z. B. Word verwenden, dann Sie müssen wählen "Einfügen" und Einfügen als reiner Text oder "nur Text" um die Formatierung zu entfernen.

Verwenden von Drittanbieter-Software

4 Download der Drittanbieter-Software Ihrer Wahl, die die HTML-Tags aus dem Text entfernt. Finden Sie Resource Links einige Vorschläge.

5 Öffnen Sie die Datei, in der Software von Drittanbietern. Je nach Software müssen Sie möglicherweise die Datei mit "Datei" und "Öffnen" zum Öffnen der Datei zu öffnen. Einige Software müssen Sie klicken Sie auf "Durchsuchen", um die Datei für den Export zu laden.

6 Klicken Sie auf "OK" oder "Speichern" oder "Convert" abhängig von der Software, um die Konvertierung zu starten verarbeiten.

Entfernen Sie die Tags in einem Text-Editor

7 Öffnen Sie die Datei in einem Texteditor, indem Sie auf "Datei" und "Öffnen".

8 Suchen Sie < Body >-Tags in der Datei. Löschen Sie alles aus dem < Körper > tag oben. Diese Information ist für den Browser zum Analysieren der Datei für die Anzeige und nicht Teil des Textes.

9 Suchen Sie die < / body > Tag im unteren Bereich des Dokuments. Löschen Sie dies und alle Tags unterhalb es.

10 Entfernen Sie alle Wörter und Code zwischen weniger als (<) und größer als (>) Zeichen und Symbole selbst. Dies sind die HTML-Tags. Wenn Ihr Text-Editor ein suchen und ersetzen im Menü "Bearbeiten" hat, suchen Sie nach "<> *" und ersetzen durch ein leeres Feld. Das Sternchen ist ein Platzhalter, der Text zwischen die beiden Symbole zu decken.