Gewusst wie: Extrahieren von Text aus HTML

August 17

Eine HyperText Markup Language (HTML)-Datei enthält eine Reihe von Elementen, einschließlich Markierungen, Schrift und Text. In einigen Fällen müssen Sie den Text aus dem HTML-Dokument zu isolieren, so dass Sie es in anderen Anwendungen wie einen Artikel oder eine Publikation verwenden können. Extrahieren von Text aus einer HTML-Datei ist eine Aufgabe, die Sie auf mehrere Arten auf Ihrem Computer ausführen können.

Anweisungen

Von Ihrem Browser

1 Laden Sie die HTML-Datei in Ihrem Web-Browser der Wahl. Der Text zur Verfügung, wird standardmäßig auf dem Bildschirm angezeigt.

2 Klicken Sie "STRG + A" den Text auf dem Bildschirm auswählen und dann "STRG + C", um den Text in die Zwischenablage Ihres Computers zu kopieren.

3 Drücken Sie "STRG + V" den Text aus Ihrer HTML-Datei zu einer anderen Anwendung, z. B. ein Microsoft Word-Dokument einfügen.

Von Ihrem HTML-Editor

4 Laden Sie den HTML-Code in Notepad oder Ihren HTML-Editor der Wahl. Der Editor ist eine gemeinsame Wahl verfügbar auf den meisten Computersystemen kostenlos.

5 Navigieren Sie zum Abschnitt < Body > der HTML-Datei. Klicken Sie in der Zeile direkt hinter dem Starttag < Körper >, und wählen Sie alles bis zur Zeile direkt vor dem schließenden < / body > Tag.

6 Klicken Sie "STRG + C" um den Text kopieren und dann ein neues leeres Editor-Dokument zu laden. Drücken Sie "STRG + V", um den HTML-Text in das neue Dokument einfügen.

7 Das neue Editor-Dokument durchlaufen und alle Markierungen löschen (wie < a Href > oder < Img > Tags) so, dass die Datei nur Ursprungstext enthält.

Mithilfe der Software

8 Ein Auszieher-Programm auf Ihr System herunterladen. HTML-Text-Auszieher, ist z. B. mit Windows-Systemen kompatibel.

9 Laden Sie die Auszieher-Programm und geben Sie die Webadresse des der Web-Seite mit dem Text, die, den Sie extrahieren möchten.

10 Klicken Sie auf der Symbolleiste den Text nur Zugriff auf "Extrahiert Text". Klicken Sie auf "Kopieren", um Ihre Zwischenablage und dann "STRG + V" in eine andere Anwendung einfügen den Text hinzuzufügen.