Wie Konvertieren von HTML auf Text in Java

August 23

Bei der Arbeit mit Java kann es besonders nützlich, um schnell die vorhandenen HTML-Code in nutzbare Java-Code konvertieren. Leider ist manuell konvertieren von HTML in Java ein zeitaufwändiger Prozess, der mehr Routinearbeiten als Buch-Smarts, führen viele Programmierer schnell frustriert. Zum Glück gibt es ein freies, Open-Source HTML-Parser für Java, die automatische HTML konvertieren in Java ohne Aufwand einsetzbar ist. Der Parser ist ziemlich einfach, und es dauert nur kurzen Zeit zu lernen und zu beherrschen.

Anweisungen

1 Navigieren Sie zu der NekoHTML-Download-Seite (siehe Link unter Ressourcen).

2 Laden Sie die neueste Version des NekoHTML-Parsers.

3 Entpacken Sie das Archiv NekoHTML, dann die "CLASSPATH" aus dem extrahierten Nekohtml-Verzeichnis fügen Sie die Datei "nekohtml.jar hinzu".

4 Navigieren Sie zu der Java-Parser Xerces-Download-Seite (siehe Link unter Ressourcen).

5 Laden Sie die neueste Version von der Parser Xerces auf Ihrer lokalen Festplatte.

6 Entpacken Sie das Archiv "Xerces-J-bin.2.9.1". Dann fügen Sie die Datei "xercesImpl.jar" in den "CLASSPATH" aus dem extrahierten Xerces-Verzeichnis. Einmal beide. Gläser wurden richtig zugesetzt in den CLASSPATH Sie irgendeinen HTML Code bei Bedarf analysieren können.

Tipps & Warnungen

  • Wenn Sie Schwierigkeiten bei der Verwendung des Parsers auftreten, stellen Sie sicher, dass Sie entpackt haben die. JAR-Dateien an den richtigen Speicherort, und der Dateipfad in Java richtig ist.