Wie Konvertieren von HTML in reinen Text in Java-Applets

July 1

Die "Jsoup"-Java-Bibliothek enthält eine Funktion, die Streifen ein Java-String aller HTML-Tags und den Inhalt in unformatierten Text konvertiert. Diese Bibliothek ist nützlich, wenn Sie möchten Webseiten und HTML-Website herunterladen und bewerten nur den Text in Ihrem Programm. Der Inhalt bleibt, so können Sie den Inhalt in einer Datenbank speichern oder speichern den Inhalt in eine Datei auf dem lokalen Server.

Anweisungen

1 Mit der rechten Maustaste der Java-Datei, die Sie bearbeiten möchten und wählen "Öffnen mit". Klicken Sie Ihre Java-Applet-Editor in der Liste der Programme, den Code zu öffnen.

2 Suchen Sie die HTML-Zeichenfolge zu analysieren und die nur-Text-Variable erstellen. Der folgende Code erstellt eine Variable zur Speicherung des analysierten HTML-Inhalts:

Dokumentieren Sie Klartext = Null;

3 Analysieren von HTML in reinen Text und speichere das Ergebnis in die Variable "PlainText". Der folgende Code zeigt, wie die HTML-Tags analysiert:

Klartext = Jsoup.parse(html);

Ersetzen Sie "html" durch eine eigene HTML-Zeichenfolge.