Wie Konvertieren von HTML auf Text ASP

June 13

Die Programmiersprache ASP können Sie Webseite HTML abrufen und in normalen Text umgewandelt. Dies ist vorteilhaft, wenn Sie Informationen aus einer Website und Streifen die HTML-Tags zu extrahieren, bevor Informationen analysieren möchten. Können Sie die Funktion "Replace" HTML-Tags aus HTML-Daten zu entfernen und wieder nur Text. Es dauert nur ein paar Zeilen Code eine HTML-zu-Text-Konvertierung implementiert.

Anweisungen

1 Erstellen Sie Ihre ASP-Servervariablen. Diese Variablen halten Sie den HTML-Text und den konvertierten nur-Text-Inhalt. Der folgende Code veranschaulicht die ASP Variablen erstellen:

Dim html als String

Dim Text As String

2 Fügen Sie einige HTML auf die Variable "html". Dies kann ein Benutzer in Ihrem Formular oder eine Webseite erstellt HTML eingegebenen Text sein. Der folgende Code fügt einen einfachen Titel-Tag der HTML-Variablen:

HTML = "< Titel > meine Web-Seite < / title >"

3 Erstellen Sie die Funktion, die den HTML-Code zu Streifen. Die folgende Funktion entfernt alle HTML-Tags und Leerzeichen aus Webseitencode:

Public Function HTMLtoText (ByVal HTML als String) As String

Dim strip As _

System.Text.RegularExpressions.Regex

Return strip.Replace(HTML, "&lt;[^>]*>", "")

EndFunction

4 Konvertieren von HTML in Text und weisen sie der Variablen "Text". Sie rufen die Funktion, die in Schritt 3 die Streifen die Tags erstellt. Das wiederkehrende Ergebnis ist Text. Der folgende Code veranschaulicht den Code zu konvertieren:

Text = HTMLtoText(html)