Wie Sie eine URL aus HTML-Text extrahieren

May 27

Hypertext Markup Language ist der Code, der auf dem Web-Seiten erstellt werden. HTML verwendet spezielle Code-Tags für verschiedene Webseiten-Elemente wie Text, Tabellen und eingebettete Bilder. Anklickbare Links auf einer Webseite kann den Leser zu anderen Abschnitten der Seite, andere Seiten oder externen Websites leiten. Eine HTML-Datei, die Verknüpfungen enthält kann analysiert werden, um die Link-URL mit dem Editor, die standardmäßig auf Windows-Systemen installiert ist zu extrahieren.

Anweisungen

1 Maustaste auf das Symbol der HTML-Datei und wählen Sie "Öffnen mit..." im Kontextmenü. Wählen Sie die Option "Standardprogramm auswählen...". Ein Fenster "Öffnen mit".

2 Klicken Sie auf den Pfeil auf der rechten Seite der Rubrik "Andere Programme". Eine Liste der zurzeit installierten Programme erscheint.

3 Klicken Sie auf das Symbol "Notepad". Deaktivieren Sie die Option "immer mit dem ausgewählten Programm dieser Art von Datei öffnen" Wenn Sie nicht, HTML-Dateien wollen, in Zukunft in Notepad zu öffnen. Klicken Sie auf "OK"; die HTML-Datei wird im Editor geöffnet.

4 Suche für den Link, dem Sie die URL aus extrahieren möchten. Sie scannen die Datei manuell oder benutzen die Suchfunktion, indem Sie auf "Bearbeiten" in der oberen Menüleiste und im Menü "Suchen..." auswählen. Typ "< a" ohne die Anführungszeichen in das Suchfeld im Feld, und klicken Sie auf "Weitersuchen". Die "< ein" Tag wird verwendet, um Hyperlinks in HTML zu bezeichnen.

5 Klicken Sie auf "Weitersuchen", bis Sie den Link finden, dem Sie die URL aus extrahieren möchten. Die URL werden nach der "Href =" innerhalb der "< ein" Tag.

Tipps & Warnungen

  • Eine Alternative zu Notepad ist "Notepad++," ein freier Text-Editor mit leistungsfähiger Suchfunktion als Notepad. Microsoft Word öffnet auch HTML-Dateien.