Wie man eine Webseite mit Python lesen

January 1

Dies zeigt Ihnen, wie eine Webseite aus ein Python-Skript vorgegebenem URL gelesen.

Anweisungen

1 Installieren Sie den Python-Generator, von hier aus. Es ist kostenlos.

http://www.python.org/Download/Releases/2.5.2/

2 Nachdem Sie Python installiert haben können Sie es über das Startmenü ausführen.

Python 2.5 - im Leerlauf (Python GUI)

3 Sobald die Anwendung geöffnet wird, sieht es wie Notepad. Wählen Sie die Datei aus dem Menü oben und neue Fenster. Dieses öffnet ein neues Textfenster, die Sie Ihrer Python-Code speichern können.

4 Wie man eine Webseite mit Python lesen

kopieren folgen Code in das neue Fenster, die gerade geöffnet. Import shutilImport-osImport-ZeitImportieren von datetimeImport-mathUrllib importierenImportieren Sie aus Array array

FILEHANDLE = urllib.urlopen ('http://www.loothog.com')

für Linien in filehandle.readlines():

print lines

FILEHANDLE.Close()

5 Wählen Sie Datei - speichern, und geben Sie Ihre Datei alles, was Sie wollen.

6 Drücken Sie F5, um den Code auszuführen.

Beenden Sie das Programm ausgeführt wird, klicken Sie auf das erste Fenster, das geöffnet und wählen Sie im Menü Shell - Shell starten

7 Sie können alle diese Zeilen in eine Textdatei speichern, indem Sie ändern den Code wie folgt aussehen.

MyFile = open('test.html','w')für Linien in filehandle.readlines():

print lines myFile.write(lines)

myFile.close()FILEHANDLE.Close()

8Wie man eine Webseite mit Python lesen

Vielleicht haben Sie einige Aktienkurse, die folgendermaßen aussehenAAAC, D, 20071210, 8.2, 8.2, 8.2, 9.5, 1000

und Sie den 9,5 schließen Preis erhalten wollen, dann können die Linie durch die Kommas aufgeteilt und nur die 9,5 wie folgt zugreifen

MyFile = open('test.html','w')für Linien in filehandle.readlines():

section = lines.split(',') print str(sections[6].strip()) myFile.write(str(sections[6].strip()))

myFile.close()FILEHANDLE.Close()

Hinweis: Die str() die Zahl in einen String konvertiert und die .strip() werden zusätzliche Leerzeichen am Ende mitnehmen.

Tipps & Warnungen

  • Die Zeilen nach "für Linien in filehandle.readlines():" 5 Leerzeichen eingerückte werden.