Gewusst wie: Lesen ein Word-Dokuments mit Java

December 31

Gewusst wie: Lesen ein Word-Dokuments mit Java

Die Java-Sprache wird verwendet, um die Plattform-freien Applikationen zu entwickeln. Dies bedeutet, dass eine Java-Anwendung auf jedem Rechner ausgeführt werden kann — Linux, Unix, Windows oder mobile Geräte – unabhängig vom Betriebssystem des Benutzers. Wenn Sie Anwendungen für Windows-Rechner schreiben, können Sie Java zu importieren und Word-Dokumente auf der Festplatte zu lesen. Der Prozess erfordert einige importierten Klassen sind frei von Apache Team, die die Entwickler für die gängigen Web-Host-Anwendung sind.

Anweisungen

1 Ort der POI importieren Sie Dateien im Verzeichnis Ausführung für Ihre Java-Anwendung. Die Dateien müssen in Ihrem Java-Code-Dateien importiert werden. Der folgende Code muss am Anfang der Codedatei Java verwendet werden, um die Word-Funktionen verweisen:Import org.apache.poi.poifs.filesystem.GEHENImport org.apache.poi.hwpf.GEHENImport org.apache.poi.hwpf.extractor.*;

2 Lesen Sie in der Word-Datei-Referenz in einem Datei-Stream-Variable, die in alle Java-Anwendungen verwendet wird, um Dateien auf einer Festplatte zu lesen. Der folgende Code liest in einem Dokument mit dem Namen \"myDoc.doc\" in eine Datei-Stream-Variable:POIFSFileSystem fs = NullGEHENFS = neue POIFSFileSystem (neue FileInputStream(\"myDoc\");

3 Initiieren Sie die Word-Klassen zum Auswerten und analysieren das Dokumentformat verwendet. Der folgende Code liest im Word-Format und analysiert, so dass Sie die Informationen für den Benutzer anzeigen können:HWPFDocument-Dokument = neue HWPFDocument(fs)GEHENWordExtractor Wort = neue WordExtractor(document);

4 Rufen Sie die Absätze aus dem Word-Dokument, und legen sie eine Variable. Der folgende Code erstellt ein Array von Absätzen:String [] Absätze = word.getParagraphText();

5 Drucken Sie die Absätze aus. Die Absätze werden im nur-Text für den Benutzer angezeigt. Der folgende Code veranschaulicht, wie die Informationen, die in der Java-Code abgerufen ausgegeben:System.out.println (\"First Absatztext: \" + Ziffern [0]);