PDF umwandeln in einen Text

Status
Nicht offen für weitere Antworten.
B

bosschris1313

Gast
Hallo

naja bastle jetzt schon länger an diesem problem herum.
verwende PDFBox

FileInputStream oIsInput = new FileInputStream(oFile.getAbsolutePath());
PDFParser oPDF = new PDFParser(oIsInput);
oPDF.parse();
oPDF.getPDDocument();

System.out.println(oSt.getText(oPDF.getPDDocument()));

Wenn ich jetzt die Methode parse() aufrufe, geht diese leider nicht bzw sie kann nicht parsen.

Hat jemand eine Idee.

Ps. Um auf das ganze Problem einzugehen. Möchte mit Lucene in Dateien nach Begriffen suchen.
naja excel,word ,html usw geht aber leider keine pdf-Datei. Vielleicht weiss hier einer bescheid .

Gruss Chris
 

TRunKX

Bekanntes Mitglied
...oh das klingt mal interessant. Also du willst nach Deteinamen in Dateien suchen? und eine pdf macht dir das Leben schwer? dann fang doch mal damit an das was du da oben an code generiert hast mitm System.out.println(""); mal auszugeben dann wirst du deinen Gehler vermutlich schon sehen!
 
B

bosschris1313

Gast
hallo danke mal das einer anwortet und das so schnell

naja ich habe das problem mit der methode parse()

DEBUG [main] (BaseParser.java:727) - parseCOSName() org.pdfbox.io.PushBackInputStream@949f69
DEBUG [main] (BaseParser.java:983) - parseDirObject() done retval=COSName{PDF}
DEBUG [main] (BaseParser.java:851) - parseDirObject() org.pdfbox.io.PushBackInputStream@949f69
DEBUG [main] (BaseParser.java:727) - parseCOSName() org.pdfbox.io.PushBackInputStream@949f69
DEBUG [main] (BaseParser.java:983) - parseDirObject() done retval=COSName{Text}
DEBUG [main] (BaseParser.java:697) - parseCOSArray() done peek='>'
DEBUG [main] (BaseParser.java:983) - parseDirObject() done retval=COSArray{[COSName{PDF}, COSName{Text}]}
DEBUG [main] (BaseParser.java:254) - parseCOSDictionary() done peek='47'
DEBUG [main] (BaseParser.java:983) - parseDirObject() done retval=org.pdfbox.cos.COSDictionary@1ffc686
DEBUG [main] (BaseParser.java:727) - parseCOSName() org.pdfbox.io.PushBackInputStream@949f69


Da bekomme ich nur diese Ausgabe. Er kann es nicht parsen damit java den Text lesen kann.
 
B

bosschris1313

Gast
PDDocument pdfDocument = null;

String contents = "";

try {
FileInputStream input = new FileInputStream(new File(oFile.getAbsolutePath()));
pdfDocument = PDDocument.load(input);
if (pdfDocument.isEncrypted()) {
pdfDocument.decrypt("");
}
StringWriter writer = new StringWriter();
PDFTextStripper stripper = new PDFTextStripper();
stripper.writeText(pdfDocument, writer);
contents = writer.getBuffer().toString();
System.out.println("" + contents);
}
catch (Exception e) {

}

mit dem habe ich das gleiche Problem
leider
 

Elephant

Aktives Mitglied
Hallo, ich habe Deinen letzten Code bei mir ausprobiert und es hat funktioniert. Vielleicht liegt es an der PDF-Datei.
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
A verschachtelte for-Schleife in einen Stream umwandeln? Allgemeine Java-Themen 4
B Long in einen Double umwandeln und im Label anzeigen Allgemeine Java-Themen 7
J String-Typ in einen generischen Typ T umwandeln Allgemeine Java-Themen 6
E hex- Stirng in einen float umwandeln Allgemeine Java-Themen 9
JAnruVA Datentypen Berechneten String-Wert in Double umwandeln um weiter zu rechnen Allgemeine Java-Themen 7
N Gierigen Regex in nicht-gierigen umwandeln Allgemeine Java-Themen 4
T Problem beim Umwandeln in eine Jar-Datei Allgemeine Java-Themen 3
N Regulären Ausdruck in normalen Java-Code umwandeln Allgemeine Java-Themen 12
K HTMLEditor HTML Text in Rich Text umwandeln Allgemeine Java-Themen 14
M Rechner dez in Hex umwandeln Allgemeine Java-Themen 5
L ArrayList mit String Arrays in ein Array umwandeln Allgemeine Java-Themen 1
V Datentypen Graphikrechner 2/Strings und Variablen in Doubles umwandeln Allgemeine Java-Themen 6
H Stream in ArrayList umwandeln Allgemeine Java-Themen 2
J Objekt in Bytestream umwandeln Allgemeine Java-Themen 12
C String in Objektnamen umwandeln Allgemeine Java-Themen 3
E String in Zahl umwandeln, ohne Befehl Integer.parseInt Allgemeine Java-Themen 3
V Eingegeben String Splitten und in Integer umwandeln Allgemeine Java-Themen 2
RalleYTN Unsigned int in signed int umwandeln Allgemeine Java-Themen 8
G GUI-basiertes Java-Program in Command-line Version umwandeln Allgemeine Java-Themen 1
J .jar in .exe Umwandeln Allgemeine Java-Themen 18
JavaWolf165 JsonObject in HashMap umwandeln Allgemeine Java-Themen 16
J Umwandeln von URL zu File und danach kopieren geht nicht Allgemeine Java-Themen 1
L Methoden "Schiffe versenken" Quellcode in Methoden umwandeln Allgemeine Java-Themen 6
P Liste zu Objekt umwandeln Allgemeine Java-Themen 4
T Geographische in UTM Koordinaten umwandeln Allgemeine Java-Themen 5
JG12111989 char-Array in int-Array umwandeln Allgemeine Java-Themen 27
D Library/Framework zum Umwandeln von Sound in Notenbilder Allgemeine Java-Themen 1
D AWT Tiff-Datei darstellen bzw in darstellbares Format umwandeln Allgemeine Java-Themen 2
K Applet in JApplet umwandeln Allgemeine Java-Themen 5
N Zahlensysteme umrechnen; Probleme beim Umwandeln Allgemeine Java-Themen 4
M Datum umwandeln. Allgemeine Java-Themen 1
J Daten aus GUI auslesen und in Objekte umwandeln Allgemeine Java-Themen 6
P OpenCV mit Java - Bilder in Graustufenbilder umwandeln Allgemeine Java-Themen 2
B Transferable in String/Integer umwandeln Allgemeine Java-Themen 11
J Datentypen String in Float umwandeln und "umbauen"? Allgemeine Java-Themen 5
T Datei Ordner in Binär-Zahlenkette umwandeln Allgemeine Java-Themen 11
B Binaräres Format in Dezimalformat umwandeln u. dabei die Zwischenschritte ausgeben Allgemeine Java-Themen 3
B HTML Tags in Strings umwandeln Allgemeine Java-Themen 4
C Java-Dateien in einheitlichen Zeichensatz umwandeln Allgemeine Java-Themen 10
K Datum+Uhrzeit in Millisekunden (long) umwandeln Allgemeine Java-Themen 7
S Erste Schritte if-Anweisung in for- oder while-schleife umwandeln Allgemeine Java-Themen 3
Q Posgresql String Timestamp Umwandeln Allgemeine Java-Themen 2
H2SO3- String 1.000,00 in double umwandeln Allgemeine Java-Themen 12
J String in int umwandeln Allgemeine Java-Themen 8
S Array in String umwandeln Allgemeine Java-Themen 6
cedi int Zahl in ein ASCII zeichen umwandeln und dieses in ein externes Textfenster schreiben Allgemeine Java-Themen 6
X Vector in Intervall-Menge umwandeln Allgemeine Java-Themen 4
S String mit GSON umwandeln Allgemeine Java-Themen 2
P Auslesen serieller Schnittstelle - umwandeln von byteArray Allgemeine Java-Themen 3
D Tabelle umwandeln Allgemeine Java-Themen 12
M String in Html Text umwandeln Allgemeine Java-Themen 2
L String in int umwandeln Allgemeine Java-Themen 5
H String in binary umwandeln? Allgemeine Java-Themen 6
S String[] in Integer umwandeln Allgemeine Java-Themen 16
Joy String in Date umwandeln Allgemeine Java-Themen 2
H .class in .java umwandeln Allgemeine Java-Themen 3
0 Datum in Java Date umwandeln Allgemeine Java-Themen 4
M String in Befehl umwandeln Allgemeine Java-Themen 10
T umwandeln BufferedImage to File Allgemeine Java-Themen 7
H2SO3- großen double in string mit e umwandeln Allgemeine Java-Themen 4
DerEisteeTrinker PDF mit seiner Formatierung in HTML umwandeln Allgemeine Java-Themen 15
B InputStream zu URL umwandeln Allgemeine Java-Themen 2
C Audiodatei umwandeln (wav->au) Allgemeine Java-Themen 5
Daniel_L Fragen zu RegEx und URL umwandeln Allgemeine Java-Themen 4
S Hexzahl in ASCII umwandeln Allgemeine Java-Themen 3
C DWG in PDF umwandeln Allgemeine Java-Themen 2
H JPanel direkt in PDF umwandeln Allgemeine Java-Themen 2
Developer_X "String" in "int" umwandeln, und dann "int" in "float" Allgemeine Java-Themen 8
E VB-Codesegment in Java umwandeln Allgemeine Java-Themen 8
S umwandeln in .jar Allgemeine Java-Themen 10
D Bild in text tabelle umwandeln Allgemeine Java-Themen 2
J Umwandeln von einem String in ein Datum Allgemeine Java-Themen 8
Daniel_L ASCII in UniCode umwandeln? Allgemeine Java-Themen 14
T html Datei in jrxml Datei (JasperReports) umwandeln Allgemeine Java-Themen 6
J Wrapper Array in korresp. primitiven Array umwandeln? Allgemeine Java-Themen 2
T Image in gif umwandeln Allgemeine Java-Themen 14
B Akzentbuchstaben in akzentfreie Variante umwandeln Allgemeine Java-Themen 5
L TextField auslesen und umwandeln Allgemeine Java-Themen 14
J Datentyp "Calendar" umwandeln und ausgeben können Allgemeine Java-Themen 36
G Datumswert String in Integer umwandeln Allgemeine Java-Themen 2
P Typ Object in socket umwandeln Allgemeine Java-Themen 4
J String (in Timestamp-Form) in Timestamp umwandeln Allgemeine Java-Themen 2
P /node()[1]/node()[4]/node()[3] in 1:4:3 umwandeln Allgemeine Java-Themen 1
W Umlaute umwandeln bekomme nur Leerzeichen raus. Allgemeine Java-Themen 11
H int in char umwandeln Allgemeine Java-Themen 7
MQue Object in Integer umwandeln Allgemeine Java-Themen 3
G Anzahl Tage in Datum umwandeln Allgemeine Java-Themen 13
MQue String in int umwandeln Allgemeine Java-Themen 2
C double Zahlen mit drei NachkommaStellen in String umwandeln Allgemeine Java-Themen 2
M Integer in String umwandeln Allgemeine Java-Themen 7
R Java Standalone Prog zu Webapplikation umwandeln Allgemeine Java-Themen 14
G String in Zahl umwandeln Allgemeine Java-Themen 9
S Object nach Integer umwandeln Allgemeine Java-Themen 13
N Unixtime umwandeln Allgemeine Java-Themen 9
K umwandeln des codes um eine .jar datei zu erstellen(am bsp.) Allgemeine Java-Themen 10
R Bits in eine IP-adresse (string) umwandeln Allgemeine Java-Themen 5
E XML dateTime String in Date mit SimpleDateFormat umwandeln Allgemeine Java-Themen 5
TheJavaKid rgb in hex umwandeln Allgemeine Java-Themen 13
G http:// in Link umwandeln Allgemeine Java-Themen 14
G Java Code in Programm umwandeln? Allgemeine Java-Themen 12

Ähnliche Java Themen


Oben