Thema: Betriebssystem Linux - PDF-Konverter gesucht
Einzelnen Beitrag anzeigen
Alt 09.12.2011, 19:11   #7
bommelmann
Energieeffizienzklasse A
 
Benutzerbild von bommelmann
 
Registriert seit: 25.01.2006
Ort: Berlin
Fahrzeug: BMW M850i, Volvo V70
Standard

Vielen Dank für eure Tipps!

Der aktuelle Stand ist der, dass wir zunächst PDFs in verschlüsselter und unverschlüsselter Form behandeln und in mehrstufiger verarbeitung eventuelle Verschlüsselungen knacken.

Danach gehen die PDFs durch die ABBYY-OCR-CLI, eine recht leistungsstarke OCR-Software die auf Linux per Kommandozeile gesteuert werden kann.

Als Ergebnis erhält man eine PDF aus der man die Texte herauskopieren kann und einen Texteintrag in der Datenbank.

Was die Konvertierung aus DOC, PPT usw. betrifft, hatte ich bisher auch nur Windows-Programme gefunden, aber noch nix wirklich Attraktives für Linux.
bommelmann ist offline   Antwort Mit Zitat antworten