DOC, PDF usw. auf dem Server durchsuchen?

NM78

New Member
Hallo, ich habe eine kleine PHP Anwendung mit der man Dokumente jeden Typs in einer Verzeichnis auf einen Linuxserver hochladen kann. Nun suche ich eine Möglichkeit diese Dateien nach Wörtern zu durchsuchen. Bei docx oder OpenOffice ist das kein Problem, aber wie macht man das bei den älteren Word Dokumenten? Gibt es dafür ein Tool oder Programm?
 
Such mal in der Paketverwaltung Deiner Linux-Distribution nach "antiword".
"ps2ascii" ist Teil des Pakets "ghostscript".
 
Danke, die letzte Version für Linux ist von 2005. Wie sollte man bei Office2007 und Office2010 Dokumenten vorgehen? Die müssten doch eigentlich in einem XML Format gespeichert sein, oder?

Hat schon jemand Erfahrung damit gesammelt?
 
Back
Top