Java: Creating the document preparators failed [Regain Serversuche]

masterofnothing

New Member
Servus zusammen,

Ich habe jetzt die aktuellste Version der Regain-Serversuche gemäss der Anleitung im Wiki auf dem Server installiert.

Ich denke eigentlich das ich alles richtig gemacht habe, trotzdem bekomme ich bei Aufruf des Commandos java -jar regain-crawler.jar (um den Crawler anlaufen zu lassen) als root folgendes zurück:
Code:
h1386890:/var/kunden/webs/web22/fleischfresser/crawler# java -jar regain-crawler.jar 
19:37:51: Logging initialized 
19:37:51: Starting crawling... 
19:37:51: Using no proxy 
19:37:51: Preparing the index 
19:37:51: Can't update index, because there was no old index. A complete new index will be created... 
19:37:51: Fatal: Preparing the index failed! 
net.sf.regain.RegainException: Creating the document preparators failed 
        at net.sf.regain.crawler.document.DocumentFactory.<init>(Unknown Source) 
        at net.sf.regain.crawler.IndexWriterManager.<init>(Unknown Source) 
        at net.sf.regain.crawler.Crawler.run(Unknown Source) 
        at net.sf.regain.crawler.Main.main(Unknown Source) 
Caused by: net.sf.regain.RegainException: Loading preparator file 'preparator/PoiMsOfficePreparators.jar' failed 
        at net.sf.regain.crawler.document.PreparatorFactory.loadPrepararorJar(Unknown Source) 
        at net.sf.regain.crawler.document.PreparatorFactory.createPreparatorArr(Unknown Source) 
        ... 4 more 
Caused by: java.util.zip.ZipException: error in opening zip file 
        at java.util.zip.ZipFile.open(Native Method) 
        at java.util.zip.ZipFile.<init>(ZipFile.java:203) 
        at java.util.jar.JarFile.<init>(JarFile.java:132) 
        at java.util.jar.JarFile.<init>(JarFile.java:97) 
        ... 6 more


Ich habe zugebenermassen keine Ahnung was das bedeuten soll.

Setze Debian Etch 4.0 min ein. java --version:
java version "1.5.0_14"
Java(TM) 2 Runtime Environment, Standard Edition (build 1.5.0_14-b03)
Java HotSpot(TM) Client VM (build 1.5.0_14-b03, mixed mode, sharing)

ein.

Noch ein paar Worte allgemein:
Wir wollen mit Regain zur Contentanalyse einsetzen, um die Webspace-Inhalte unserer Kunden zu überwachen. Es sollen etwa 900 Verzeichnisse mit der Gesamtgrösse von 65GB durchsucht werden.
Die Kundenverzeichnisse sind unter /var/kunden/webs/ und Regain ist unter /var/kunden/webs/web22/fleischfresser/
Falls das irgendwie weiterhilft, lieber zuviel Angaben als zuwenig


Würde mich über Antworten freuen, bin quasi für jedes Fetzchen Information dankbar.

Schöne Grüsse aus München,
Stefan
 
file 'preparator/PoiMsOfficePreparators.jar' failed

Da ist doch die Lösung. Dein Classpath stimmt nicht!

also starten mit java -cp <DER_CLASSPATH> -jar <DAS_JAR>

Gruß
Haggy
 
Back
Top