masterofnothing
New Member
Servus zusammen,
Ich habe jetzt die aktuellste Version der Regain-Serversuche gemäss der Anleitung im Wiki auf dem Server installiert.
Ich denke eigentlich das ich alles richtig gemacht habe, trotzdem bekomme ich bei Aufruf des Commandos java -jar regain-crawler.jar (um den Crawler anlaufen zu lassen) als root folgendes zurück:
Ich habe zugebenermassen keine Ahnung was das bedeuten soll.
Setze Debian Etch 4.0 min ein. java --version:
ein.
Noch ein paar Worte allgemein:
Wir wollen mit Regain zur Contentanalyse einsetzen, um die Webspace-Inhalte unserer Kunden zu überwachen. Es sollen etwa 900 Verzeichnisse mit der Gesamtgrösse von 65GB durchsucht werden.
Die Kundenverzeichnisse sind unter /var/kunden/webs/ und Regain ist unter /var/kunden/webs/web22/fleischfresser/
Falls das irgendwie weiterhilft, lieber zuviel Angaben als zuwenig
Würde mich über Antworten freuen, bin quasi für jedes Fetzchen Information dankbar.
Schöne Grüsse aus München,
Stefan
Ich habe jetzt die aktuellste Version der Regain-Serversuche gemäss der Anleitung im Wiki auf dem Server installiert.
Ich denke eigentlich das ich alles richtig gemacht habe, trotzdem bekomme ich bei Aufruf des Commandos java -jar regain-crawler.jar (um den Crawler anlaufen zu lassen) als root folgendes zurück:
Code:
h1386890:/var/kunden/webs/web22/fleischfresser/crawler# java -jar regain-crawler.jar
19:37:51: Logging initialized
19:37:51: Starting crawling...
19:37:51: Using no proxy
19:37:51: Preparing the index
19:37:51: Can't update index, because there was no old index. A complete new index will be created...
19:37:51: Fatal: Preparing the index failed!
net.sf.regain.RegainException: Creating the document preparators failed
at net.sf.regain.crawler.document.DocumentFactory.<init>(Unknown Source)
at net.sf.regain.crawler.IndexWriterManager.<init>(Unknown Source)
at net.sf.regain.crawler.Crawler.run(Unknown Source)
at net.sf.regain.crawler.Main.main(Unknown Source)
Caused by: net.sf.regain.RegainException: Loading preparator file 'preparator/PoiMsOfficePreparators.jar' failed
at net.sf.regain.crawler.document.PreparatorFactory.loadPrepararorJar(Unknown Source)
at net.sf.regain.crawler.document.PreparatorFactory.createPreparatorArr(Unknown Source)
... 4 more
Caused by: java.util.zip.ZipException: error in opening zip file
at java.util.zip.ZipFile.open(Native Method)
at java.util.zip.ZipFile.<init>(ZipFile.java:203)
at java.util.jar.JarFile.<init>(JarFile.java:132)
at java.util.jar.JarFile.<init>(JarFile.java:97)
... 6 more
Ich habe zugebenermassen keine Ahnung was das bedeuten soll.
Setze Debian Etch 4.0 min ein. java --version:
java version "1.5.0_14"
Java(TM) 2 Runtime Environment, Standard Edition (build 1.5.0_14-b03)
Java HotSpot(TM) Client VM (build 1.5.0_14-b03, mixed mode, sharing)
ein.
Noch ein paar Worte allgemein:
Wir wollen mit Regain zur Contentanalyse einsetzen, um die Webspace-Inhalte unserer Kunden zu überwachen. Es sollen etwa 900 Verzeichnisse mit der Gesamtgrösse von 65GB durchsucht werden.
Die Kundenverzeichnisse sind unter /var/kunden/webs/ und Regain ist unter /var/kunden/webs/web22/fleischfresser/
Falls das irgendwie weiterhilft, lieber zuviel Angaben als zuwenig
Würde mich über Antworten freuen, bin quasi für jedes Fetzchen Information dankbar.
Schöne Grüsse aus München,
Stefan