Ich habe einen Alfresco-Modelltyp mit einer zusätzlichen Eigenschaft des Typs d:content
. Diese Eigenschaft verursacht Solr-Ausnahmen, wenn ich versuche, Inhalte zu speichern, die größer als 32 KB sind. Die aktuelle Definition dieser Eigenschaft istIndexierung d: Inhaltseigenschaft mit Inhalt> 32 KB
<property name="acme:secondContent">
<type>d:content</type>
<mandatory>false</mandatory>
<index enabled="true">
<atomic>true</atomic>
<stored>true</stored>
<tokenised>both</tokenised>
</index>
</property>
Wenn ich den gesamten Inhalt, größer, dass 32 KB in dieser Eigenschaft Solr diese Ausnahme auslöst, wenn es um Index versucht es:
java.lang.IllegalArgumentException: Document contains at least one immense term in field="[email protected][email protected]{http://acme.com/model/custom/1.0}secondContent" (whose UTF8 encoding is longer than the max length 32766), all of which were skipped. Please correct the analyzer to not produce such terms.
Ändern der index
Konfiguration nicht funktioniert Hilfe, der Fehler wird mit allen Varianten von index
und den Unterelementen, die ich ausprobiert habe, ausgelöst.
In another question wird beantwortet:
Die maximale Größe für den einen einzigen Begriff in dem zugrunde liegenden Lucene Index ist 32776 Bytes, das ist ich hart codiert glauben.
Wie konfiguriere ich die index
eine d:content
Eigenschaft so, dass ich sparen und Indizieren von Inhalten kann größer als 32 KB?
Edit:
In contentModel.xml
, cm:content
wie folgt konfiguriert ist:
<index enabled="true">
<atomic>true</atomic>
<stored>false</stored>
<tokenised>true</tokenised>
</index>
eine einfache text/plain
Datei mit Inhalten größer als 32 KB funktioniert ohne Probleme hinzufügen.
Die gleiche index
Konfiguration für meine benutzerdefinierte Eigenschaft schlägt immer noch fehl.
Update:
Unter Alfresco 4.2fCE, das Problem tut nicht auftreten. Das ist also ein Fehler in Alfresco 5.0c zusammen mit Solr 4.1.9.
Update 2:
ich filed a bug in the Alfresco JIRA habe. 1
Einstellung '' zu true sollte helfen. Was ist der Inhalt dieses Feldes? Würden Sie etwas verlieren, wenn Sie es nur in Token-Form haben? Wenn Sie es in Stringform haben, können Sie sortieren und facettieren. Ist das für dieses Feld erforderlich? –
cheffe
Nein, Sortieren und Facettieren sind nicht erforderlich. Ich werde ein paar mehr Kombinationen versuchen. –
Gibt es einen Grund, warum Sie cm: Inhalt nicht erweitern können, der eine d: content -Eigenschaft enthält? – crownjewel82