2016-06-01 9 views
0

ich möchte die Wörter bis zu bestimmter Zeile und nicht darüber hinaus suchen, die solr Abfrage verwendend. Ich habe Proximity Match versucht, aber es hat nicht funktioniert. meine Daten ist wieSOLR wie man den Suchinhalt in der Solr Frage eingrenzt

Blockquote "Datum: Do, 24. Juli 2014 09.36.44 GMT \ nCache-Control: private \ nContent-Type: application/json; charset = utf-8 \ nContent-Encoding: gzip \ nVary: Accept-Encoding \ nP3P: CP =% 20CURo TAIo IVAo IVDO ON UNI COM NAV INT DEM STA USER% 20 \ nX-Powered-By: ASP.NET \ nContent-Length: 570 \ nKeep-Alive: timeout = 120 \ nVerbindung: Keep-Alive \ n \ n [{% 20rows% 20: [],% 20index% 20: [],% 20Ordner% 20: [[% 20Inbox% 20,% 20Inbox% 20,% 20% 20 , 1,1,0,0,0,% 20Inbox% 20,0,0,% 20none% 20,0], [% 20Drafts% 20,% 20Drafts% 20,% 20% 20,1,1,0, 0,0% 20% 20,0% 20% 20% 20% 20% 20,1,0,% 20nicht% 20,0], [% 20Spam% 20,% 20Spam% 20,% 20% 20,1,1,0,0,0,% 20Spam% 20,1,0,% 20none% 20,0], [% 20Deleted% 20,% 20Trash% 20,% 20% 20,1,1,0,7,9,% 20Deleted% 20,1,0,% 20none% 20,0], [% 20Saved% 20,% 20Saved Mail% 20,% 20% 20,1,1,0,0,0,% 20Saved% 20,1,0,% 20n ein% 20,0], [% 20SavedIMs% 20,% 20Saved Chats% 20,% 20Saved% 20,2,1,0,0,0,% 20SavedIMs% 20,1,0,% 20none% 20,0] ],% 20fcsupport% 20: wahr,% 20hasNewMsg% 20: false,% 20totalItems% 20: 0,% 20isSuccess% 20: wahr,% 20foldersCanMoveTo% 20: [% 20Sent% 20,% 20Spam% 20,% 20Deleted% 20 ,% 20Saved% 20,% 20SavedIMs% 20],% 20indexStart% 20: 0}] POST /38664-816/aol-6/en-us/common/rpc/RPC.aspx?user=hl1lkgReIh & transport = xmlhttp & r = 0.019667088333411797 & a = GetMessageList & l = 31211 HTTP/1.1 \ nHost: mail.aol.com \ nUser-Agent: Mozilla/5.0 (Windows NT 5.1; rv: 31.0) Gecko/20100101 Firefox/31.0 \ nAkzeptieren: text/html, application/xhtml + xml, application/xml; q = 0.9, /; q = 0.8 \ nZugriffssprache: de-DE, en; q = 0.5 \ nAccept-Encoding: gzip, deflate \ nInhaltstyp: application/x-www-form-urlencoded; Zeichensatz = UTF-8 \ nX-Requested-Mit: XMLHttpRequest \ nReferer: http://mail.aol.com/38664-816/aol-6/en-us/Suite.aspx \ nContent-Length: 452 \ nCookie: mbox = PC# 1405514778803-136292.22_06 # 1407395182 | Sitzung # 1406185366924-436868 # 1406187442 | check # true # 1406185642 ; s_pers =% 20s_fid% 3D55C638B5F089E6FB-19ACDEED1644FD86% 7C1469344726539% 3B% 20s_getnr% 3D1406186326569-Wiederholung% 7C1469258326569% 3B% 20s_nrgvo% 3DRepeat% 7C1469258326571% 3B; s_vi = [CS] v1 | 29E33A0D051D366F-60000105200097FF [CE]; UNAUTHID = 1.5efb4a11934a40b8b5272557263dadfe.88c5; RSP_COOKIE = type = 30 & name = YWxzaGFraWIyMDE0 & sn = MzRb% 2FjjHIe8odpr% 2FfxZR2g% 3D% 3D & stype = 0 & agrp = M; LTState = ver: 5 & lav: 22 & un: * UQo5AwAnAytffwJSYg% 3d% 3d & sn: * UQo5AwAnAytffwJSYg% 3d% 3d & uv: AOL & lc: en-us & ud: aol.com & ea: * UQo5AwAnAytffwJSCAsnWWoJASZL & PRMc : 825.345 & mt: 6 & ams: 1 & CMAI: 365 & snt: 0 & vnop: false & mh: core-mia002b.r1000.mail.aol.com & br: 100 & wm: mail.aol.com & cKD : .mail.aol.com & ckp:% 2f & ha: 1NGRuUTRRxGFF2s5A4JwkuCT43Q% 3d &; aolweatherlocation = 10003; DataLayer = cons% 3D6.107% 26coms% 3D629; grvinsights = 69f3a2bb86ed3cd31aa1d14a1ce9e845; CUNAUTHID = 1.5efb4a11934a40b8b5272557263dadfe.88c5; s_sess =% 20s_cc% 3Dtrue% 3B% 20s_sq% 3Daolcmp% 253D% 252526pid% 25253Dcmp% 2525253A% 25252520Help% 25.252.520% 2525257C% 25252520View% 25252520Article% 2525253A% 25252520Clear% 25252520cookies% 2525252C% 25252520cache% 2525252C% 25252520history% 25252520and% 25252520footprints% 252526pidt % 25253D1% 252526oid% 25253Dhttp% 2525253A% 2525252F% 2525252Fwebmail.aol.com% 2525252F% 2525253F_AOLLOCAL% 2525253Dmail% 252526ot% 25253DA% 2526aolsnssignin% 253D% 252526pid% 25253Dsso% 25.252.520% 2525253A% 25252520login% 252526pidt% 25253D1% 252526oid% 25253DSign% 25252520In % 252526oidt% 25253D3% 252526ot% 25253DSUBMIT% 3B; L7Id = 31211; Kontext = ver: 3 & sid: 923f783b-bc6e-4edf-87c9-e52f19b3ce67 & rt: STANDARD & i: f & ckd: .mail.aol.com & ckp:% 2f & ha: X80Ku4ffRKsOVSwgmEVPCfpfxeU% 3d &; IDP_A = s-1-V0c3QiuO6BzQ5S6_u3s0brfUqMCktezAz7sWlVfHD90omIijDXRrMJkSM-9-xcnUcSTnXbcZ1aUCgvfuToVeJihcftKY5KtsC_nB7Y9qf6P0xUnNfCIAmWVtRf4ctSQ9JwRIzHa40dhFuULwYLu3NUPTxckeFUFAzcSS4hrmb4grhEtyOGp0qV5rIKtjs4u8; MC_CMP_ESK = NonSense; SNS_AA = asrc = 2 & sst = 1406185424 & Typ = 0; _utd = gd # MzRb% 2FjjHIe8odpr% 2FfxZR2g% 3D% 3D | pr #a | st # sns.webmail.aol.com | uid #; AUTH = ver: 22 & UAS: * UQo5AwAnAytffwJSZAskRiwLBSIDWVpVXxVTVwJCLFxdSnpHUWBbeV1jcikERgl6CEYLJUweGUhdFQQLW1h% 2bBAZRcllWfVl8VH4DUmRaZARoPhw% 2bBFBA & IDL: 0 & un: * UQo5AwAnAytffwJSYg% 3d% 3d & auf: SNS & sn: * UQo5AwAnAytffwJSYg% 3d% 3d & wim:% 252FwQCAAAAAAAEk2ihy% 252BE4MMebm4R1jvxY07zNZhFOHSz2EFBnsNdOAUsl8QyZceo54kWYZ4vwVayLFF7w & sty: 0 & ud: aol.com & uid: hl1lkgReIh & ss: 635417678271359104 & SVS: SNS_AA% 7c1406185424 & la: 635417687268954835 & AAT: A & act: M & br: 100 & CBR-: AOL & mt: 012.Bezahlung: 0 & mbt: G & uv: AOL & lc: en-us & Gebot: 1 & acd: 1403348988 & pix: 3829 & PRMc: 825.345 & relm: aol & mah:% 2 \ nConnection: keep-alive \ n "

und möchte Content-Type: application/json aus den Daten und nicht über diese Zeile hinaus suchen. Ich habe versucht,

http://192.168.0.164:8983/solr/collection_with_all_details/select?q=Content%3AContent-Type json * & wt = json & indent = true

aber sucht er in Inhalt. Ich muss den Suchinhalt beschränken

Antwort

0

Ich glaube nicht, dass es in diesem Fall möglich ist. Sie können highlighter überprüfen, um die ersten 200 Zeichen in der Hervorhebungsantwort zurückzugeben.

Möglicherweise müssen Sie daran denken, einen benutzerdefinierten Antwortschreiber zu schreiben, der dabei helfen kann.

Eine weitere Option cab erstellen zusätzliche Feld mit indexed="false"stored="true" wird effizienter sein.

Erstellen Sie Ihr ursprüngliches Feld indexed="true"stored="false", Ihre Indexgröße wird verringert. Das neue Kopierfeld lautet indexed="false"stored="true".

<copyField source="text" dest="textShort" maxChars="200"/> 

Überprüfen Sie, ob dies für Sie funktioniert.

0

Sie sollten Ihre Daten wirklich vorverarbeiten, um nur den Teil zu indizieren, den Sie verwenden werden. Dies zu tun, ist keine gute Lösung, da Sie den größten Teil des Inhalts bereits im Index haben und nach einem Trennzeichen suchen, das nicht an einem bestimmten Byte-Ort positioniert ist (was maxChars möglich wäre) machen).

Je nachdem, wie Sie indexieren, können Sie dies entweder im Indexierungsschritt (regextransformer, in Ihrem eigenen Code mit SolrJ usw.) tun oder im Analyse-Schritt des Codes tun, indem Sie etwas wie a Musterreplacefilter. Das würde es ermöglichen, alles nach der gesuchten Kopfzeile zu entfernen.

Auf diese Weise sollten Sie in der Lage sein, den Inhalt je nach Bedarf in ein Feld header und ein Feld body zu indizieren.