Hi,

thanks for the answer, with that information I can pull out the term frequency. 
Reason for all this, is that we want to use this scoring algorithm: 
http://download-uk.oracle.com/docs/cd/B19306_01/text.102/b14218/ascore.htm

but is there a performance cost on the explain, that can be painfull for 
production (16 million documents), since we would have to always use the 
explain feature for every request ..

hoping someone can answer this and help us out,

greetings,
Tim


-----Oorspronkelijk bericht-----
Van: Chris Hostetter [mailto:[EMAIL PROTECTED]
Verzonden: do 27-3-2008 7:36
Aan: solr-user@lucene.apache.org
Onderwerp: Re: Highlight - get terms used by lucene


: we use highlighting and snippets for our searches. Besides those two, I
: would want to have a list of terms that lucene used for the
: highlighting, so that I can pull out of a "Tim OR Antwerpen AND Ekeren"
: the following terms : Antwerpen, Ekeren if let's say these are the only
: terms that gave results ...

the closest you can get is the "explain" info in the debugging output.

currently that comes back as a big string you would need to parse, but
since the topic of progromaticly accessing that data seems to have come up
quite a bit more then i ever really expected, i will point out that
internally it's a fairly well structured class that could be output as a
hierarchy of NamedLists (funny bit of trivia: i wrote that code once upon
a time before SOlr was an Apache project, but it wouldn't work because the
XmlResponseWriter had a bug where it couldn't handle NamedLists more then
3 levels deep)

a patch would be fairly simple if someone wanted to write one.



-Hoss






Info Support - http://www.infosupport.com

Alle informatie in dit e-mailbericht is onder voorbehoud. Info Support is op 
geen enkele wijze aansprakelijk voor vergissingen of onjuistheden in dit 
bericht en staat niet in voor de juiste en volledige overbrenging van de inhoud 
hiervan. Op al de werkzaamheden door Info Support uitgevoerd en op al de aan 
ons gegeven opdrachten zijn - tenzij expliciet anders overeengekomen - onze 
Algemene Voorwaarden van toepassing, gedeponeerd bij de Kamer van Koophandel te 
Utrecht onder nr. 30135370. Een exemplaar zenden wij u op uw verzoek per 
omgaande kosteloos toe.

De informatie in dit e-mailbericht is uitsluitend bestemd voor de 
geadresseerde. Gebruik van deze informatie door anderen is verboden. 
Openbaarmaking, vermenigvuldiging, verspreiding en/of verstrekking van deze 
informatie aan derden is niet toegestaan.

Dit e-mailbericht kan vertrouwelijke informatie bevatten. Indien u dit bericht 
dus per ongeluk ontvangt, stelt Info Support het op prijs als u de zender door 
een antwoord op deze e-mail hiervan op de hoogte brengt en deze e-mail 
vervolgens vernietigt.

Reply via email to