RE: Synonyms in query time, configured as managed resouces

Daniel Moura Mon, 26 Dec 2016 08:19:53 -0800

(now in the correct thread... sorry)

Hi Eric,


My use case is quite simple. I was using the following configuration:

<!-- synonyms are managed resources -->
<fieldType name="managed_en" class="solr.TextField" positionIncrementGap="100">
     <analyzer>
         <tokenizer class="solr.StandardTokenizerFactory"/>
         <filter class="solr.ManagedSynonymFilterFactory" managed="english"/>
     </analyzer>
</fieldType>
<!-- synonyms act only in query time -->
<fieldType name="watson_text" 
class="com.ibm.watson.hector.plugins.fieldtype.WatsonTextField" 
omitNorms="false" omitTermFreqAndPositions="false" indexed="true" 
termOffsets="true" stored="true" termPositions="true" termVectors="true">
     <analyzer type="index">
         <tokenizer class="solr.StandardTokenizerFactory"/>
         <filter class="solr.LowerCaseFilterFactory"/>
         <filter class="solr.EnglishPossessiveFilterFactory"/>
         <filter class="solr.KeywordMarkerFilterFactory" 
protected="lang/protwords_en.txt"/>
         <filter class="solr.PorterStemFilterFactory"/>
     </analyzer>
     <analyzer type="query">
         <tokenizer class="solr.StandardTokenizerFactory"/>
         <filter class="solr.SynonymFilterFactory" expand="true" 
ignoreCase="true" synonyms="synonyms.txt"/>
         <filter class="solr.StopFilterFactory" words="lang/stopwords_en.txt" 
ignoreCase="true"/>
         <filter class="solr.LowerCaseFilterFactory"/>
         <filter class="solr.EnglishPossessiveFilterFactory"/>
         <filter class="solr.KeywordMarkerFilterFactory" 
protected="lang/protwords_en.txt"/>
         <filter class="solr.PorterStemFilterFactory"/>
     </analyzer>
</fieldType>

But once my client is asking to add some synonyms, I changed to managed 
resources. And now, I just want to have sure if the following configuration is 
correct:

<fieldType name="watson_text" 
class="com.ibm.watson.hector.plugins.fieldtype.WatsonTextField" 
omitNorms="false" omitTermFreqAndPositions="false" indexed="true" 
termOffsets="true" stored="true" termPositions="true" termVectors="true">
   <analyzer type="index">
     <tokenizer class="solr.StandardTokenizerFactory"/>
     <filter class="solr.LowerCaseFilterFactory"/>
     <filter class="solr.EnglishPossessiveFilterFactory"/>
     <filter class="solr.KeywordMarkerFilterFactory" 
protected="lang/protwords_en.txt"/>
     <filter class="solr.PorterStemFilterFactory"/>
   </analyzer>
   <analyzer type="query">
     <tokenizer class="solr.StandardTokenizerFactory"/>
     <filter class="solr.ManagedSynonymFilterFactory" managed="english"/> 
<!—this is well configured? -->
     <filter class="solr.StopFilterFactory" words="lang/stopwords_en.txt" 
ignoreCase="true"/>
     <filter class="solr.LowerCaseFilterFactory"/>
     <filter class="solr.EnglishPossessiveFilterFactory"/>
     <filter class="solr.KeywordMarkerFilterFactory" 
protected="lang/protwords_en.txt"/>
     <filter class="solr.PorterStemFilterFactory"/>
   </analyzer>
</fieldType>

What do you think? In terms of configuration, this is well defined?
I tested it without errors.
But... How can I know (or have sure) that my managed synonyms are being used in 
query time? How to test it? How to validate it?

Regards,
Daniel Moura

-----Original Message-----
From: Erick Erickson [mailto:erickerick...@gmail.com] 
Sent: 26 de dezembro de 2016 16:01
To: solr-user <solr-user@lucene.apache.org>
Subject: Re: Synonyms in query time, configured as managed resouces

What happens when you test it? Are you getting some kind of error?

Best,
Erick



On Mon, Dec 26, 2016 at 7:19 AM, Daniel Moura <daniel.mo...@novabase.pt> wrote:
> Hi all!
>
> I will need your help guys.
>
> We now need to know if the following definition is correct to have synonyms 
> in query time and configured as managed resources, for the watson_text type 
> that is the type used to indexed fields.
>
> <fieldType name="watson_text" 
> class="com.ibm.watson.hector.plugins.fieldtype.WatsonTextField" 
> omitNorms="false" omitTermFreqAndPositions="false" indexed="true" 
> termOffsets="true" stored="true" termPositions="true" 
> termVectors="true"> <analyzer type="index"> <tokenizer 
> class="solr.StandardTokenizerFactory"/>
> <filter class="solr.LowerCaseFilterFactory"/>
> <filter class="solr.EnglishPossessiveFilterFactory"/>
> <filter class="solr.KeywordMarkerFilterFactory" 
> protected="lang/protwords_en.txt"/>
> <filter class="solr.PorterStemFilterFactory"/>
> </analyzer>
> <analyzer type="query">
> <tokenizer class="solr.StandardTokenizerFactory"/>
> <filter class="solr.ManagedSynonymFilterFactory" managed="english"/> 
> <filter class="solr.StopFilterFactory" words="lang/stopwords_en.txt" 
> ignoreCase="true"/> <filter class="solr.LowerCaseFilterFactory"/>
> <filter class="solr.EnglishPossessiveFilterFactory"/>
> <filter class="solr.KeywordMarkerFilterFactory" 
> protected="lang/protwords_en.txt"/>
> <filter class="solr.PorterStemFilterFactory"/>
> </analyzer>
> </fieldType>
>
>
>
> Thank you, I'll wait your answer asap.
>
> Cheers,
>
> DM
>

RE: Synonyms in query time, configured as managed resouces

Reply via email to