Re: PDF indexing

Jack Krupansky Mon, 07 May 2012 12:36:38 -0700

Try SolrCell (ExtractingRequestHandler).

See:
http://wiki.apache.org/solr/ExtractingRequestHandler


-- Jack Krupansky

-----Original Message-----From: TolgaSent: Monday, May 07, 2012 3:24 PMTo: solr-user@lucene.apache.orgSubject: PDF indexing

Hi,

From what I have read, I think I have to use Tika (?) to index PDF,

xls, doc, etc files. How do I start? Do I use mvn clean install in thesource directory to get all the jar files to begin? Centos doesn'tprovide mvn, how do I build Tika after getting it fromhttp://maven.apache.org ?


Sorry for the noob questions, I'm just beginning.

Re: PDF indexing

Reply via email to