當前位置:成語大全網 - 新華字典 - 如何用Solr搭建大數據查詢平臺

如何用Solr搭建大數據查詢平臺

1、將解壓包中的solr-4.7.1/dist/solr-4.7.1.war復制到tomcat_dir/webapps/目錄,並命名為solr.war。

2、將solr-4.7.1/example/lib/ext/目錄下的jar文件復制到tomcat/lib目錄下,將solr-4.7.1/example/resources/下的log4j.properties文件復制到tomcat_dir/lib目錄下;

切把 solr-4.7.1/example/solr,復制到tomcat_dir/bin下。

3、修改tomcat_dir/conf/server.xml

<Connector port="8080" protocol="HTTP/1.1"

connectionTimeout="20000"

redirectPort="8443"

URIEncoding="UTF-8" />

4、創建solr.xml,存放在路徑:tomcat/conf/Catalina/localhost/solr.xml,內容:

<Context path="/solr" docBase="C:\Tomcat 7.0\webapps\solr.war"

debug="0" crossContext="true">

PS:上面的docBase和value路徑中不能存在中文字符,否則會出現404錯誤。

5、將C:\Tomcat 7.0\webapps下的solr.war包,啟動項目解壓;然後再添加幾個jar包:

solr-4.7.1\dist\solr-dataimporthandler-4.7.1.jar;

solr-4.7.1\dist\solr-dataimporthandler-extras-4.7.1.jar;

還要加載數據庫驅動包:mysql-connector-java-3.1.13-bin.jar

6、在C:\Tomcat 7.0\bin\solr\collection1\conf 下的solrconfig.xml增加以下數據庫配置:

data-config.xml

7、將tomcat\bin\solr\collection1\conf下增加data-config.xml文件,內容如下:

<dataSource type="JdbcDataSource"

driver="com.mysql.jdbc.Driver"

url="jdbc:mysql://192.168.1.221:3306/tmsdb"

user="root"

password="123456"/>

8、增加中文分詞器,ik-analyzer的配置如下:

①目前的中文分詞主要有兩種

1,基於中科院ICTCLAS的隱式馬爾科夫hhmm算法的中文分詞器,例如smartcn等。(不支持自定義擴展詞庫)

2,基於正向叠代最細粒度切分算法(正向最大匹配並且最細分詞)例如IK,庖丁等(支持自定義擴展詞庫)

安裝分詞前,可以去下載IK的分詞包 :

IK-Analyzer-4.7.1-0.0.1-SNAPSHOT.jar

下載完畢後,將此包放進tomcat\solr的\WEB-INF\lib下面:tomcat\webapps\solr\WEB-INF\lib 。

下面需要在solr的schemal.xml進行分詞器註冊:

<!-- -->

<!-- -->

最後還得配置壹個引用字段就OK了

②它的安裝部署十分簡單,將IKAnalyzer2012.jar部署亍項目的lib目錄中;IKAnalyzer.cfg.xml不stopword.dic文件放置在class根目錄(對於web項目,通常是WEB-I NF/classes目彔,同hibernate、log4j等配置文件相同)下即可 ;然後配置solr4.7中schema.xml配置解析器:

……

……

-