2014年10月27日 星期一

Solr_06_IK分詞器建立繁體中文詞庫

因為IK分詞器僅支持簡體中文分詞,所以要自行建立繁體中文的詞庫
方法很簡單。
把下載回來的 IKAnalyzer2012FF_u1.jar 解壓縮然後進入到

org/wltea/analyzer/dic 目錄裡,

裡面有main2012.dic 及 quantifier.dic兩個檔案
請將這兩個檔案的原始內容(簡中),另外copy一份出來
然後轉成繁體中文,再放到原本簡中詞庫下方即可。
致於如何轉成繁中,請參考

或是在netBeans開啟此專案,修改後進行轉換

沒有留言:

張貼留言