因為IK分詞器僅支持簡體中文分詞,所以要自行建立繁體中文的詞庫
方法很簡單。
把下載回來的 IKAnalyzer2012FF_u1.jar 解壓縮然後進入到
org/wltea/analyzer/dic 目錄裡,
裡面有main2012.dic 及 quantifier.dic兩個檔案
請將這兩個檔案的原始內容(簡中),另外copy一份出來
然後轉成繁體中文,再放到原本簡中詞庫下方即可。
致於如何轉成繁中,請參考
或是在netBeans開啟此專案,修改後進行轉換
沒有留言:
張貼留言