解壓
cd srilm
export SRILM=`pwd`
make MACHINE_TYPE=i686-m64
ldd bin/i686-m64/ngram
試壹下:
cd test/
make all
make clean
cd ..
語言模型 ngram:
cd lm/
./bin/i686-m64/ngram-count -text /home/yli/oralTest/data/read -lm LM
-text後為要統計的原文件,LM是輸出語言模型名字
沒用詞典的話結果各詞與標點都混在壹起
./bin/i686-m64/ngram-count -text /home/yli/oralTest/data/read -vocab 863.lmlist -lm LM
加入詞典:863.lmlist 191.1K 同WIN下結果
語言模型融合
./bin/i686-m64/ngram -lm a.arpa -lambda 0.3 -mix-lm b.arpa -mix-lm2 c.arpa -mix-lambda2 0.3 -write-lm mixabc.arpa