jcseg歧义句子分词测试 - HelloWorld开发者社区

今天在晚上看到一些网友测试分词器常用的起义语句, 我拿jcseg去试了下:

1. 结婚的和尚未结婚的
jcseg分词: 结婚的和尚未结婚的
Done, total:10, split:6, cost: 0.00026sec

2. 他说的确实在理
jcseg分词:
他说的确实在理
Done, total:7, split:5, cost: 0.00052sec

3. 把手抬起来
jcseg分词:
把手抬起来
Done, total:5, split:3, cost: 0.00000sec

4. 邓颖超生前使用过的物品
jcseg分词:
邓颖超生前使用过的物品
Done, total:11, split:6, cost: 0.00000sec

5. 阿拉斯加遭强暴风雪袭击致xx人死亡
jcseg分词:
阿拉斯加遭强暴风雪袭击致 xx 人死亡
Done, total:17, split:9, cost: 0.00052sec

6. 今后三年中将翻两番
jcseg分词:
今后三年中将翻两番
Done, total:9, split:4, cost: 0.00000sec

7. 乒乓球拍卖完了
jcseg分词:
乒乓球拍卖完了
Done, total:7, split:3, cost: 0.00000sec

8. 粮食不卖给八路军
jcseg分词:
粮食不卖给八路军
Done, total:8, split:4, cost: 0.00105sec

9. 费孝通向人大常委会提交书面报告
jcseg分词:
费孝通向人大常委会提交书面报告
Done, total:15, split:5, cost: 0.00105sec

10. 梁启超生前住在这里
jcseg分词:
梁启超生前住在这里
Done, total:9, split:4, cost: 0.00000sec

11. 吴江西陵印刷厂
jcseg分词:
吴江西陵印刷厂
Done, total:7, split:3, cost: 0.00000sec

12. 叔叔亲了我妈妈也亲了我
jcseg分词:
叔叔亲了我妈妈也亲了我

Done, total:11, split:7, cost: 0.00000sec

机械匹配方法, 上面有些句子似乎很难得到正确的切分.

这些都是其他分词器切分结果不是很好的句子, jcseg的切分效果确实有些优势.

Java synchronized同步关键字背后的原理与源码实现