[全文检索] 庖丁叔叔的逆袭 - 陈老师工口相谈 - ITeye博客

`

gladstone

浏览: 68613 次
性别:
来自: 上海

最近访客更多访客>>

wangyy

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

neolimeng：我也遇到这个问题了。并且我的不能进行任何操作。请问如何解决？
[宅之终极奥义]Ubuntu下的VNC远程监控桌面
east_java： LZ 你的UBB功能怎么加上去的啊能给个DEMO吗？
小巧玲珑的nicEdit桑
jianfeng008cn：佩服佩服，以后在小区里就不用花钱装宽带了~~
[大家上才是真的上] 使用无线蹭网工口物aircrack-ng分享互联网
fqyyj：比JBuilder都费内存!!慢死了,,!!
MyEclipse盗摄流出
fangwei：快要赶上jbuilder了。。。
MyEclipse盗摄流出

[全文检索] 庖丁叔叔的逆袭

全文检索 lucene

阅读更多

在 [全文检索]离开lucene姑娘的日子里面也有提到. lucene本身自带的StandardAnalyzer对于中文的分词相当弱智。

前段时间试了试庖丁分词:

Paoding Analysis摘要

Paoding's Knives 中文分词具有极 高效率 和 高扩展性 。引入隐喻，采用完全的面向对象设计，构思先进。

高效率：在PIII 1G内存个人机器上，1秒可准确分词 100万 汉字。

采用基于 不限制个数 的词典文件对文章进行有效切分，使能够将对词汇分类定义。

能够对未知的词汇进行合理解析

实际上试试：

输出：

分词的时候还可以，但是真正替换StandardAnalyzer就遇到点问题。估计是分词器有回写机制，服务器上开5个线程闹的内存不够用...

没有细致理解运行机制，也不好说庖丁同学的不是。还有可能试配置的问题吧。先放着，再议。

发布时间：2008-11-14 02:00:03 | 阅读：249 | 评论：0

分享到：

今儿一定要吃上嫩牛五方 | 陈老师本周推荐 - 中岛美嘉 ORION

2008-11-13 16:00
浏览 529
评论(0)
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

全文检索（庖丁解牛）: 全文检索技术，运用庖丁解牛的分词方法，比较实用，可以借鉴。

全文检索服务中文分词技术: IKAnalyzer是一个开源的，基于java语言开发的轻量级的中文分词工具包。庖丁中文分词库是一个使用Java开发的，可结合到Lucene 应用中的，为互联网、企业内部网使用的中文搜索引擎分词组件。

lucene 中文分词庖丁解牛: 庖丁解牛（很好的分词效率）在做站内全文检索时创建索引时比较快，而且感觉效果比JE要好一些。。

庖丁分词.jar: 庖丁分词.jar 庖丁分词.jar 庖丁分词.jar 庖丁分词.jar

solr+paoding: solr全文检索,全文检索，庖丁，分词，中文分词，庖丁jar，庖丁分词

全文检索之分词器分享.zip: 3，分享一波分词器SDK开发包及使用手册（IK分词器、imdict(ictclas)分词器、je分词器、mmseg分词器、paoding分词器、Shuzhen分词器、庖丁解羊分词器、增强版lucene分词器）文件比较大，请耐心下载。

Linux驱动开发庖丁解牛系类: Linux驱动开发庖丁解牛系类 Linux驱动开发庖丁解牛系类 Linux驱动开发庖丁解牛系类 Linux驱动开发庖丁解牛系类 Linux驱动开发庖丁解牛系类

lucene中文分词（庖丁解牛）庖丁分词: 支持中文的庖丁解牛，庖丁分词，找了好久才找到的希望对你有帮助。

Auto.js庖丁_3.5.0.apk: Auto.js庖丁_3.5.0

autojs庖丁3.2.0.rar: 庖丁3.2.0 加密

【民生商社】“庖丁解牛”拆析招股书：名创优品.pdf: 【民生商社】“庖丁解牛”拆析招股书：名创优品.pdf【民生商社】“庖丁解牛”拆析招股书：名创优品.pdf【民生商社】“庖丁解牛”拆析招股书：名创优品.pdf【民生商社】“庖丁解牛”拆析招股书：名创优品.pdf【民生...

庖丁解牛demo: 庖丁解牛详细demo

庖丁分词jar包: 庖丁分词的jar包

庖丁解牛分词 java包: 庖丁解牛分词 java包庖丁解牛分词 java包庖丁解牛分词 java包庖丁解牛分词 java包庖丁解牛分词 java包庖丁解牛分词 java包庖丁解牛分词 java包

庖丁解牛分词之自定义词库、庖丁解牛配置: 庖丁解牛分词之自定义词库、庖丁解牛配置，java搜索分词

paoding analysis 3.0.1 jar (庖丁解牛分词器): 由于庖丁官方目前提供可下载尚不支持Lucene 3.0以上版本。因此作者对paoding进行重新编译，使其与最新Lucene 3.0.1版本适用。 Latest paoding 3.0.1 for lucene 3.0.1 使用说明：先下载2.0.4的版本（h t t p : / ...

经典的庖丁解牛通达信主图指标通达信指标公式源码.doc: 经典的庖丁解牛通达信主图指标通达信指标公式源码.doc

庖丁解牛工具: 庖丁解牛，Lucene分词器，很难得的资源。

lucene3.0庖丁+索引搜索程序: lucene3.0庖丁+索引搜索程序,里面有代码示例

庖丁解牛分词源码: 庖丁解牛分词器源码，包含源码与对应项目，可以用eclipse打开编译

Global site tag (gtag.js) - Google Analytics