日志文章

2008年06月12日 16:16:47

关于Lucene的正则匹配RegexQuery的问题

说明一下.
1, 这个不能针对StandardAnylizer分词方式. 这个是单字的. 可以whiteSpaceAnylizer 分词.
2, 他所在包是: lucene-regex-2.3.2.jar 包含在2.3的lucene包中.

3, 不同的Filed可以使用不同的分词方式. 但需要 new Field时给出分词.

几个人搞了半天才搞好.

类别: 无分类 |  评论(2) |  浏览(3141) |  收藏
一共有 2 条评论
2楼 [楼主]我的道路---企业不能没有.. 2008年07月14日 12:27:46 Says:
首先,要拆分输入. 将输入分析为: 汉字,拼音,全拼,简拼,数字 五种情况.
分后将输入列为下面几种类型.

  汉字+拼音
  汉字+简拼
  汉字+英文
  汉字+数字
  汉字+汉字

其他雷同. 然后再去搜索.
1楼 [匿名]jingle 2008年06月12日 23:01:54 Says:
你好,“关于拼音转汉字的实现”麻烦您能给一些更详细的实现步骤或者代码参考么?
多谢!

我的邮箱
jingle8848
#
126.com

#换成@
发表评论
看不清楚,换一张