Sun 22 Apr 2007
花了周末整整两天时间和P牛一起合作,终于将漫游的论坛改为全文搜索了,个中辛苦不足为外人道也。
呵呵,其实开玩笑的。一切进行的都很顺利,最大的问题就是需要整理一个好用的词库。我们用了自带的中文词库,发现很不适合漫游使用,后来找了一个拼音加加的词库,一个google拼音的词库,一个搜狗拼音的词库,还有自己人肉整理了一些资料,终于弄了一个100万字的超大词库。
这个全文搜索程序很简单,核心sql 就一行 “select postid,threadid,title from search where match(title,pagetext) against(’关键词’)”。我这里采用的是双数据库方案,原来的论坛数据库不动,新安装了一个支持中文全文搜索的Mysql。在里面建立搜索专用数据库,自己写了个程序每天增量将帖子加到这个数据库上就好了。具体的实现可以参考 hightman 的网站。
http://myft.twomice.net/show_hdr.php?xname=ILBS301&xpos=4&dname=
http://php.twomice.net/myft/s2.php
飞天的梦想 is proudly powered by
August 18th, 2007 at 9:06 pm
恭喜,还期待早日让普通用户能够再次使用搜索
August 27th, 2007 at 1:00 am
从4月22日开始就可以让普通用户搜索了啊 :)
November 26th, 2007 at 3:34 am
[…] mysql 中文全文搜索 花了周末整整两天时间和P牛一起合作,终于将漫游的论坛改为全文搜索了,个中辛苦不足为外人道也。 呵呵,其实开玩笑的。一切进行的都很顺利,最大的问题就是需要整理一个好用的词库。我们用了自带的中文词库,发现很不适合漫游使用,后来找了一个拼音加加的词库,一个google拼音的词库,一个搜狗拼音的词库,还有自己人肉整理了一些资料,终于弄了一个100万字的超大词库。 这个全文搜索程序很简单,核心sql 就一行 “select postid,threadid,title from search where match(title,pagetext) against(’关键词’)”。我这里采用的是双数据库方案,原来的论坛数据库不动,新安装了一个支持中文全文搜索的Mysql。在里面建立搜索专用数据库,自己写了个程序每天增量将帖子加到这个数据库上就好了。具体的实现可以参考 hightman 的网站。 http://myft.twomice.net/show_hdr.php?xname=ILBS301&xpos=4&dname= http://php.twomice.net/myft/s2.php Sun, 22 Apr 2007 15:59:02 +0000 in Linux on 飞天的梦想 http://hiei.yeax.com/archives_159.html - Original Article […]
June 1st, 2008 at 3:28 am
windows怎么办…
October 24th, 2008 at 5:09 am
Hiya, just meandered by. Love that msn, very fine site. Thanks.