花了周末整整两天时间和P牛一起合作,终于将漫游的论坛改为全文搜索了,个中辛苦不足为外人道也。

呵呵,其实开玩笑的。一切进行的都很顺利,最大的问题就是需要整理一个好用的词库。我们用了自带的中文词库,发现很不适合漫游使用,后来找了一个拼音加加的词库,一个google拼音的词库,一个搜狗拼音的词库,还有自己人肉整理了一些资料,终于弄了一个100万字的超大词库。

这个全文搜索程序很简单,核心sql 就一行 “select postid,threadid,title from search where match(title,pagetext) against(’关键词’)”。我这里采用的是双数据库方案,原来的论坛数据库不动,新安装了一个支持中文全文搜索的Mysql。在里面建立搜索专用数据库,自己写了个程序每天增量将帖子加到这个数据库上就好了。具体的实现可以参考 hightman 的网站。

http://myft.twomice.net/show_hdr.php?xname=ILBS301&xpos=4&dname=

http://php.twomice.net/myft/s2.php