General


为了测试百度蜘蛛的勤劳程度,昨天做了一个测试。新申请一个域名,将网站设置好后,到一个百度爬的比较快的网站加了一条链接。
链接是在傍晚18:11加上的,18:20,百度蜘蛛来了,而且一爬就是源源不断的,大概以5秒一次的频率在抓取网页。今天早上到百度搜索,发现网站首页已经被收录了。百度蜘蛛2.0估计有了突破性的性能提升,能够以更快的速度抓取网站,百度的搜索技术估计在容量上也大大提升了。按以前的做法,百度基本都要1个星期才能收录新站的,而且只是抓取首页。

http://www.baidu.com/search/spider.htm

百度网页搜索spider的User-Agent字段内容近期将更新,请网站管理员关注,谢谢!
更换时间:
2011年5月10日

更换内容:
baiduspider在爬取网页时,发送请求的User-Agent字段内容将更新。
目前的字段内容是
Baiduspider+(+http://www.baidu.com/search/spider.htm)
更换后的字段内容是
Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

更换后您需要做什么:
如果您已在robots文件中封禁了百度网页搜索的User-Agent,本次更新不会产生任何影响,也无需修改robots文件。
如果您此前主动在服务器端封禁了百度网页搜索的User-Agent,那么建议修改服务器端要封禁的User-Agent字段,或者更换为robots封禁。
如果还有其他问题,请通过投诉中心联系百度 http://tousu.baidu.com/

有时候,linux 由于硬盘或者其它原因,某个进程挂住了,怎么也杀不死,输入 reboot 命令也无法重启。这时候,一般只能按机箱上的reset健来重启了。 如果是远程ssh,那怎么办呢? 下面两行命令可以搞定:
echo 1 > /proc/sys/kernel/sysrq
echo b > /proc/sysrq-trigger

昨天注册了一个goddady 促销的一刀域名,每个信用卡仅限一个,今天拿来做了测试站。

如果碰到一个小硬盘空间的vps,然后你有不少的文本文件,可以用fusecompress 来节省空间

fusecompress -o fc_c:lzo,allow_other /home/zipdir /mnt/zip

已经留级一天了,本周再不出来就会被关到小房间的啊

现在换到了linode,不受和谐的困扰

Question:
Nat + Squid Server Error:
ip_conntrack: table full, dropping packet.
Solution:

把这个文档里的参数:/proc/sys/net/ipv4/netfilter/ip_conntrack_tcp_timeout_established
调小一些,默认是5天,太长了,减少到一个小时,假如网上有病毒,一会conntrack table就满了

但是,2.6内核才有./ netfilter/ip_conntrack_tcp_timeout_established这个文档(uname ?r查看内核版本)2.4及以下kernel里应该没有这个文档,需要重新编译kernel到2.6以上才会有这个文档。

nc 和socat
这两篇文章挺有用的。
通过ssh隧道进行udp转发
socat帮助手册

从Debian 3.1 到 5.0 ,远程ssh 升级,祈祷成功!
不想跑机房去…

update:
升级果然还是出问题了,但是幸好不用跑机房去。升级过程还是比较简单的.
1. 更改 /etc/apt/sources.list 的sarge 为 etch
2. apt-get update ; apt-get dist-upgrade. 完成后再进行一次 apt-get dist-upgrade。
3. 更改 /etc/apt/sources.list 的 etch 为 lenny
4. 重复 2
5. 发现内核没了. 于是 apt-get install linux-image-2.6 。

服务器硬件唯一特别的就是插了一块scsi卡,系统安装在 scsi硬盘上, 另外还有一个ide硬盘做数据备份。
原来的内核是2.6.8, grub的启动分区是 hd1,0 。 安装手册有提到新系统有可能设备编号会改变,我多了个心眼,在 /boot/grub/menu.lst 里面增加了一个启动选项,指向 hd0,0。
重启.. 等了5分钟后,还是没起来。找托管商,结果发现网管不知机房里。2小时后网管终于到机房里,让他接上显示器,选择最后一个启动选项,终于起来了… 赶紧修改 menu.lst,将hd1,0 都改成 hd0,0,重启一次,这次顺利启动了..

然后就是一些收尾工作,php-mysql 没了,安装。proftpd的配置文件有些改动,再改改。
这两天服务器都很正常,升级还算比较顺利。

终于结束了。
公司其实昨天就开始上班了,不过我还是多请了一天假,今天才上班。
一大早的跑到上海人才服务中心拿了居住证的通知副联,交给HR去搞社保了。
这次办下来的是3年,比上次好一些,起码可以有2年多不用去办这个玩意,太麻烦了!
据说2月底要出居住证转户口的政策,等着瞧好了。

买了显卡装上,电脑终于好了。可是无线路由器怎么也不能拨号,折腾了半天,只好不用路由器,直接电脑拨号。虽然能上网,可是很不爽,因为n800不能用无线上网,只能用慢的可怜的gprs 折腾。刚刚又测试了一下路由器,终于发现是wan口坏了,郁闷啊!!难道我又要花100多去买个无线路由器?D-link DI-624+A 是垃圾东西。

请了7天假期,从今天开始放假啦,明天就可以回去广州了,哈哈

我讨厌on2 vp6这种格式,大家都到h.264的温暖怀抱里面吧。一最大的几家视频网站,包括国外的youtube和国内的土豆、优酷都是用的mencoder做后端。

因为每个apache进程如果有执行php并且进行sql查询,它就会打开一个mysql连接,并且使用完毕后不会关闭!我看mysql里面有大量的空闲连接。如果apache进程很多,那就很容易将mysql 的连接用满了。根据别人的经验,php的mysql_pconnect 函数并不会增加性能,为了你的服务器安全,请别使用mysql_pconnect函数。

下一页 »