相信各位用过 WordPress 或者 Typecho 之类的 CMS 的话,都在网站后台的设置里见过这个玩意
没错,这就是站点更新服务,那么,这是个神马东东?他的作用又是什么呢?
众所周知,我们在搜索引擎里输入每一个关键词,搜索引擎就会从他庞大的数据库中搜寻其关键词的条目,那么,那庞大数据库里的数据,是从哪来的呢,这就是和站点更新服务息息相关的,网络爬虫。
网络爬虫有好坏之分,好的爬虫来源于个人开发者的开发爱好、测试,以及各大搜索引擎,可以使你的网站和文章被收录以及获得一定的搜索排名;但坏的爬虫往往是来自恶意目的,例如疯狂爬取某些数据导致你的网站服务器处理器负载和带宽超负荷导致无法正常访问。
但你有没有想过,爬虫最初是怎么发现你的网站的,爬虫又是怎么知道你的网站更新了的?
这就是,站点更新服务,他的作用所在了。
在各大 CMS 中(例如 WordPress 或者 Typecho),都有内置一些站点更新服务的地址,通知到这个地址你的网站成立了,或者更新了,这个内置的站点更新服务就会帮你通知到各大搜索引擎的站点更新服务,从而让各大搜索引擎知道你的网站的存在或者更新了,这样使得各大搜索引擎的爬虫来光顾你的网站爬取内容,你的网站也就进入到了搜索引擎的数据库里。
那你可能会问,这样不就 ok 了吗,为什么可以自定义,还有那么多站点更新服务的地址?
这就是自带(内置)的站点更新服务的不足之处了,自带的站点更新服务在收到你的网站服务器的通知之后,每一天会集中将全世界使用他这个站点更新服务的网站统一转发给各大搜索引擎,这样就使得,搜索引擎收到你的网站更新了的“消息”可能是在一天之后,而不是你的网站一更新就收到,对于那些抓时事来更新网站的站长来说非常不利于搜索结果排名;并且自带的站点更新服务那么大批量的将全世界使用他这个站点更新服务的网站统一转发给各大搜索引擎,数量如此之大,搜索引擎难免会知道他也是个用来转发或者内置的站点更新服务,目标搜索引擎难免会挑三拣四或者随机丢弃一些网站的更新通知;因此这就是自定义站点更新服务存在的用处了,在你的网站更新之后,你的网站服务器会即刻单独通知搜索引擎,向搜索引擎说:“我更新了”,而不用通过其他的站点更新服务来转发,这样搜索引擎的爬虫会立马来爬取你的网站的更新,以获得最快的收录。
你可能会说,那我把全世界所有搜索引擎的站点更新服务直接填进来,不就美滋滋的等着搜索结果排名?。。然而并不是,照你这么设置,当你的网站更新并且通知的那一刹那,全世界所有的搜索引擎的爬虫全部光临你的网站,你的网站服务器会不堪重负,导致网站无法访问或者服务器直接宕机。
所以我的网站就使用了三大站点更新服务,分别是。。内置的、Google的、Yahoo的。
特别提醒!网站服务器在中国,大陆的站长,不要使用Google的站点更新服务,无法连接的,懂我意思吧。。
以下汇总各大搜索引擎或者转发的站点更新服务地址
http://rpc.pingomatic.com/
http://ping.baidu.com/ping/RPC2
http://blogsearch.google.com/ping/RPC2
http://api.my.yahoo.com/RPC2
http://api.my.yahoo.com/rss/ping
http://www.snipsnap.org/RPC2
http://xping.pubsub.com/ping
http://www.blogsdominicanos.com/ping/
http://www.feedsky.com/api/RPC2
http://blog.iask.com/RPC2
http://blog.youdao.com/ping/RPC2
http://rpc.twingly.com
http://api.feedster.com/ping
http://api.moreover.com/RPC2
http://api.moreover.com/ping
http://www.blogdigger.com/RPC2
http://www.blogshares.com/rpc.php
http://www.blogsnow.com/ping
http://www.blogstreet.com/xrbin/xmlrpc.cgi
http://bulkfeeds.net/rpc
http://www.newsisfree.com/xmlrpctest.php
http://ping.blo.gs/
http://ping.feedburner.com
http://ping.syndic8.com/xmlrpc.php
http://ping.weblogalot.com/rpc.php
http://rpc.blogrolling.com/pinger/
http://rpc.technorati.com/rpc/ping
http://rpc.weblogs.com/RPC2
http://www.feedsubmitter.com
http://blo.gs/ping.php
http://www.pingerati.net
http://www.pingmyblog.com
http://geourl.org/ping
http://ipings.com
http://www.weblogalot.com/ping