获取和更新thumbshots网站缩略图的方法

来源:秀萌网 时间:2012-09-14

老手站长对thumbshots.org这个站肯定不陌生,它为无数seo查询工具网站提供了缩略图,最知名的chinaz也是用的thumbshots提供的接口生成的缩略图。当你使用站长工具来查询网站seo情况,就会发现右侧的小缩略图,这就是thumbshots提供的缩略图服务。可以说,thumbshots是一个很权威的网站缩略图服务。

 

如果在建站初期,这个缩略图对站长的意义也更大一些。通过thumbshots,可以看到你网站的原始面貌。thumbshots在站长圈中,相当于一个网站的门面一张脸。缩略图很漂亮,受站长关注到的可能性会越大,随之而来的可能会是站长交易,友情链接等等。针对thumbshots缩略图,大部分站长关心的只是两个问题:新站缩略图如何快速被收录问题,以及老站缩略图如何更新。本文主要介绍这两个技巧。

新站缩略图被thumbshots收录的方法

thumbshots收录新站,是通过蜘蛛机器人爬取网站内容,执行脚本之后形成的页面截图。也就是说,thumbshots一定会派来机器人访问网站。只要被机器人访问到,并且网站正常,就可以获取缩略图了,而且这是一个时间很短的过程。派使机器人来访的过程,实际上和seo中所谓的引蜘蛛是同一个过程。关于更详细的索引——抓取过程,这里有一篇英文文献介绍了thumbshots的整套工作原理:。基于这篇文献,笔者将简述被thumbshots索引的技巧。本文将这一索引——抓取的过程分为“被动方式”和“主动方式”。 被动方式是thumbshots机器人爬取外链的一个过程。当一个新站积累够一定数量的外链之后,thumbshots机器人就会注意到这个新站的存在,爬取新站。但是这个外链的积累过程与seo是不一样的:站长在做seo的时候通常会将自己的网站链接放在高权重的网站,而这样的网站一定是老网站了;thumbshots更喜欢爬取新站,因为新站才有它数据库里没有的缩略图。所以如果想针对thumbshots爬取缩略图做外链累积,就要不断在一些新站,尤其是新站的首页上投放链接。 另一种所谓“主动方式”,是通过一些手段引机器人蜘蛛。这里,我们要在thumbshots.org网站上面做一些文章。thumbshots.org本身应该是一个非盈利性质的网站,但是我们看到thumbshots.org已经永久迁移到了thumbshots.com,通过thumbshots.com里面一些信息了解到,thumbshots可供收取每月定额费用来更新每个url的缩略图。这对于我们站长来说显然是不划算的。下面笔者将介绍一种不花钱但是可以被thumbshots收录的方法。

 

以秀萌网为例,我们首先应该注册一个帐号,帐号的username就填写“SHOWMENG.COM”,First name和Last name全部填写"www.showmeng.com",这样在注册后,thumbshots可以为你生成一个专属的页面,里面就包含了"SHOWMENG.COM"和"www.showmeng.com"这样两个字段。也就是说,我们在thumbshots内部制造了两个我们专属的文字外链。

 

注册完毕之后就可以等待thumbshots收录,抓取缩略图了。一个新站使用这种手法来做,平均抓取的时间是24小时。

老站缩略图被thumbshots更新的方法

新站被索引生成缩略图是一件相对比较容易的事情,下面我们详细的讲一讲老站如何被thumbshots更新缩略图。相比,这并不是一件很简单的事。根据上文中所提到的英文文献,笔者推荐的一种手法是这样的: 首先,你要了解thumbshots的API:“***.com”,这里参数“url”所对应的属性网址,就是目标网站缩略图的URL了。同样,想查看你网站的缩略图也可以通过这个网址。这张缩略图片通常情况下一旦生成,就不再更新了。也就是说当你网站首页改版,缩略图还是依然保持旧版。如何更新缩略图,我们要从这个API入手。 其次,访问一个并不存在的页面,即可以跳转到网站404的页面,加入这个API中执行,如:“;。blog这个目录并不存在,这时thumbshots数据库里没有这个字段的数据描述,就会重新生成一个首页的缩略图,这时其实缩略图并没有改变; 最后,也是最核心的一步。thumbshots已经注意到了同一个网站有两个不同的缩略图。我们要做的就是要把新抓取的缩略图替代原有缩略图进行更新,我们可以这样做:先将网站301永久定向,可以将www域名定向至不带www的主域名,去生成一个www域名的缩略图,然后再将不带www的主域名定向至带有www的域名,然后生成一个不带www的主域名的缩略图,经过这样一个过程下来,我们得到了两个不同的缩略图,而实际上这两个缩略图对应了同一个页面。这在thumbshots,加上404页面的缩略图,实际上是产生了两个错误。而这两个错误需要人工解决,即thumbshots会人工判断错误的来源和原因,然后删除原有缩略图,最后重新生成一个缩略图。而这最后的一个过程,实际上是由thumbshots来完成的,当然它生成的缩略图也就是最新的缩略图了。

*本文章A5首发,秀萌网原创,转载请注明出处。

相关文章

标签:

A5创业网 版权所有

返回顶部