百度站长俱乐部答问录

来源:SEMWatch 时间:2010-04-15

此前,由于缺少有效的沟通渠道,使得网站站长或从事搜索引擎营销的人士很难获取到直接来自百度的信息。自 4 月 7 日百度创建站长俱乐部以来,这种局面有所改善,业内几位高人已经受邀加入俱乐部,并代表站长们提出了一些针对百度在收录、链接、权重、算法等方面的问题,这些问题大都由 Zac 与柳焕斌提出或代问,百度官方用 Lee 和 kkksuper 的 ID 陆续做了回答。由于目前百度站长俱乐部采取的是邀请机制,所以无法产生大规模互动交流,SEM Watch 将其中部分摘录汇集,希望能够引起各位朋友的关注与讨论。想了解更多的内容及信息请移步至这里,同时,如果有需要向百度打探情报的朋友也请留言,因为 Zac 大侠也是常驻 SEM Watch 的。

关于网站

问:使用虚拟主机的网站会不会因为同一个 IP 或同一台服务器上有其他网站作弊被处罚而受连累,也被惩罚?

答:连坐,血统论等,是在极权社会里才出现的反人类政策。一个成熟的搜索引擎,这么蛮干的可能性很小。

问:将一个旧的 URL 进行 301 重定向处理,百度反应很慢?而且旧的 URL 会在相当一段时间内还存在于百度搜索结果中,但是网页标题是新的,缺少描述。

答:对于内容迁移,我们推荐的做法就是将旧 URL 301 永久重定向到内容对应的新 URL,这样我们会把旧 URL 积累的权值转移到新 URL 上。

为了避免种种不稳定的因素,目前我们的处理策略比较保守,新、旧 URL 会同时并存相当长的时间。最近我们意识到这样处理其实并不妥当,正在调研更迅速的处理方式,相信很快就可以完美的处理好这个问题。

问:百度对使用海外空间的中文网站有歧视吗?百度是否会抓取域名注册人的相关 whois 信息?

答:1、百度对海外站点没有歧视。但百度从国内爬出去的蜘蛛,会严格遵守国家的政策和法令,所以国内普通用户访问受限的内容,百度蜘蛛一样会搞不定。

2、任何对站点价值分析有贡献的要素,都有可能被搜索引擎使用。并且这些要素的使用方式,也不是一成不变的。至于具体有哪些要素已经被使用以及如何使用,这个无法详述。

问:百度如何看待伪原创?

答:“伪原创”就是“非原创”。对非原创的策略,同样适用于伪原创。归根结底,这是一个技术实现程度问题,而不是策略思路问题。

ZAC:好多人认为他们做的所谓“伪原创”挺好,应该能骗过搜索引擎,这大概低估了搜索引擎算法。还是得回到根本,内容为王。说起来容易,做起来难,很少人会认真去做。

问:百度如何对待过期域名?谷歌对过期的域名很长一段时间还有收录, 而百度却很快就会将其清空。

答:过期域名也是域名,所以,适用于新域名的策略,也一样适用于过期域名。只是过期域名在历史上累积的与现有网站无关的权重,会被剥离掉,这也是很容易理解的。

关于收录

问:大概在 4 月 1 日前后,很多站长用 site 查看自己在百度的收录数量,发现狂降,现在好像又恢复了,那是怎么回事?

答:我们也注意到了这种说法,其实收录方面没什么变动,只是我们在上线新策略的过程中短暂影响了结果数估算算法,大家只要关注一下流量即可知道,那段时间从百度获得的流量并没有变化,如果收录数真的发生了大的变动,肯定会影响流量。

另外,相信大家在用 site 语法查询结果数时,也看到了搜索结果最上方的“找到的相关网页数是估算值,不代表真实结果数,仅供参考的提示”的提示,我们的搜索结果数估算算法是针对正常用户的关键词检索而设计,没有针对site语法检索做过优化,它得出的搜索结果数只能做为一个参考,建议关注网站从百度获得的流量有没有变动更直接。

问:网站用 site: 查询,只有首页收录,请问是什么机制造成的?

答:两种情况:

1、新站点,具体内容还没来得及抓取和索引。

2、老站点,因为种种原因被严厉惩罚了,站长圈俗称“拔毛”。

后者的严厉惩罚机制,我们期望逐渐演化为更合理的甄别和处理。实际上现在的状况,比之四、五年前,已经人性化多了。呵呵。

问:一般来说,网站所有者不是太希望 https 的网页被收录。如果收录了,如果处理?把 https 的网页 URL 更换成 http 形式的?还有一种情况,就是 ip 地址形式的URL被收录。

答:如果不希望被收录,常规的做法是设置 robots 文件。

https 主要的出发点是安全,并没有太多考虑搜索引擎。从用户角度,很多采用了 https 的站点(尤其是首页),也是需要被搜索到的,比如支付宝,贝宝等。通常情况下,搜索引擎对这类网页并不做内容解析,而只是将 URL 进行索引。

IP 地址的 URL 被收录,除了 spider 在机制上的不完善之外,通常站点设计上也有一些缺陷。一般情况下,这类问题是可以被规避的。

问:百度数据更新的周期大概是多长?

答:如果是一个变化频繁的入口索引页面,相信这个变化周期会很短;而是相对稳固的内容型页面,周期则会相对较长。站长们观察一下蜘蛛的爬取日志,发现的规律会比这边的说明更有价值。

此外,搜索结果页上的那个时间,一直很让人confusing,我们正在考虑修改。

关于权重

问:百度是否跟踪 JS 链接并传递权重?因为有的时候某些页面得到太多权重没什么意义,比如用户登录、注册页面之类的。是否可以用简单的 JS 阻挡链接传递权重?

答:javascript 的解析,是很多搜索引擎正在做的事情;同理,对 flash 的解析。毕竟有那么多应用 javascript 或者 flash 的网站,其实并没有意识到,他们的做法给搜索引擎的收录和索引带来的麻烦。所以,如果期望不被搜索引擎收录的话,最直接的手段,还是写 robots 文件。

问:百度目前支持链接的 nofollow 属性吗?

答:百度现在支持 nofollow 标签。带 nofollow 标签的链接,我们会忽略掉它绝大部分的作用。

nofollow主要用在用户留言等不受站长控制的地方,这些地方的投票不是站长的意志,告诉搜索引擎不要给他投票是合适的。

问:百度对子域名如 news.domain.com 和主域名 www.domain.com 权重怎么处理?是当作两个不同的网站还是子域名会继承主域名的权重?

答:怎样处理是合乎逻辑的,策略上就会采用那个合乎常理的处理手段。或者这样讲,如果你是负责这个权重处理的,你觉得怎样做是最合理的?那么很可能百度就是如你所想的。呵呵。

搜索引擎理解起来并不复杂,站在用户角度考量,很容易揣摩搜索引擎的策略思路。

关于链接

问:当前做SEO的同学们,都在疯狂的购买链接。表现最为突出的即是各大 SF 类网站,他们全是通过购买大量的友情链接来 强J搜索引擎而上来的。(像传世 SF,前几名的站每个月的链接费用就至少超过五万。)

那么,对于这种明显的,通过大量购买链接来作 SEO,强行登顶的作法今后是否会受到百度的惩罚?

因为就目前来看,百度对购买链接还没有一点惩罚的迹象,一般的词,网站收录后,只要稍加更新然后狂买两个月链接,绝对进前三名。

而谷歌老早就说明确了。通过购买链接来增加 PR 会受到惩罚,百度在这方面的算法是否也应该更新一下了?

答:这种手段奏效,说明百度在识别和处理超链作弊方面,仍存在很多问题。这类问题理应得到妥善的解决,以使互联网环境得到净化。我们回头会和相关的同事就此问题了解一下。

ZAC:提问的网友和其他人相信都感谢 Lee 的回答,也希望百度能在这方面改进,打击垃圾链接和网站。

下面是提问网友的回复:

这种狂买链接顶排名的做法已经有一年多了,到现在为止“做百度就是要靠买链接”已经在站长圈子里成为众人皆知道的事情,而且各大站长类网站还都开设了链接买卖的版块,以 A5 为例每天站长买卖链接的费用就有好几万,现在可以直接的说对于百度指数在一万左右的词,多买一些链接,排名在 20 天左右绝对可进前三名。希望百度的相关技术组对这一问题好好处理一下。

问:最近黑进 gov 或学校网站加上自己网站链接盛行。百度内部评估对这种黑链的鉴别准确性有多高?如果搜索引擎不能鉴别,普通企业和站长面对黑链很难竞争。

答:这个问题早已留意到,并一直在应对策略的完善中。

大批毫无道德和法律底线的人,使得中国互联网的生态环境变得非常恶劣。但按我们的理解,除了搜索引擎强化技术应对方案之外,中国法治的完善,才是对这类违法犯罪行为进行遏制的根本手段。目前互联网相关的立法,远落后于互联网的发展。

问:目前刷百度相关搜索和搜索下拉框的方法很多,怎样才能限制或者根除这种现象。有没有像投诉平台这样的地方,可以让大家投诉,给大家一个更好的相关搜索?

答:这个问题的确很恼人。目前我们正在全力处理中,可预期将有大幅改观。

投诉可以发送到 webmaster@baidu.com,肯定可以送达相关工程师,但不会有具体的回复。此外,处理多半是策略级的升级,个案的针对性处理会比较少。

关于算法

问:百度是否有会估算某网页的某个反向链接被点击次数(例如:从工具条、流量统计等工具得到的部分数据)?比如是否把链接的点击率计入算法之中?是否会利用这点来判断哪些是隐藏链接?或者判断外链的相关性等因素。

答:我只能说,一切有利于排序改进的因素,都有可能被搜索引擎尝试应用。

任何能改善排序效果的要素,搜索引擎都可能会尝试应用,不管是toolbar,analytics,rss订阅等等。

问:目前谷歌已经把网页加载速度纳入页面排名影响因素,百度是否也考虑此因素决定网站搜索排名?

答:这是很容易想到的一个网站价值评价要素。但如何有效应用,并不是一件很容易的事情,需要非常谨慎。中国尤其复杂,不同网段差异甚大。但显著影响到用户体验的广泛要素,最终都会被搜索引擎谨慎的尝试和使用吧。

问:Google 有 PR 指数,搜狗有指数,百度有什么?或许百度已经有对网页进行质量评分了,暂时没有对外开放?以后会有这样的网页评级指数么?

答:多公布一个评级指数,只是为站长们多带来一分烦恼。事实上,很少有成熟的搜索引擎会发布用于最终质量评级的指数。按照 Google 的官方说法,PR 也只是诸多排序因子中的一个而已。

问:百度如何对站外作弊的手法判断是不是竞争对手所做,比如买黑链,建群站,群发垃圾垃圾等,这些竞争对手都能帮你做。可否透露下百度对这个判断的原理,站长如何防范,发现被人陷害的话,如何举报或采取其他措施?

答:如果想维护一个策略的生命周期的话,最好的方式是保守策略细节的秘密。但有一点可以确定,一个成熟的搜索引擎,不会轻易的通过一两个要素来判断一个网站的生死。

在回答问题的同时,百度俱乐部的发言人也透露了百度近期会发布一个搜索引擎优化指南,里面有百度推荐的网站建设方法,以及一些会危害到权重的做法。(整理:SEMWatch)

相关文章

标签:

A5创业网 版权所有

返回顶部