site语句通常是站长们用来查询网站收录的情况的,如查询尹华峰博客(site:www.yinhuafeng.cn)即可一览网站的收录量了。
细心地站长可能会发现,site语句查询的收录量和站长平台的索引量是有差别的。尽管百度已经明确的提出了site语法查询的数字是估算值,如需了解更准确的索引量,请使用百度站长平台或百度统计,但是在我们查询其他网站收录数据的时候却依然只能凭借site命令来查询数据以供我们参考。
而对于site命令的查询结果很多人仍旧持有不同的侧重点,有的把site查询数据作为一个标准,有的则对site数据看的很淡,不管怎么样我们都应该正确的认识到site命令查询结果的作用以及参考性,下面整理的一些有关site命令的内容都是来自百度站长俱乐部百度搜索官方给出的回答,当然我们也不能把这个当成标准,仅供参考!
一、site语法设定的初衷是为了实现精准搜索
大多数站长,会使用不带关键词的site语法来进行收录量观察。这是一种方法,但很不准确。site语法设定的初衷,其实是期望用户可以设定约束搜索范围,实现更加精准的搜索。这同intitle,inurl,本质上是相同的。而在这些高级语法 下的结果数,和常规搜索一样,都是“估值”,而非精确值。因此,很有可能site下的“结果数”减少了,实际被索引数却可能增加了。
更加精确的方法是什么呢?
1,对来自搜索引擎的流量进行监控。这是最直接和本质的。如果流量没有大的波动,而site下的数值发生巨大波动,这只能说明site搜索结果数的不精确性。
2,对站内url进行抽样监控。有些url已经被搜索引擎收录了,那么取出一个集合,作为收录状态监控集;每天的新url尚未被收录,也可以对其进行索引状态的监控。脚本是很容易写的,这种基于抽样的评估也是很有效的。
3,由搜索引擎提供的统计工具。我们是否应该提供类似统计工具,目前还在评估中。
二、索引结果数不是一个网站在搜索引擎中的站点评级指标
已经强调过很多次了,百度site语法的结果数不准。而且这种不准的幅度甚至不是稳定的,可能今天比较接近真实值,明天就发生大波动了。其中的原因不便多解释,但是请不必再就这个问题反复提问了。
有一点可以肯定,索引结果数肯定不会是一个网站在搜索引擎中的站点评级指标。这是很容易理解的。举个例子,,就几百条而已。从投票权角度,它的权重会低于大部分索引了成千上万网页的站点?所以站长若要搞搞友情链接,更重要的是用自己的经验去做价值分析——他是想捞一票就走的,还是想正经在互联网上立立腕儿的。
如果出现搜索的结果要比 “ 关键词的结果少,“正是体现了百度site搜索时计算结果数的不准确,完全是反常识的。”
“site本意起到限定作用,那么的意思,即是的限定集内,abc搜索结果按权值高低的正常排序”。”
三、搜索结果中URL后面的时间戳不必太过关注
前面曾经说过,我们内部也对结果页上的时间戳(在url后面)很纠结,有计划整改。实际上有的搜索引擎早已经把这个时间戳去掉了,而代之以网页更新的实际时间。
这个时间戳既然给内部人员也带来了困扰,那么对站长和用户,显见也是有困扰的。所以,我的建议是不必太过关注这个时间戳。如果期望看到精确的spider行为,最直接的手段是分析网站日志。
四、site语法查询的检索结果只能说明网页被收录
相信大家在用site语法查询结果数时,也看到了搜索结果最上方的“找到的相关网页数是估算值,不代表真实结果数,仅供参考的提示”的提示,我们的搜索结果 数估算算法是针对正常用户的关键词检索而设计,没有针对site语法检索做过优化,它得出的搜索结果数只能做为一个参考,建议关注网站从百度获得的流量有 没有变动更直接。
site语法查询的检索结果,更多情况下类似随机的排序,除了说明这些网页已经被收录以外,不能说明任何问题。
五、site查询只有首页的原因
网站用site: 查询,只有首页收录,请问是什么机制造成的?
1,新站点,具体内容还没来得及抓取和索引。
2,老站点,因为种种原因被严厉惩罚了,站长圈俗称“拔毛”。
后者的严厉惩罚机制,我们期望逐渐演化为更合理的甄别和处理。实际上现在的状况,比之四、五年前,已经人性化多了。
虽然百度目前有多个途径可以查询到网站索引数量,不过在关注这些数量的同时要知道网站在搜索引擎中的效果还是尽量以从搜索引擎来的流量为主要参考,毕竟我们做搜索引擎优化不只是为了在收录数量上有所增加,而是更多的从搜索引擎中获取流量,毕竟收录数量的增加也就意味着提高了获得流量的机会,但也不能盲目。