摘要:我们平时说的收录,按照百度搜索资源平台给的定义,其实就是“索引”。二、如何查看百度收录量?三、如何查看某个网页是否被百度收录?如果第一个搜索结果,就是你刚发布的那个内容的URL,那么我们通常就认为,这个网页已经被百度收录了。此外,可以把网站地图路径提交到百度站长平台:
一、什么叫做收录?
问题还没回答,我就想再来个灵魂拷问:什么叫做索引?
先严谨来说:
百度收录和百度索引不是一回事
收录:页面被Baiduspider发现、分析过
索引:Baiduspider经初步分析后认为有意义,做建库处理
收录和索引的关系如下图:
百度收录和百度索引的关系
这图不是我做的,来自百度搜索资源平台(即百度站长平台)。
但是,在我们搜索营销行业的实际工作当中,
收录就是说索引,收录量就是说索引量。连百度工程师也曾“粗暴”地说过“收录和索引是一回事”。
所以,无论在本文还是SEO实际工作中,都没必要区分“收录”和“索引”
我们平时说的收录,按照百度搜索资源平台给的定义,其实就是“索引”。所以我们之后也都按照行内惯例,都称作收录了。
搜索引擎的运作机制,不是您搜索了一个关键词,立马百度全网查询下反馈给您搜索结果。而是所有的内容,通过“蜘蛛”抓取程序,先抓取好,选择优质的有价值的,放进数据库。当用户来查询的时候,从数据库中快速返回最贴切的结果。
(重点的重点:“抓取”“优质内容”,记下来,后面要考)
还记得索引的定义吗?(Baiduspider经初步分析后认为有意义,做建库处理)
请注意“索引”定义中的建库处理,意思就是,被索引以后,你的内容才会出现在搜索引擎的数据库中。
然后,才有几率被搜索到。
这就是我们SEO中,特别重视“收录”的原因。也就是说:
有收录,才有机会有良好排序(后面简称“排名”)。收录都没有,就更谈不上排名了。二、如何查看百度收录量?
如上图,在百度搜索框中输入“site:域名”,就可以查看到任何网站的大致收录量,上图205个。这个用于查看别人网站的收录。
那么自己网站的收录怎么查看呢?
当然,你也可以用上述方法查看,但是有虽然麻烦,但是更精确的办法,还是这张图,按照百度的引导,使用百度站长平台:
注册登录后使用站点管理,按照步骤添加你的网站并验证(可能需要网站开发技术人员配合):
顺便说一下,如果您的网站足够有牌面,百度会在后台给您发消息:
如上图,会有各种线下活动邀请,还有一对一指导……
如上图,算法更新了也会提醒您:别中招。贴心不贴心?
所以,快去添加自己的网站,看看自己的网站够不够牌面吧 。
跑题了,绕回来,添加网站以后,就可以看到网站的正式收录:
细心的技术流小伙伴可能看出来了。使用site查看是205。为什么站长平台查看是112? 数据为什么会有这么大的差异?
差异是有的,但是不会这么大。因为使用site的时候,我使用了全域,也就是
site:ggseo.cn
我在站长平台是分开的,添加了2个网站:
这个收录量112
这个收录量67
如果我使用
site:www.ggseo.cn
维度统一了,相对来说 147(SITE的数据)和112(站长平台的数据),就会更接近一些。
总之,您真正需要关心的数字,是百度百度站长平台的索引量数据。需要横向对比竞品网站的时候,才需要用SITE。
三、如何查看某个网页是否被百度收录?
说完查整个网站的收录数量怎么查,那么我想了解我新添加在网站上的一篇文章有没有被收录,怎么办呢?
最简单的办法就是,复制这个网页的网址,在百度搜索框里面搜索一下:
如果第一个搜索结果,就是你刚发布的那个内容的URL,那么我们通常就认为,这个网页已经被百度收录了。
四、如何提高网站的百度收录数量?
还记得之前说圈起来要考的2个“重点的重点”吗?
“抓取”和“优质内容”
所以所有的操作都应该是为了解决2个问题:
“抓取”。技术方面需要解决的,也就是让百度的蜘蛛程序,抓取到我希望收录的网页。“优质内容”这个是需要内容团队来解决的,也就是百度的蜘蛛程序抓取到您的内容以后,认为您这个内容是优质的,对用户有帮助的。
感谢同事协助我总结出了以下提高收录的操作
4.1 网站URL优化:
建议采用扁平化树形结构;
重点频道或分类等页面必须采用目录结构;
所有目录层级尽量不超三层;
重点页面URL必须采用静态或伪静态;
确保所有URL具有唯一性(相同页面不要存在多个URL);
分类页URL层级需根据产品分类结构采用父子关系;
最终页URL放置所属大类或小类下;
目录页分页URL,从第二页起采用.html结构;
URL越短越好,避免过多参数;
尽量字母全部小写,如存在大小混写,采用URL归一,归一到已有排名或收录URL地址上;
连词符使用中横线“-”,如URL中存在其他符号且已被收录,则不改变;
URL中禁止出现汉字,URL中只包含字母、数字、中横线;
确保URL中参数的唯一性。
(以上技术细节,不建议太沉迷,根据自己网站的情况酌情采纳)4.2 整站URL数据抓取及分析
对于一个已经建好的网站,可以使用网站死链检查工具,抓取全站URL,重点解决其中出现的问题链接(404页面),需要针对性的做出处理,有的是删除不存在的内链,有的是替换成正确的链接。
4.3 网站地图制作(XML版本)
类似下图,需要把首页、重要栏目页及详情页网址结合规则整理sitemap.xml文件,上传到网站根目录下;且需要定期更新。
此外,可以把网站地图路径提交到百度站长平台:
4.4 可以利用百度站长平台的主动推送功能,添加相关代码,促进页面收录:
站长需要在每个页面的HTML代码中包含以下自动推送JS代码:
4.5 可以利用百度站长平台的手动推送,定期推送重点页面,促进收录。
4.6 高权重页面链接到新页面
例如网站首页需要有内容推荐入口,类似下图:
这样可以让搜索引擎的抓取程序,顺着最容易抓取到的首页,就可以抓取到这些深层级的内页。
4.7 确保没有SEO不友好的程序问题
客户项目中,网站最常见的seo不友好包括:
(内容无法识别,为什么就不会被收录呢?因为内容不识别会造成多个网页,都只有相同的框架部分,抓取程序看起来都是重复内容,虽然能抓取到,但是没有收录价值)
4.8 酌情考虑配合适量外链
外链是个有争议的话题。虽然目前外链对关键词排名的效果已经微乎其微了。也有些SEOer说外链无用。
但是结合百度官方对外链的态度,以及我们的实际经验。针对未收录页面,能找到有质量的外链配合还是很有一定效果的。
正常情况下,如果您要改善整个网站的收录,我的第一建议是,在网站首页链接到这些没有收录的URL(参见4.7)。基本上您的首页有一定权重的话,这一个动作就够了。最差您把前面说的4.2-4.7全做了,还不收录的话,通常也不是百度没能力抓取到,而很可能是内容质量问题。
但是一种极端情况是,我没办法认证百度站长工具,也没办法修改首页,但是必须要让某个比较重要的内页被收录,那么外链就是一个有效的手段。
找到一些百度表现正常的网站,比如百度权重为1、2的网站的首页,做一个链接到你的未收录内页的文字链接。这对收录非常有帮助。外链权重越高越好。
另外,即使是高权重外链链接到您的网站首页,这也会提高您网站首页的权重,从而带动首页链接到的那些二级页面、三级页面。所有的二级页面和三级页面,再链接回首页和栏目页(通过面包屑导航等形式),又能再次促进首页的权重。从而带动整个网站的收录。这就是内链和外链相结合的玩法。
现在外链不提倡了,内链的玩法就非常讲究,这方面,我们也非常有心得,有时间之后单独开一篇。
另外,有些朋友可能又要问了,如何获得外链?以及怎样的外链是不好的?
最简便易行的,就是和您的同行或者上下游公司交换友情链接,互相获得一个首页链接。当然,如果可以,您也可以要求您的兄弟公司,或者供应商公司的网站给您放一个单向的外链。
什么论坛签名带链接,注册博客带链接,以及很多带有NOFLLOW的平台带链接,这种我们都不推荐,这就是大家说的低质量外链了。
另外,尤其不要在专门的平台,购买商业链接,这百度明确说过算作弊。
4.9 网站内容质量:
前面的4.1-4.8其实都在说怎么让百度抓取到。其实都已经是技术的细枝末节了。需要SEO技术人员和网站开发人员协同完成。
但是太关注这些,不见得一定有好的结果,因为就像我们最开头提到的。最根本的还是内容质量。
关于什么叫做优质内容如何查询在b2b平台发布的信息是否被百度收录?,不建议看各种SEO心得。请依照以下规范进行:
没错,节选自百度官方。
补充2点:
原创度问题:复制来的内容,尤其是复制已经被百度收录的内容,质量极低,是导致收录差的主要因素。
除了保证内容质量外,建议保持持续定量的内容更新,这样才能保证网站健康度不断提升,从而提升整体收录。
所以,
想要提升百度的收录数量,就需要内外兼修:在内容质量优质的基础上,保证网站内部链接通畅,再利用站长平台的提交渠道,最后酌情配合适量外链,就能让你的网站有个持续的收录增长了。
5.花钱的方式有哪些?
题主问到:“不花钱的方式有哪些?花钱的方式有哪些”
你GET到了吗?
您的点赞是我持续分享最大的动力,看过以后如果觉得“有得”,
双击屏幕点个赞呗 ╰( ̄▽ ̄)╮
追加一个个人网站收录问题分析的实操案例,帮另外一个知友分析的思路如何查询在b2b平台发布的信息是否被百度收录?,感兴趣可以参考: