摘要:下面我们仅进行一下前奏、讲一下百度收录的一些原理、以及包含的机会、希望大家能明白搜索引擎到底是怎么样搞收录的。下面仅以我的角度、来给大家讲讲搜索引擎抓取、并建立收录原理、并且反思一下我们应该如何来做!以上三步基本可以帮大家搞清楚百度是如何建立收录(索引),那么我们来一波反推、讲讲收录的机遇!
百度今年真心不太好过、先是自己营收上亏损不说;后面百度老将(S老师)被带走百度搜索引擎收录标准,估计业务又要亏一大笔;再后面听说收了YY、好像又亏了100+亿(以上整理于网络)
不知是百度不好做、影响了李大大的心情、现在对于SEO来讲、收录同样是不好做。从最初的熊掌号、到百度快速收录、再到之后的MIP、再到现在的啥也没有、一切都如丝般顺滑、让广大的SEO收录无门!
下面我们仅进行一下前奏、讲一下百度收录的一些原理、以及包含的机会、希望大家能明白搜索引擎到底是怎么样搞收录的。
上图为百度蜘蛛抓取页面、并建立索引的示意图。从图中大家也能看明白、其实建立索引(收录)的前提是抓取。下面仅以我的角度、来给大家讲讲搜索引擎抓取、并建立收录原理、并且反思一下我们应该如何来做!
1、抓取URL
就现在的搜索引擎而言、本身就具备自己的收录数据库。根据现在已经有的收录的库、去抓取新的页面;或是通过百度站长工具平台提交上来的数据,而发现新的页面。
为什么现在不好做收录、与提交接口有直接在关系(现在提交接口基本无效、不来蜘蛛、更不收录);像之前的熊掌、快速收录权限接口、提交之后基本隔天收录;现在不是酒香不怕巷子深的时代了。
2、解析文档
当百度的蜘蛛队列抓取了足够的URL之后、百度就开始抓取这堆URL、并且解析文档、判断页面主题以及页面质量。然后通过【去重算法】以及一些算法、去掉一些低质量的页面。
3、建立索引
当搜索引擎读解析文档之后、选择出一些高质量的页面、然后把高质量的页面通过一些算法、分类、倒排索引、再加入百度数据库、基本是完成了索引。
以上三步基本可以帮大家搞清楚百度是如何建立收录(索引),那么我们来一波反推、讲讲收录的机遇!
从抓取的角度
通过【1】中叙述、搜索引擎发现新URL的方式有两种:1、通过已有的信任URL发现新的URL;2、通过百度提交接口来发现URL。
针对于第1种方式、如果我们做收录的话、完全可以发发外链、据逆冬徒弟实战验证、外链确实可以提高收录。
其实还有另一种方式、那就是蜘蛛池;其实很多人不太明白蜘蛛池的原理、蜘蛛池的原理其实就是向大量页面中插入我们想要的URL百度搜索引擎收录标准,各位可自行查看~
针对第2种方式、百度提交现在基本没啥用、逆冬本人亲测了10个网站、无论域名备案没备案,现在1个月、均未涨索引。
总结一句话:不以提高URL在蜘蛛面前展现机会的收录方式、都是在耍流氓!
从解析文档角度
从解析文档的角度、百度需要高质量的页面、而非垃圾页面。之前也讲过,高质量的页面主要与本身网页的模板以及内容质量两方面有关系,大家从这两方面提高即可!
SEO并不会死、只会淘汰一批低质量的SEOer,留下少部分精品SEOer。难做不代表有问题、往往挑战与机遇并存。物竞天择、适者生存、希望我们只做幸存者!