搜索引擎日记EP2

刚才我们通过两个步骤简单地解决了网页标题和关键字与网页内容不相关的问题,但还远远不够。我们之后还会提到更进阶的一个解决方法。

这时我们眼前冒出一个新的问题:就是网页他们故意在页面的内容堆积关键词,那我们这边用个简单的语言算法就可以了。

负面case1:生活生活专区如何学会生活,xxx教你如何学会生活,这是一个生活视频,生活生活生活…

负面case2:xxSEO,让你快速学会搜索引擎优化,SEO课堂值得拥有。

上面是两个负面的案例,第一案例就显得特别明显,我们研制一个语言学的算法来检测这个句子是否通顺,是否符合汉语语法。第二个案例,如果是在简介或者是是开头,就有点小小的打擦边球了,搜索引擎在爬行的时候也可以去分析一下某个词在某一句话当中大概是出现几次。

接下来的问题就是我们要适应用户习惯,有一个a站总是用户点进去就马上退出来,而b站呢用户总是会待很久。那么此时你会选择加谁的权重?

这个只要有脑袋就行,大家都会异口同声的说加b站权重,反而我们要分析下A站的一些页面的质量,考虑一下要不要降低权重?

搜索引擎总是会想办法去获取用户待的时间,那么这个交给工程师。我们主要是要对用户的一个待的时间、点击这个链接的次数、浏览页面的数量等参数去弄一个权重出来。

这个也就是谷歌百度搜狗权重的一个目的,就是为了页面高质量的能够被收录,低质量的可以受到惩罚。

搜索引擎日记 2020-07-20 16:39:29 通过 网页 浏览(129)

共有0条评论!

旧站评论功能已停止维护,现仍可查看评论列表

本网站已停止在本程序的更新,正在迁站。前往新版枫风博客