搜索引擎日记EP4

那么我们这搜索引擎经历了那么多,我们应该开发一个竞价排名系统以维持我们服务器以及其他的费用,另外我们仍然不要忘记我们的初衷:

为了让大家可以更快地找到自己所需要的内容,引导互联网向好的方向发展。

这目标到现在还没实现,目前我们可能已经接到了许多的关于版权的投诉,那么我们搜索引擎又要开始引导互联网向原创内容发展,那我们应该这么做:

首先就是将那些原原本本照抄的内容下架,至于哪些抄袭的,那么我们建议原创作者尽快将链接提交给我们,让我们知道这个链接存在的时间。

除了这个照抄的之外,我们还发现了许多伪原创,也就是将一些词替换成将其近义的词,但让用户读起来并不通顺,十分影响上网体验。那么我们就可以用到之前我们弄的那个语言引擎,让它来为我们做这个伪原创的一些打击,当然我们也可以设立一些近义词的词库,用来对比伪原创之后的内容。

至于伪原创的处理方法,我们首先要将搜索引擎里面的伪原创网址下架,尽量这种事件的发生。第一次我们给予警告,因为伪原创现在已经是一个比较普遍的现象,第一次给予一些引导并不是不可以。

那么第二次,我们可能要降权,并且视这个网站的伪原创数量来进一步处理,包括但不仅有提交版权局、全站下架。

另外有一些搜索引擎优化SEO的手段也越来越恶劣了,以至于让我们的爬虫都难辨真假,那我们这时候就需要介入一些人力资源(虽然我们的目标是建立一个不需要人力维护的一个搜索引擎,但是状况时时在变,我们也不得不做出适应),随机抽取近百个网站进行审核(这种可以起到杀鸡敬猴之效),然后如果情况实在是恶劣,那么我们可以要求爬虫不要管那些元数据(metadata)。

另外,我们也要适应些移动用户的需求。引导网站开设手机版,并且向我们声明电脑版和手机版的链接,在必要的情况下,我们可能会将用户访问的电脑版链接跳转成为手机版链接(用户是会同意的)。

搜索引擎日记 2020-08-06 09:57:08 通过 手机 浏览(91)

共有0条评论!

旧站评论功能已停止维护,现仍可查看评论列表

本网站已停止在本程序的更新,正在迁站。前往新版枫风博客