·设为首页收藏本站📧邮箱修改🎁免费下载专区🔐设置/修改密码👽群雄群聊
12下一页
返回列表 发布新帖

从技术层面分析百度如何识别打击快排

205 19
发表于 2022-6-16 08:10:24 | 显示全部楼层 阅读模式

马上注册,免费下载更多dz插件网资源。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
本人2011年入坑开始编程至今,主攻各种http/tcp协议小软件。站在一个不专业的程序员角度,从技术层面分析百度搜索排名的原理以及针对快排的识别,以下所有言论仅代表个人观点


-----------------------------------前言---------------------------------------
所有的搜索引擎算法,都是由机器运行的各种判断逻辑代码。

及:
设置一个或多个判断条件,满足该条件,则按方案1执行,不满足该条件,执行方案2、方案3....
每个方案里面,又会有各种判断条件,衍生出各种不同方案,导致不同结果

如果不认可,建议关闭此页面以免耽误您的宝贵时间

-----------------------------------正题---------------------------------------

一、排名因素

1.硬件维度:域名(含BA、建站历史等)、服务器等

2.软件维度:建站程序,页面大小(压缩),HTTP/HTTPS传输等

3.灵魂维度:内容内容内容....

4.可控维度:用户体验(点击、点击率、人群画像)

二、排名算法工作原理

硬件维度和软件维度,不在我考虑范围内,建站程序五花八门,人各有命

我们只谈灵魂维度和可控维度。

首先,灵魂维度,关于网站的内容,百度通过蜘蛛抓取页面内容后,经过NLP等智能算法,判断内容在其数据库重复度、判断内容可读性、判断内容属性等。这里我们可以借鉴一下百度NLP技术文档的说明。这些都是百度现在具有的内容识别能力(下图,应该还有隐藏没有公开的识别能力)。
从技术层面分析百度如何识别打击快排 技术,技术层,层面,分析,百度

其次,可控维度,用户体验,是什么呢?
简单来说,就是一个页面,一个url在搜索结果里面,受用户欢迎的程度(点击率)、被用户认可的程度(跳出率)。
就这些而言,那些五花八门的快排都已经做到位了。那为什么你的排名上不去??

这里就到我今天分析的重头戏了,用户人群画像

大多数的快排,其实就是通过搜索点击,达到伪装用户体验的过程。每次搜索点击之后,清理缓存历史记录。你是不是觉得这个点击特别干净呢?

百度应该也这么觉得,一个网站,被点击的次数,有绝大部分都是没有任何历史记录的“纯白”用户点击。只要把控这一点,就可以干掉99%的快排。

试想一下,我们正常使用百度的时候,会去刻意清理缓存吗?甚至很多使用者,都是登录了百度账号在使用搜索的。

从技术层面分析百度如何识别打击快排 技术,技术层,层面,分析,百度

上图是我清理缓存之后,再次访问百度的数据,可以看到,百度COOKIE返回了BD_LAST_QID这个字段,LAST,是上一次/最后的意思,。

值得一提的是,在我清理缓存之后,访问百度,理论上COOKIE字段应该是空白的,但事实上却莫名其妙的带着BIDUPSID这个字段请求了。如下图

从技术层面分析百度如何识别打击快排 技术,技术层,层面,分析,百度

这是否意味着,你的每一次请求,百度都有迹可循呢?

另外,指纹参数运算后的加密字段,以往是每一次跳转页面,重新计算一次,每次的值都不同,此次更新之后,仅仅在第一次访问百度的时候计算。后续无论跳转任何页面,这个值都不变。是否侧面证明了,以往只需要解决指纹就可以上排名,在这次更新过后,指纹不再重要了?

另外,百度蜘蛛是影响排名的因素之一,快排如果不来蜘蛛,一定是没有用的
蜘蛛就是爬虫,它过来抓取你的内容,提交到后台,经过算法判断你是否值得收录。
已经收录的页面,它过来抓取你的内容,提交到后台,经过算法判断你排名是升是降还是拔毛。。。
-----------------------------------------------------------------
最后用通俗的语言,给大家解释一下用户历史画像,接触过某宝s单的朋友应该知道,s单的时候,人家要求你用信誉高的号,用购买记录干净的号。。
那百度怎么做到“信誉高”又“干净”呢?
千万不要以为使用百度账号cookie就可以解决历史画像,那只是一小部分。。核心内容不便透露。。
我要说一句 收起回复

评论19

婷姐Lv.8 发表于 2022-6-16 08:11:00 | 显示全部楼层
不是说有什么cookie嘛
我要说一句 收起回复
CrystαlLv.8 发表于 2022-6-16 08:11:05 | 显示全部楼层
还有后续么
我要说一句 收起回复
CrystαlLv.8 发表于 2022-6-16 08:11:57 | 显示全部楼层
这个技术层面可以,百度就是靠技术和噱头来吓唬快排的!!!
我要说一句 收起回复
独家记忆Lv.8 发表于 2022-6-16 08:12:47 | 显示全部楼层
对于我们这种小白来说只是看看,快排行就只能手动优化了
我要说一句 收起回复
独家记忆Lv.8 发表于 2022-6-16 08:13:08 | 显示全部楼层
核心就是ip纯净度
我要说一句 收起回复
TyCodingLv.8 发表于 2022-6-16 08:13:15 | 显示全部楼层
说到底就是越来越智能化了,人工可期
我要说一句 收起回复
TyCodingLv.8 发表于 2022-6-16 08:13:35 | 显示全部楼层
社会学?用户访文cookie都是干净的还不是百度账号登录的,占比在90%绝对是快排了,度娘会这么认为?
我要说一句 收起回复
IT618发布Lv.8 发表于 2022-6-16 08:14:05 | 显示全部楼层
说白了,现在很多快快排之所以失效,就是模拟点击不够自然。越自然越真实的模拟点击,依然效果很强大。
我要说一句 收起回复
婷姐Lv.8 发表于 2022-6-16 08:14:50 | 显示全部楼层
哟哟哟,这不是处理事件的作者吗,下一步准备在论坛卖快排程序了吗?
我要说一句 收起回复

回复

 懒得打字嘛,点击右侧快捷回复【查看最新发布】   【应用商城享更多资源】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

投诉/建议联系

discuzaddons@vip.qq.com

未经授权禁止转载,复制和建立镜像,
如有违反,按照公告处理!!!
  • 联系QQ客服
  • 添加微信客服

联系DZ插件网微信客服|最近更新|Archiver|手机版|小黑屋|DZ插件网! ( 鄂ICP备20010621号-1 )|网站地图

您的IP:18.116.42.208,1.193.146.52,GMT+8, 2024-4-24 23:30 , Processed in 0.226871 second(s), 147 queries , Gzip On, Redis On.

Based on Discuz! W1.0 Licensed

© 2001-2024 Discuz! Team.

关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表