·设为首页收藏本站📧邮箱修改🎁免费下载专区🔐设置/修改密码👽群雄群聊
12下一页
返回列表 发布新帖

火车头采集有人会不,我想在采集的内容中第1000个字后面插入一个代码可以实现吗

235 19
发表于 2022-1-8 12:09:08 | 显示全部楼层 阅读模式

马上注册,免费下载更多dz插件网资源。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
***内容可能违规暂时被隐藏***
我要说一句 收起回复

评论19

婷姐Lv.8 发表于 2022-1-8 12:09:23 | 显示全部楼层
这有点牛皮 估计要大神才能解决 要判断
我要说一句 收起回复
IT618发布Lv.8 发表于 2022-1-8 12:09:53 | 显示全部楼层
你的内容看成不到,不过火车头可以使用正则表达式来
我要说一句 收起回复
拾光Lv.8 发表于 2022-1-8 12:10:20 | 显示全部楼层
能写这个的都是很厉害的人
我要说一句 收起回复
婷姐Lv.8 发表于 2022-1-8 12:10:34 | 显示全部楼层
可以先截取多少个字节,然后在这个字节后面加就行了。很简单。
我要说一句 收起回复
独家记忆Lv.8 发表于 2022-1-8 12:11:22 | 显示全部楼层
可以测试下
我要说一句 收起回复
拾光Lv.8 发表于 2022-1-8 12:11:42 | 显示全部楼层
可以测试下
我要说一句 收起回复
婷姐Lv.8 发表于 2022-1-8 12:12:03 | 显示全部楼层
可以测试下
我要说一句 收起回复
IT618发布Lv.8 发表于 2022-1-8 12:12:08 | 显示全部楼层
为何是1000字后加?万一这个字符刚好是一段话被你给切了。你应该去匹配最后的</p>后台插入!
我要说一句 收起回复
拾光Lv.8 发表于 2022-1-8 12:12:17 | 显示全部楼层
还没有弄出来吗?其实你可以设置关联区域,使用正则从关联区域里提取内容。比如我设置关联区域为区域开头:<div itemprop="articleBody">,区域结尾为:</p><script type="text/javascript">,这样就已经提取了一次内容,再进行正则提取,选取数据源为关联区域,再使用(?<content>[\s\S]{1000}) 这样就提取到了关联区域里前1000个字符的内容,再进行标签组合,就是你想要的了
我要说一句 收起回复

回复

 懒得打字嘛,点击右侧快捷回复【查看最新发布】   【应用商城享更多资源】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

投诉/建议联系

discuzaddons@vip.qq.com

未经授权禁止转载,复制和建立镜像,
如有违反,按照公告处理!!!
  • 联系QQ客服
  • 添加微信客服

联系DZ插件网微信客服|最近更新|Archiver|手机版|小黑屋|DZ插件网! ( 鄂ICP备20010621号-1 )|网站地图

您的IP:3.145.47.253,121.14.135.66,GMT+8, 2024-4-25 16:11 , Processed in 0.259887 second(s), 143 queries , Gzip On, Redis On.

Based on Discuz! W1.0 Licensed

© 2001-2024 Discuz! Team.

关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表