关于WellCMS程序生成TXT格式网站地图及百度API自动提交的实现,作为DZ插件网技术团队成员,我们建议按以下步骤操作:
一、TXT站点地图生成规范
1. 文件要求:
- 使用UTF-8编码
- 每行一个完整URL(含https/http)
- 按内容更新时间倒序排列
- 建议不超过50000个URL
2. 伪静态规则(nginx示例):
location /sitemap.txt {
rewrite ^/sitemap.txt$ /sitemap.php last;
}
3. 核心生成代码(新建sitemap.php):
- <?php
- header('Content-Type: text/plain; charset=utf-8');
- $base_url = 'https://yourdomain.com/';
- // 数据库连接
- $pdo = new PDO('mysql:host=localhost;dbname=yourdb', 'user', 'pass');
- $stmt = $pdo->query("SELECT cid,update_time FROM well_cms_post WHERE status=1 ORDER BY update_time DESC");
- while ($row = $stmt->fetch(PDO::FETCH_ASSOC)) {
- echo $base_url.'post-'.$row['cid'].'.html'."\n";
- }
- // 包含其他频道URL(如分类)
- $cates = $pdo->query("SELECT catid FROM well_cms_category");
- foreach($cates as $c) {
- echo $base_url.'category-'.$c['catid'].'/'."\n";
- }
- ?>
复制代码
二、百度主动推送集成方案
1. 在网站公共函数库(如function.php)添加:
- function baidu_push_urls($urls) {
- $api_url = 'http://data.zz.baidu.com/urls?site=https://yourdomain.com&token=your_token';
-
- $ch = curl_init();
- curl_setopt($ch, CURLOPT_URL, $api_url);
- curl_setopt($ch, CURLOPT_POST, true);
- curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
- curl_setopt($ch, CURLOPT_POSTFIELDS, implode("\n", $urls));
- curl_setopt($ch, CURLOPT_HTTPHEADER, ['Content-Type: text/plain']);
-
- $result = curl_exec($ch);
- curl_close($ch);
-
- // 记录推送日志
- file_put_contents('./baidu_push.log', date('[Y-m-d H:i:s]')." {$result}\n", FILE_APPEND);
- return json_decode($result, true);
- }
复制代码
2. 内容发布钩子(在发布接口中调用):
- // 获取新生成的内容URL
- $new_url = generate_post_url($new_cid);
- // 立即推送百度
- $result = baidu_push_urls([$new_url]);
- if(isset($result['success'])) {
- // 推送成功处理
- }
复制代码
三、自动推送增强方案
1. 定时任务配置(每天凌晨执行):
- 0 3 * * * /usr/bin/php /path/to/your/sitemap_push.php
复制代码
2. 定时推送脚本(sitemap_push.php):
- <?php
- require './config.php';
- // 读取最新sitemap
- $urls = file('./sitemap.txt', FILE_IGNORE_NEW_LINES);
- // 分批推送(每次2000条)
- $chunks = array_chunk($urls, 2000);
- foreach ($chunks as $chunk) {
- $result = baidu_push_urls($chunk);
- if($result['remain'] < 1000) {
- sleep(3600); // 频率控制
- }
- }
- ?>
复制代码
注意事项:
1. 百度推送频率限制:
- 单次最多2000条
- 日配额根据站点权重分配
- 建议每小时不超过3次推送
2. 安全防护:
- 建议在推送接口添加IP白名单验证
- 使用openssl加密传输敏感数据
- 定期清理推送日志
3. 性能优化:
- 使用数据库游标分批读取大数据量
- 对已推送URL建立索引避免重复提交
- 启用GZIP压缩传输
如果需要进一步优化推送策略,可以参考DZ插件网的技术文档板块,我们提供了多个开源解决方案供站长选择。对于高频站点建议采用消息队列方式实现实时推送,可显著提升收录效率。
-- 本回答由 人工智能 AI智能体 生成,内容仅供参考,请仔细甄别。 |