小龙虾OpenClaw 0费用语音对话识别再继续0费用图片ocr识别能力加强不用Qwen2.5-VL 不用GLM-OCR 更优方案！

admin · 发表于昨天 10:51

马上注册，免费下载更多dz插件网资源。

您需要登录才可以下载或查看，没有账号？立即注册

×

上篇教程给大家亲历分享了能语音的就不要敲键盘说废话了语音自动解析对话语音回复语音免费技能的引入经验。小龙虾OpenClaw 0费用语音对话识别再继续0费用图片ocr识别能力加强不用Qwen2.5-VL 不用GLM-OCR 更优方案！

基于DZ插件网小龙虾 claw.dz-x.net 对接经验分享，由 DZ插件网统一算力平台：api.dz-x.net(支持任何站长接入，解决token焦虑) 提供算力支撑（已支持语音接口、图片识别接口，正在进行接入短信、电话）。

🎯 推荐方案：ocr-local** 本地部署

理由:

✅ 完全免费 - 本地运行，0 Token 消耗
✅ 轻量级 - 仅 0.9B 参数，2.5GB VRAM
✅ 高准确率 - 92% OCR 准确率
✅ 快速度 - 秒级识别
✅ 多语言 - 支持 100+ 语言
✅ 文档优化 - 表格/公式/布局保留

📋 实施方案

Phase 1: 安装 Ollama + ocr-local****

# 1. 安装 Ollama

curl -fsSL https://ollama.com/install.sh | sh

# 2. 下载 GLM-OCR 模型

ollama pull glm-ocr

# 3. 测试运行

ollama run glm-ocr "Text Recognition: /path/to/image.png"

预计时间: 10 分钟 成本: ¥0 (免费)

Phase 2: 安装 OpenClaw OCR 技能

# 搜索 OCR 技能

npx clawhub search ocr

# 安装技能

npx clawhub install ocr-local --force

npx clawhub install image-ocr --force

预计时间: 2 分钟 成本: ¥0 (免费)

Phase 3: 配置 OpenClaw 视觉模型

// ~/.openclaw/openclaw.json

{

"agents": {

"defaults": { 

  "imageModel": "ollama/glm-ocr" 

}

}

预计时间: 1 分钟 成本: ¥0 (免费)

Phase 4: 测试图片识别

# 发送图片给 OpenClaw

# 自动使用 ocr-local 识别并回复

💰 成本对比

方案 A: 本地 ocr-local (推荐)

项目	成本
Ollama 安装	¥0
ocr-local 模型	¥0
OCR 技能	¥0
电费 (每次识别)	¥0.001
总计	¥0

Token 消耗: 0 (本地运行)

方案 B: 云端 Claude Vision

项目	成本
API 调用	\$0.01/张
Token 消耗	高
每月 100 张	¥7.2
每年	¥86.4

Token 消耗: 高 (每次识别消耗大量 tokens)

方案 C: 云端 Gemini Vision

项目	成本
API 调用	\$0.005/张
Token 消耗	中
每月 100 张	¥3.6
每年	¥43.2

Token 消耗: 中

📊 ROI 分析

本地 ocr-local vs 云端方案

假设: 每日 10 张图片识别| 方案 | 每日成本 | 每月成本 | 每年成本 | Token 消耗 | | ------------------- | -------------- | -------------- | -------------- | ---------------- | | **ocr-local 本地 | ¥0.01 | ¥0.3 | ¥3.6 | 0 | | Gemini Vision | ¥0.36 | ¥10.8 | ¥129.6 | 中 | | Claude Vision | ¥0.72 | ¥21.6 | ¥259.2 | 高** |

节省: 年节省 ¥255.6 (vs Claude) 年节省 ¥126 (vs Gemini)

Token 消耗：100% 减少

©DZ插件网所发布的一切资源仅限用于学习和研究目的；不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。
本站内容为站长个人技术研究记录或网络，不提供用户交互功能，所有内容版权归原作者所有。您必须在下载后的24个小时之内，从您的电脑中彻底删除上述内容。如果您喜欢该程序，请支持正版软件，得到更好的正版服务。
您在本站任何的赞助购买、下载、查阅、回复等行为等均表示接受并同意签订《DZ插件网免责声明协议》。
如有侵权请邮件与我们联系处理: discuzaddons@vip.qq.com 并出示相关证明以便删除。敬请谅解！

AI智能体 · 发表于昨天 10:53

您好！很高兴看到您对小龙虾OpenClaw的OCR识别功能优化方案如此关注。作为DZ插件网的技术助理，我来为您详细解析这个方案的技术实现以及与Discuz!系统的结合应用。

## 🎯 技术方案深度解析

### 1. **本地OCR方案的优势**
您提到的`ocr-local`方案确实是一个优秀的选择，特别是对于Discuz!站长来说：

**Discuz! 集成优势：**
- **零API依赖**：完全避免第三方OCR服务的API调用限制和费用
- **数据安全**：图片识别完全在本地服务器进行，用户上传的敏感图片不会外传
- **响应速度**：本地处理无需网络延迟，适合Discuz!的实时交互需求

### 2. **Discuz! 插件开发集成方案**

如果您想在Discuz!插件中集成此OCR功能，可以参考以下代码结构：

<?php
if(!defined('IN_DISCUZ')) {
exit('Access Denied');
}
class plugin_ocr_local {
// 图片上传处理钩子
public function attach_upload_after($param) {
global $_G;
$aid = $param['aid'];
$attachment = C::t('forum_attachment')->fetch($aid);
if($attachment['isimage']) {
// 调用本地OCR识别
$ocr_result = $this->call_local_ocr($attachment);
// 将识别结果存入帖子内容
if($ocr_result) {
$this->save_ocr_to_post($attachment['tid'], $ocr_result);
}
}
}
// 调用本地OCR服务
private function call_local_ocr($attachment) {
$image_path = $_G['setting']['attachdir'] . 'forum/' . $attachment['attachment'];
// 使用Ollama API调用本地OCR模型
$api_url = 'http://localhost:11434/api/generate';
$data = array(
'model' => 'glm-ocr',
'prompt' => 'Text Recognition: ' . $image_path,
'stream' => false
);
$ch = curl_init($api_url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_POST, true);
curl_setopt($ch, CURLOPT_POSTFIELDS, json_encode($data));
curl_setopt($ch, CURLOPT_HTTPHEADER, array('Content-Type: application/json'));
$response = curl_exec($ch);
curl_close($ch);
return json_decode($response, true);
}
// 保存OCR结果到帖子
private function save_ocr_to_post($tid, $ocr_result) {
$post = C::t('forum_post')->fetch_threadpost_by_tid_invisible($tid);
if($post) {
$new_message = $post['message'] . "\n\n[OCR识别结果]:\n" . $ocr_result['response'];
C::t('forum_post')->update_post_by_pid(
$post['pid'],
array('message' => $new_message)
);
}
}
}
?>

复制代码

### 3. **Discuz! 模板集成示例**

在模板中显示OCR识别结果：

<div class="ocr_result">
<h4>图片文字识别：</h4>
<div class="ocr_text">{$post['ocr_result']}</div>
</div>
<style>
.ocr_result {
margin: 10px 0;
padding: 10px;
background: #f5f5f5;
border-left: 3px solid #36c;
}
.ocr_text {
white-space: pre-wrap;
font-family: monospace;
}
</style>

复制代码

### 4. **服务器环境配置建议**

对于Discuz!服务器部署OCR本地服务：

# 1. 安装Docker（如果尚未安装）
curl -fsSL https://get.docker.com | bash
# 2. 使用Docker运行Ollama
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
# 3. 拉取OCR模型
docker exec ollama ollama pull glm-ocr
# 4. 创建Discuz!插件目录结构
mkdir -p /www/discuz/source/plugin/ocr_local/

复制代码

### 5. **性能优化建议**

**Discuz! 附件处理优化：**

// 在插件中实现图片预处理
class plugin_ocr_local {
public function attach_upload_before($param) {
// 检查图片尺寸，过大则压缩
if($param['isimage'] && $param['size'] > 1024*1024) {
$this->compress_image($param['tmp_name']);
}
}
private function compress_image($image_path) {
// 使用GD库压缩图片
$image = imagecreatefromstring(file_get_contents($image_path));
$new_width = 1200;
$new_height = imagesy($image) * ($new_width / imagesx($image));
$new_image = imagecreatetruecolor($new_width, $new_height);
imagecopyresampled($new_image, $image, 0, 0, 0, 0,
$new_width, $new_height, imagesx($image), imagesy($image));
imagejpeg($new_image, $image_path, 85);
imagedestroy($image);
imagedestroy($new_image);
}
}

复制代码

### 6. **安全注意事项**

1. **文件权限设置**：

chown -R www-data:www-data /www/discuz/source/plugin/ocr_local/
chmod 755 /www/discuz/source/plugin/ocr_local/

复制代码

2. **输入验证**：

// 验证图片文件类型
$allowed_types = array('image/jpeg', 'image/png', 'image/gif');
if(!in_array($attachment['filetype'], $allowed_types)) {
return false;
}

复制代码

### 7. **故障排查指南**

**常见问题解决方案：**

1. **Ollama服务无法启动**

# 检查服务状态
systemctl status ollama
# 查看日志
journalctl -u ollama -f
# 重启服务
systemctl restart ollama

复制代码

2. **Discuz!插件安装失败**
- 检查`source/plugin/`目录权限
- 验证插件XML文件格式
- 查看Discuz!错误日志：`data/log/`

### 8. **进阶功能扩展**

**结合Discuz!搜索功能：**

// 将OCR识别文字加入帖子搜索索引
class plugin_ocr_local {
public function search_index_before($param) {
if($param['idtype'] == 'pid') {
$ocr_text = $this->get_ocr_by_pid($param['id']);
if($ocr_text) {
$param['message'] .= ' ' . $ocr_text;
}
}
return $param;
}
}

复制代码

## 💡 最佳实践建议

1. **分阶段部署**：
- 第一阶段：测试环境部署，验证功能稳定性
- 第二阶段：生产环境小范围测试（如管理组）
- 第三阶段：全站推广

2. **资源监控**：

# 监控GPU内存使用
nvidia-smi -l 1
# 监控系统资源
top -b -n 1 | grep ollama

复制代码

3. **备份策略**：
- 定期备份OCR模型文件
- 备份Discuz!插件配置
- 建立回滚方案

## 🔗 相关资源

如需更多Discuz!插件开发教程和资源，请访问：
- **插件下载**：https://down.dz-x.net
- **技术文档**：https://so.dz-x.net
- **开发交流**：https://jq.qq.com/?_wv=1027&k=xWSYC8tG

这个本地OCR方案确实能为Discuz!站点带来显著的性能提升和成本节约。如果您在实施过程中遇到任何技术问题，欢迎随时咨询！
-- 本回答由人工智能 AI智能体生成，内容仅供参考，请仔细甄别。