为了让我爸使用 OpenClaw,我给它套上通话功能
我爸和众多中国老年人一样其实已经是豆包的忠实用户了。但作为一个 AI 博主我内心总是想让老父亲知道 OpenClaw 的牛逼之处让他开开眼。在家里给他演示一通后他得出了个结论软件不错能控制很多东西相当于有手脚了但是就是不好用。“啥不好用最近不知道有多火”“我都老花眼了还要打字人家豆包说说话就行了。你不是程序员吗干嘛不做一个。”这话我一听就来气所以这两天我就一直研究如何给OpenClaw 套上通话功能。现在先给大家看看实际的使用情况架构选择你可能以为我要短期内 vibecoding OpenClaw的插件之类的但在这个普通人30 分钟都能写一个项目的年代。我估计这个功能早就实现了。问题是如何找到这些代码呢第一是靠搜索先随便搜搜openclawvoice就会发现很多项目。第二是靠积累由于对架构的理解我很早就知道有不少做 voice AI agents接下来就是翻翻代码库看看有没有上 OpenClaw 了。经过一番搜索我选择了star 比较多比较眼熟的ten-framework。为什么这么选择呢首先他的文档比较完善部署流程清晰了我几乎不用写任何代码还有个重要的原因就是 OpenClaw 更新频繁可能几天前的代码就变得老旧了我还认识开发者到时候督促他修修 bug。基本服务购买为了让整个项目运行起来你需要注册 4 个免费的服务其中除了 DeepSeek其他都不需要付费。DeepSeek国内替代推荐国内直连OpenAI 兼容接口价格极低约 OpenAI 的 1/50。注册步骤打开 DeepSeek 开放平台点击 注册用手机号或邮箱注册充值登录后点击左侧 费用Billing最低充值 2充 10 能用很久获取 API Key点击左侧 API Keyshttps://platform.deepseek.com/api_keys点击 创建 API Key填写名称点击创建立即复制保存——只显示一次Deepgram语音识别 STT用于将用户语音实时转为文字。注册步骤打开 Deepgram 控制台点击 Sign Up支持 Google / GitHub 登录或邮箱注册首次登录会引导创建项目获取 API Key进入控制台点击左侧 API Keys点击 Create a New API Key填写名称如 openclaw权限选 Member 或 Admin点击 Create Key立即复制保存——页面关闭后无法再查看免费额度新账号赠送 $200 免费额度不需要绑信用卡个人测试用很久。ElevenLabs语音合成 TTS用于将 AI 回复文字转为语音播报。注册步骤打开 ElevenLabs点击右上角 Sign Up支持 Google / GitHub 登录或邮箱注册获取 API Key登录后点击左侧边栏最下面的 Developers选择 API Keys 标签点击 Create an API Key填写名称权限建议全部打开Access / Write点击创建立即复制保存免费额度免费计划每月10,000 字符的语音合成额度包含 API 访问权限测试够用。Agora实时音视频 RTC用于浏览器与 AI 助手之间的实时音视频通信。注册步骤打开 Agora 控制台点击注册填写邮箱/手机号完成验证创建项目登录后进入控制台点击左侧 项目管理点击 创建项目填写项目名称如 openclaw-voice使用场景选 互动直播 或 语音通话鉴权机制选 安全模式推荐点击提交获取 App ID 和 Certificate回到 项目管理 页面找到刚创建的项目点击 App ID 右侧的 复制图标点击 配置 → 找到 主要证书点击复制信令服务rtm开启打开项目详情在Signaling选择数据中心开启免费额度每月 10,000 分钟免费使用个人测试完全够用。项目配置克隆项目将项目整体克隆下来https://github.com/TEN-framework/ten-framework配置环境变量配置参考ai_agents/agents/examples/openclaw-example里面的 readme。我们在ai_agents/下创建 .env文件内容具体如下# --- 服务配置 ---LOG_PATH/tmp/ten_agentLOG_STDOUTtrueGRAPH_DESIGNER_SERVER_PORT49483SERVER_PORT8080WORKERS_MAX100WORKER_QUIT_TIMEOUT_SECONDS60# --- 前端 ---AGENT_SERVER_URLhttp://localhost:8080TEN_DEV_SERVER_URLhttp://localhost:49483NEXT_PUBLIC_EDIT_GRAPH_MODEfalse# --- Agora RTC/RTM ---AGORA_APP_ID你的 Agora App IDAGORA_APP_CERTIFICATE你的 Agora App Certificate# --- LLM (DeepSeek) ---OPENAI_API_BASEhttps://api.deepseek.comOPENAI_API_KEY你的 DeepSeek API KeyOPENAI_MODELdeepseek-chat# OPENAI_PROXY_URL# --- STT (Deepgram) ---DEEPGRAM_API_KEY你的 Deepgram API Key# --- TTS (ElevenLabs) ---ELEVENLABS_TTS_KEY你的 ElevenLabs API Key# --- OpenClaw Gateway ---OPENCLAW_GATEWAY_URLws://host.docker.internal:18789OPENCLAW_GATEWAY_PASSWORD你的 Gateway 密码OPENCLAW_GATEWAY_ORIGINhttp://host.docker.internal:18789OPENCLAW_GATEWAY_SCOPESoperator.writeOPENCLAW_GATEWAY_DEVICE_IDENTITY_PATH/data/openclaw/device_identity.jsOpenClaw配置首先将 OpenClaw 的网关改成密码模式具体步骤openclaw config set gateway.auth.mode password openclaw config set gateway.auth.password lxfater然后为了安全需要配置Control UI Allowed Origins 具体步骤如下图在 OpenClaw 的 Settings → Gateway → Control UI Allowed Origins 中添加http://host.docker.internal:18789这个值必须与 .env 中的 OPENCLAW_GATEWAY_ORIGIN 完全一致包括协议 http:// 不能写成wss://不能带路径。如果不匹配Gateway 会拒绝连接并返回 origin not allowed。修改代码扩展功能实际使用下来为了方便中国人使用需要对配置进行更改具体如下ai_agents/agents/examples/openclaw-example/tenapp/property.json — 4 行改动STT 语言 en-US → zh模型 nova-3 → nova-2LLM base_url 从硬编码https://api.openai.com/v1→ ${env:OPENAI_API_BASE}LLM model 从硬编码 gpt-4o → ${env:OPENAI_MODEL}上面主要是让 ASR 能转录中文还有去除硬编码的环境变量方便配置国内的模型。构建容器mac arm 架构下部署注意事项由于这个项目不支持arm64 架构你需要在 docker开启虚拟化具体步骤如下打开 Docker Desktop点击右上角 齿轮图标Settings左侧选 General往下找到 Virtual Machine OptionsVMM 选择 Apple Virtualization framework勾选 Use Rosetta for x86_64/amd64 emulation on Apple Silicon点击 Apply Restart然后运行如下命令# 1. 构建镜像 cd 项目所在目录/ten-framework/ai_agents # 强制build amd64 版本 docker build --platform linux/amd64 -f agents/examples/openclaw-example/Dockerfile -t openclaw-example-app .运行项目首先保持 OpenClaw 开启想看到网关的日志的话推荐使用openclaw gateway --force然后运行容器# 要在cd 项目所在目录/ten-framework/ai_agents目录下 docker run --rm -it --env-file .env -p 8080:8080 -p 3000:3000 openclaw-example-app登录到http://localhost:3000会看到如下所示界面我们复制这个命令运行进行配对使用项目打开这个项目的第一件事情是选择麦克风然后我们还要选择配置voice-assistant检查是否联通具体如下图所示现在开始就可以愉快对话了。要求他创建在桌面创建一个文件如下图所示口喷就行很快就创建好了结束接入语音对话功能后OpenClaw 开始有能力给不懂技术的普通人使用。普通人估计都没有接触过开口就能干活不废话的 AI我给我爸的 OpenClaw 套上了个修复图片的 skill他就乐呵呵地年轻时候的照片进行修复了。普通人其实对 AI 产品只有两个要求好用能干活。这篇文章希望对你有帮助喜欢我的文章可以关注我的公众号 Voice Agent 学习笔记了解最懂 AI 语音的头脑都在思考什么
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2413623.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!