月省几百订阅费!不需要本地部署,只需一个KEY就能使用主流的大模型
先交代背景:我就是一个普通自媒体人,之前每个月花好几百订阅ChatGPT和Claude。钱花得心疼不说,关键是每次对话它都记不住我的风格,更别提帮我搜热点、整素材了。
后来发现两个好东西:Hermes Agent(一个会自进化的AI框架)和opencode-go包月API token多到你用不完,折腾了几天,终于跑通了。
之前使用声称最便宜的deepseek一天使用下来就要接近10元的开支, 当我想放弃时,发现opencode有包月token,真是福音,再也不用担心钱包肉痛,现在随便你用,不建议自己本地搭建模型,1需要维护,2太大的模型又跑动, 3跑得又慢。
关键opencode还能让你免费模型体验,5小时内支持200次请求额度,过后又恢复额度,真是良心,
体验地址:https://opencode.ai/go?ref=0D4PB30C43
下面就是我的完整踩坑记录,跟着做就行。
文章目录
一、为啥选Hermes,不选OpenClaw?
有人问:OpenClaw不是更火吗,28万Star呢?
简单说:
- **OpenClaw** = 万能遥控器,能把20多个平台串起来,但不会自己变聪明
- **Hermes** = 越用越聪明,能记住你的写作风格,自动提炼技能
我是做内容的,不是做平台的。Hermes更对胃口。
(当然,你需要多平台调度中心可以选OpenClaw,各取所需。)
二、环境准备:先装WSL2
重要:Hermes不支持直接在Windows跑,必须用Linux环境。
Win11用户最省事的方法就是WSL2。
以管理员身份打开PowerShell:
dism.exe /online /enable-feature /featurename:Microsoft-Windows-Subsystem-Linux /all /norestart
dism.exe /online /enable-feature /featurename:VirtualMachinePlatform /all /norestart
重启电脑,然后:
wsl --set-default-version 2
打开Microsoft Store搜”Ubuntu”,装22.04或24.04。
安装后进终端:
sudo apt update && sudo apt upgrade -y
我犯的蠢:一开始没用WSL2,直接在PowerShell硬装Hermes。折腾了两小时,各种报错。最后发现人家说明里清清楚楚写着”只支持Linux”。浪费的时间就当交学费了。
三、安装Hermes Agent
一行命令:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
装完:
source ~/.bashrc
hermes --version
看到版本号就成功了。
四、首次配置:先白嫖OpenRouter免费模型
Hermes本身不带模型,需要接一个”大脑”。
去OpenRouter注册账号,创建一个API Key。然后:
hermes config setup
跟着向导选:Quick Setup → OpenRouter → 粘贴API Key → 选个免费模型。
然后输入”请用中文介绍你自己”,能回复就说明通了。
注意:OpenRouter免费用户每天50次请求。后面我们换Ollama就不限量了。
五、接入Ollama云端模型(不限量!)
在WSL里装Ollama:
curl -fsSL https://ollama.com/install.sh | sh
(国内用户如果慢,搜一下Ollama国内安装脚本)
配置镜像加速:
mkdir -p ~/.ollama
echo '{"registry": {"mirrors": {"registry.ollama.ai": "https://ollama.modelscope.cn"}}}' > ~/.ollama/config.json
启动服务:
nohup ollama serve > /dev/null 2>&1 &
登录Ollama账号,用GitHub授权。
然后让Hermes换用这个模型:
hermes config set model.provider custom
hermes config set model.base_url http://127.0.0.1:11434/v1
hermes config set model.model deepseek-v3.1:671b-cloud
hermes config set model.api_key ""
重启Hermes,顶部显示deepseek-v3.1:671b-cloud就搞定了。
六、AMD显卡用户的特别篇
如果你和我一样是AMD APU(7840H、7840U),在WSL里用GPU会非常痛苦。ROCm折腾了半天,没搞定。
最后发现个超简单的方案:让WSL里的Ollama调用Windows主机的Ollama。
Windows端:
setx OLLAMA_HOST "0.0.0.0:11434"
重启Ollama。
WSL端:
echo 'export OLLAMA_HOST=localhost:11434' >> ~/.bashrc
source ~/.bashrc
测试一下:ollama list,能看到Windows里下载的模型,而且GPU加速正常。
这个方法的好处:不用折腾任何Linux驱动。
七、我踩过的坑汇总
- **Windows原生直接装Hermes** → 不行,必须WSL2
- **hermes命令找不到** → 执行`source ~/.bashrc`
- **OpenRouter免费模型突然404** → 模型ID更新了,用`/model`重新选
- **OpenRouter限额用完** → 换Ollama的云端模型
- **AMD显卡WSL不能用** → 直接用”WSL调用Windows Ollama”方案
总结一句话:花一个下午搭好这套组合,以后AI写作、搜热点、整素材都免费,而且越用越顺手。
> 你部署时遇到过什么奇葩问题?评论区聊聊。
体验地址:https://opencode.ai/go?ref=0D4PB30C43
https://www.88531.cn/?p=49451
创作不易,用心坚持,请喝一怀爱心咖啡!继续坚持创作~~
