我帮一个跨境电商团队评估客服方案的时候,他们在用的SaaS系统每个坐席收费$20以上,而且所有对话数据都经过第三方服务器存储。对于涉及用户订单信息和售后记录的业务来说,这个数据合规问题说大不大说小不小,但确实是个隐患。
后来他们切换到VPS自建方案,月成本降到$15左右,数据完全在自己服务器上,还能自由定制回答风格和接入内部系统。这篇文章把整个部署流程整理出来,跟着走30分钟内可以跑起来。
为什么选VPS自建而不是直接用SaaS
核心原因有三个:
数据安全是第一位的。VPS自建方案所有对话数据本地存储,可以自定义日志策略,敏感业务甚至可以配合内网部署,不存在数据被第三方留存的问题。
成本差距很明显。传统客服系统按坐席收费,三五个坐席每月就是$60到$100以上,还不包含AI能力。自建方案VPS $2到$5/月,API按量付费,总成本通常在$25以内。
扩展灵活。接入CRM、工单系统、企业微信、钉钉,或者自定义Prompt控制回答风格,都可以自己改,不受平台限制。
一、准备工作(约5分钟)
VPS配置要求
| 参数 | 最低配置 | 推荐配置 |
|---|---|---|
| CPU | 1核 | 2核 |
| 内存 | 2GB | 4GB |
| 系统 | Ubuntu 22.04 | Ubuntu 22.04 |
使用API模式(对接OpenAI、Claude等)2GB内存够用,跑本地模型(Ollama)需要8GB以上内存。
SSH连接服务器后,安装基础环境:
sudo apt update && sudo apt upgrade -y
sudo apt install -y docker.io docker-compose git curl
sudo systemctl enable docker
sudo systemctl start docker
选择AI模型方案
新手推荐API模式:对接OpenAI或OpenRouter,部署快,不占服务器资源,gpt-4o-mini的成本极低。
有条件的话可以用本地模型:基于Ollama运行Llama3或Qwen,数据完全不出服务器,但需要8GB以上内存。
二、部署OpenClaw(约15分钟)
Step 1:拉取项目
git clone https://github.com/openclaw/openclaw.git
cd openclaw
Step 2:配置环境变量
cp .env.example .env
nano .env
API模式填入:
OPENAI_API_KEY=你的API_KEY
MODEL_NAME=gpt-4o-mini
PORT=3000
如果用OpenRouter(支持多模型,推荐):
OPENAI_API_KEY=你的OpenRouter_KEY
OPENAI_BASE_URL=https://openrouter.ai/api/v1
MODEL_NAME=openai/gpt-4o-mini
PORT=3000
本地模型则填:
MODEL_NAME=ollama/llama3
OLLAMA_BASE_URL=http://localhost:11434
PORT=3000
Step 3:启动服务
docker-compose up -d
查看启动状态:
docker-compose ps
docker-compose logs -f
看到服务状态为Up,浏览器访问 http://你的服务器IP:3000,出现聊天界面说明部署成功。
三、接入企业知识库(关键步骤)
不接入业务数据,这就只是个通用聊天机器人,不能叫客服。让AI真正能回答你的业务问题,需要做这一步。
方法一:FAQ文档导入
把产品说明、售后政策、常见问题整理成Markdown或TXT文件,在OpenClaw后台上传。适合内容量不大、结构清晰的知识库。
方法二:RAG(推荐)
通过向量检索让AI从知识库里找到相关内容再回答,准确率比直接塞文档高很多,能有效避免AI编造不存在的信息。
在.env里启用RAG:
ENABLE_RAG=true
EMBEDDING_MODEL=text-embedding-3-small
方法三:Prompt约束
在系统Prompt里明确限制AI的回答范围,防止跑偏:
你是[公司名]的客服助手。只能基于提供的知识库回答问题,
知识库中没有的内容请告知用户联系人工客服,
不允许编造或猜测信息。回答简洁专业,中文回复。
四、网站接入
最简单:iframe嵌入
<iframe
src="https://你的域名"
width="400"
height="600"
style="border:none; border-radius:8px;">
</iframe>
推荐:悬浮客服组件
在网页右下角实现悬浮聊天框,在网站 body 结束标签前加入:
<script>
window.OpenClawConfig = {
serverUrl: 'https://你的域名',
title: '客服助手',
primaryColor: '#0066FF'
};
</script>
<script src="https://你的域名/widget.js"></script>
API对接
支持接入Telegram、企业微信、钉钉等渠道,在OpenClaw后台的渠道配置里填入对应Bot Token即可。
五、安全配置(必做)
服务直接暴露在公网不做安全配置风险很大,这几步必须做。
安装Nginx和Certbot:
apt install nginx certbot python3-certbot-nginx -y
Nginx配置文件:
server {
listen 80;
server_name 你的域名;
return 301 https://$host$request_uri;
}
server {
listen 443 ssl;
server_name 你的域名;
ssl_certificate /etc/letsencrypt/live/你的域名/fullchain.pem;
ssl_certificate_key /etc/letsencrypt/live/你的域名/privkey.pem;
location / {
auth_basic "Restricted";
auth_basic_user_file /etc/nginx/.htpasswd;
proxy_pass http://localhost:3000;
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
}
}
申请SSL证书:
certbot --nginx -d 你的域名
配置访问认证:
apt install apache2-utils -y
htpasswd -c /etc/nginx/.htpasswd admin
systemctl restart nginx
配置防火墙,关闭直接访问3000端口:
ufw allow 80/tcp
ufw allow 443/tcp
ufw deny 3000/tcp
ufw enable
六、性能优化
启用Redis缓存,减少重复API调用成本:
docker run -d --name redis --restart always redis:alpine
在.env里配置:
REDIS_URL=redis://localhost:6379
CACHE_TTL=3600
控制上下文长度,降低API成本:
MAX_CONTEXT_LENGTH=10
MAX_TOKENS=1000
添加限流防止API额度被滥用:
RATE_LIMIT_WINDOW=60000
RATE_LIMIT_MAX=20
七、成本参考
| 项目 | 费用 |
|---|---|
| VPS(2核2GB) | $5-10/月 |
| API调用(gpt-4o-mini,日均100次对话) | $1-5/月 |
| 合计 | $6-15/月 |
流量大的时候API成本会上升,可以设置每日API调用上限控制支出。切换到OpenRouter接便宜模型处理日常问题,复杂问题才调高端模型,能进一步降低成本。
适合这套方案的场景
独立站和跨境电商:用户咨询量大、数据隐私要求高、需要接入订单系统。
SaaS创业团队:需要快速上线客服功能,预算有限,后续要自由扩展。
技术型中小企业:有基础运维能力,想自主控制数据和系统。
对数据合规有要求的业务:金融、医疗、法律等涉及敏感用户信息的场景,自建比SaaS更安全。
走完这套流程,你有了一个数据完全在自己手里、可以随意定制、月成本不超过$15的AI客服系统。相比买SaaS方案,前期多花了一两个小时配置,但长期来看无论是成本还是控制权都要划算得多。