Tokens caros com API key avulsa. Esse é o problema recorrente de quem usa o OpenClaw todo dia: cada chamada ao modelo cobra por token (as unidades de texto que o modelo processa), e o custo acumula rápido quando você tem sub-agents, heartbeats e sessões longas.
A Alibaba Cloud empacotou 8 modelos de codificação num plano mensal fixo. Você paga US$ 10, recebe uma chave API única e usa qualquer um dos 8 modelos até o limite de requests. Este post cobre o que é o plano, como configurar no OpenClaw, e quando vale (ou não) a pena.
TL;DR
| Info | Lite | Pro |
|---|---|---|
| Preço | US$ 10/mês | US$ 50/mês |
| Requests/mês | 18.000 | 90.000 |
| Requests/5h | 1.200 | 6.000 |
| Requests/semana | 9.000 | 45.000 |
| Modelos | 8 (mesmo catálogo) | 8 (mesmo catálogo) |
| Reembolso | Não | Não |
O que é o Coding Plan
O Coding Plan da Alibaba Cloud é uma assinatura que dá acesso a 8 modelos de IA sob uma única chave API (no formato sk-sp-*). Não é pay-as-you-go por token — é um pacote fechado com limite de requests por mês.
Os modelos vêm de quatro provedores diferentes:
| Modelo | Provedor | Força |
|---|---|---|
qwen3.5-plus | Alibaba (Qwen) | Modelo flagship, raciocínio geral |
qwen3-max-2026-01-23 | Alibaba (Qwen) | Geração anterior, contexto longo |
qwen3-coder-next | Alibaba (Qwen) | Otimizado para código, pré-release |
qwen3-coder-plus | Alibaba (Qwen) | Codificação estável |
kimi-k2.5 | Moonshot AI | Top em benchmarks de código, 262k contexto |
glm-5 | Zhipu AI | Raciocínio geral, chinês/inglês |
glm-4.7 | Zhipu AI | Geração anterior, mais rápido |
MiniMax-M2.7 | MiniMax | Multimodal, contexto longo |
Todos os 8 estão disponíveis nos dois planos (Lite e Pro). A diferença entre os planos é só a quota.
Restrições importantes:
- Uso restrito a ferramentas de codificação (OpenClaw, Claude Code, Qwen Code). Proibido usar em scripts de backend, Postman, Dify ou qualquer outro uso programático.
- Uso pessoal. Compartilhar a chave com outros usuários viola os termos.
- Se a assinatura expirar sem renovação, a chave é resetada.
- Sem reembolso — nem parcial, nem pro-rata.
Atenção: o que conta como “request”
Esse é o ponto que o marketing do plano não deixa claro. 18.000 requests não significa 18.000 chamadas API independentes.
Quando você pede ao OpenClaw para fazer uma tarefa — refatorar um arquivo, escrever um teste, debugar um erro — o agente faz múltiplas chamadas ao modelo internamente. Cada chamada é um request. Uma tarefa simples consome 5-10 requests. Uma tarefa complexa (com múltiplos arquivos, sub-agents, ou longas cadeias de raciocínio) pode consumir 10-30+ requests.
tarefa simples (1 arquivo, direto): ~5-10 requests
tarefa média (2-3 arquivos, iteração): ~10-20 requests
tarefa complexa (multi-agent, debug): ~20-30+ requests
Na prática:
18.000 requests ÷ ~10 requests por tarefa = ~1.800 tarefas/mês (Lite)
90.000 requests ÷ ~10 requests por tarefa = ~9.000 tarefas/mês (Pro)
Não é ilimitado. Monitore o consumo no console da Alibaba Cloud (Model Studio > Usage). Quando a quota acaba, as chamadas falham com erro — não converte para pay-as-you-go, não degrada para um modelo menor. Simplesmente para.
Como configurar no OpenClaw
1. Criar conta e ativar o plano
Crie uma conta na Alibaba Cloud (versão internacional). Acesse o Model Studio, navegue até a seção Coding Plan e ative o plano Lite ou Pro.
2. Gerar a API key
No Model Studio, vá em API Keys e gere uma nova chave. A chave do Coding Plan começa com sk-sp- — diferente das chaves comuns que começam com sk-. Se a sua chave não começa com sk-sp-, você está usando pay-as-you-go, não o plano fixo.
3. Editar o openclaw.json
Abra o arquivo de configuração do OpenClaw (~/.openclaw/openclaw.json) e adicione o provedor:
{
models: {
providers: {
// Provedor Alibaba (Bailian é o nome interno da plataforma)
bailian: {
// URL internacional — não use a URL .cn
baseUrl: "https://coding-intl.dashscope.aliyuncs.com/v1",
// Chave do Coding Plan (formato sk-sp-*)
apiKey: "sk-sp-SUA_CHAVE_AQUI",
apiType: "openai-completions",
},
},
},
agents: {
defaults: {
model: {
// Modelo principal: qwen3.5-plus é o flagship
primary: "bailian/qwen3.5-plus",
},
},
},
}
4. Reiniciar o gateway
# Reinicia o gateway para carregar a nova configuração
openclaw gateway restart
5. Verificar
# Lista os modelos disponíveis e o status de cada provedor
openclaw models status
Você deve ver os 8 modelos da Alibaba listados com status available.
6. Trocar modelo na sessão
Para mudar de modelo no meio de uma conversa:
/model qwen3-coder-next
Isso troca o modelo da sessão atual (a conversa ativa) sem alterar o padrão global.
Alibaba vs OpenRouter: quando usar cada um
Se você leu o post sobre multi-model routing com OpenRouter, pode estar pensando: qual dos dois faz mais sentido?
| Critério | Alibaba Coding Plan | OpenRouter pay-as-you-go |
|---|---|---|
| Preço | Fixo US$ 10/mês | Por token (varia por modelo) |
| Modelos Qwen | 4 variantes incluídas | Sim, preço variável |
| Kimi K2.5 | Incluído | US$ 0.45/M input |
| Limite | 18k requests/mês (Lite) | Sem limite (saldo) |
| Quando acaba | Erro, sem fallback | Recarrega crédito |
| Modelos gratuitos | Não tem | Step Flash :free |
| Uso fora de coding | Proibido (termos) | Liberado |
| Provedor | Alibaba Cloud (China) | OpenRouter (EUA) |
Quando usar Alibaba: você usa o OpenClaw diariamente como ferramenta principal de código e quer custo previsível. O Lite cobre bem um uso moderado (50-100 tarefas/dia, dependendo da complexidade).
Quando usar OpenRouter: você usa esporadicamente, precisa de modelos fora do catálogo dos 8, quer modelos gratuitos, ou precisa usar a API fora de ferramentas de codificação.
Os dois juntos: os provedores coexistem no mesmo openclaw.json. Configure a Alibaba como modelo primário e o OpenRouter como fallback — quando a quota do Coding Plan acabar, o OpenClaw cai automaticamente para o OpenRouter.
{
agents: {
defaults: {
model: {
// Primário: usa a quota do Coding Plan
primary: "bailian/qwen3.5-plus",
// Fallback: quando a quota acabar, usa OpenRouter
fallbacks: [
"openrouter/moonshotai/kimi-k2.5",
],
},
},
},
}
Riscos reais
Antes de assinar, considere:
- Provedor chinês. A Alibaba Cloud opera sob jurisdição chinesa. Se você trabalha com código proprietário sensível, avalie se a política de dados atende seus requisitos.
- Sem reembolso. Se você ativar o Lite, usar por 3 dias e perceber que não precisa, perdeu US$ 10. Não há período de teste.
- Quota que falha, não degrada. Diferente do OpenRouter (onde você recarrega crédito), quando a quota do Coding Plan acaba, as chamadas retornam erro até o próximo ciclo de cobrança. Planeje seu uso ou configure um fallback.
- Restrição de uso. Se a Alibaba detectar uso fora de ferramentas de codificação (scripts, backends, automações), pode suspender a chave sem aviso.
Troubleshooting
HTTP 401
A chave está errada ou não é do Coding Plan. Verifique se começa com sk-sp-. Chaves comuns (sk-) não funcionam com a URL do Coding Plan.
model_not_found
O prefixo bailian/ é obrigatório. Sem ele, o OpenClaw não sabe qual provedor usar.
errado: qwen3.5-plus
certo: bailian/qwen3.5-plus
quota_exceeded
Quota de 5h, semanal ou mensal atingida. Verifique qual limite foi estourado no console da Alibaba (Model Studio > Usage). Opções: esperar o reset automático ou fazer upgrade para o Pro.
Modelo não aparece após configurar
O OpenClaw faz cache da lista de modelos. Delete o cache e reinicie:
# Remove o cache de modelos
rm ~/.openclaw/agents/main/agent/models.json
# Reinicia o gateway
openclaw gateway restart
Latência alta
A URL coding-intl.dashscope.aliyuncs.com é o endpoint internacional. Se você está no Brasil, a latência pode ser 200-400ms maior que provedores com servidores nos EUA. Para tarefas longas isso é irrelevante; para heartbeats curtos, pode incomodar.