Alibaba Coding Plan no OpenClaw: 8 modelos por US$ 10/mês

Tokens caros com API key avulsa. Esse é o problema recorrente de quem usa o OpenClaw todo dia: cada chamada ao modelo cobra por token (as unidades de texto que o modelo processa), e o custo acumula rápido quando você tem sub-agents, heartbeats e sessões longas.

A Alibaba Cloud empacotou 8 modelos de codificação num plano mensal fixo. Você paga US$ 10, recebe uma chave API única e usa qualquer um dos 8 modelos até o limite de requests. Este post cobre o que é o plano, como configurar no OpenClaw, e quando vale (ou não) a pena.

TL;DR

Info	Lite	Pro
Preço	US$ 10/mês	US$ 50/mês
Requests/mês	18.000	90.000
Requests/5h	1.200	6.000
Requests/semana	9.000	45.000
Modelos	8 (mesmo catálogo)	8 (mesmo catálogo)
Reembolso	Não	Não

O que é o Coding Plan

O Coding Plan da Alibaba Cloud é uma assinatura que dá acesso a 8 modelos de IA sob uma única chave API (no formato sk-sp-*). Não é pay-as-you-go por token — é um pacote fechado com limite de requests por mês.

Os modelos vêm de quatro provedores diferentes:

Modelo	Provedor	Força
`qwen3.5-plus`	Alibaba (Qwen)	Modelo flagship, raciocínio geral
`qwen3-max-2026-01-23`	Alibaba (Qwen)	Geração anterior, contexto longo
`qwen3-coder-next`	Alibaba (Qwen)	Otimizado para código, pré-release
`qwen3-coder-plus`	Alibaba (Qwen)	Codificação estável
`kimi-k2.5`	Moonshot AI	Top em benchmarks de código, 262k contexto
`glm-5`	Zhipu AI	Raciocínio geral, chinês/inglês
`glm-4.7`	Zhipu AI	Geração anterior, mais rápido
`MiniMax-M2.7`	MiniMax	Multimodal, contexto longo

Todos os 8 estão disponíveis nos dois planos (Lite e Pro). A diferença entre os planos é só a quota.

Restrições importantes:

Uso restrito a ferramentas de codificação (OpenClaw, Claude Code, Qwen Code). Proibido usar em scripts de backend, Postman, Dify ou qualquer outro uso programático.
Uso pessoal. Compartilhar a chave com outros usuários viola os termos.
Se a assinatura expirar sem renovação, a chave é resetada.
Sem reembolso — nem parcial, nem pro-rata.

Atenção: o que conta como “request”

Esse é o ponto que o marketing do plano não deixa claro. 18.000 requests não significa 18.000 chamadas API independentes.

Quando você pede ao OpenClaw para fazer uma tarefa — refatorar um arquivo, escrever um teste, debugar um erro — o agente faz múltiplas chamadas ao modelo internamente. Cada chamada é um request. Uma tarefa simples consome 5-10 requests. Uma tarefa complexa (com múltiplos arquivos, sub-agents, ou longas cadeias de raciocínio) pode consumir 10-30+ requests.

tarefa simples (1 arquivo, direto):     ~5-10 requests
tarefa média (2-3 arquivos, iteração):  ~10-20 requests
tarefa complexa (multi-agent, debug):   ~20-30+ requests

Na prática:

18.000 requests ÷ ~10 requests por tarefa = ~1.800 tarefas/mês (Lite)
90.000 requests ÷ ~10 requests por tarefa = ~9.000 tarefas/mês (Pro)

Não é ilimitado. Monitore o consumo no console da Alibaba Cloud (Model Studio > Usage). Quando a quota acaba, as chamadas falham com erro — não converte para pay-as-you-go, não degrada para um modelo menor. Simplesmente para.

Como configurar no OpenClaw

1. Criar conta e ativar o plano

Crie uma conta na Alibaba Cloud (versão internacional). Acesse o Model Studio, navegue até a seção Coding Plan e ative o plano Lite ou Pro.

2. Gerar a API key

No Model Studio, vá em API Keys e gere uma nova chave. A chave do Coding Plan começa com sk-sp- — diferente das chaves comuns que começam com sk-. Se a sua chave não começa com sk-sp-, você está usando pay-as-you-go, não o plano fixo.

3. Editar o openclaw.json

Abra o arquivo de configuração do OpenClaw (~/.openclaw/openclaw.json) e adicione o provedor:

{
  models: {
    providers: {
      // Provedor Alibaba (Bailian é o nome interno da plataforma)
      bailian: {
        // URL internacional — não use a URL .cn
        baseUrl: "https://coding-intl.dashscope.aliyuncs.com/v1",
        // Chave do Coding Plan (formato sk-sp-*)
        apiKey: "sk-sp-SUA_CHAVE_AQUI",
        apiType: "openai-completions",
      },
    },
  },
  agents: {
    defaults: {
      model: {
        // Modelo principal: qwen3.5-plus é o flagship
        primary: "bailian/qwen3.5-plus",
      },
    },
  },
}

4. Reiniciar o gateway

# Reinicia o gateway para carregar a nova configuração
openclaw gateway restart

5. Verificar

# Lista os modelos disponíveis e o status de cada provedor
openclaw models status

Você deve ver os 8 modelos da Alibaba listados com status available.

6. Trocar modelo na sessão

Para mudar de modelo no meio de uma conversa:

/model qwen3-coder-next

Isso troca o modelo da sessão atual (a conversa ativa) sem alterar o padrão global.

Alibaba vs OpenRouter: quando usar cada um

Se você leu o post sobre multi-model routing com OpenRouter, pode estar pensando: qual dos dois faz mais sentido?

Critério	Alibaba Coding Plan	OpenRouter pay-as-you-go
Preço	Fixo US$ 10/mês	Por token (varia por modelo)
Modelos Qwen	4 variantes incluídas	Sim, preço variável
Kimi K2.5	Incluído	US$ 0.45/M input
Limite	18k requests/mês (Lite)	Sem limite (saldo)
Quando acaba	Erro, sem fallback	Recarrega crédito
Modelos gratuitos	Não tem	Step Flash :free
Uso fora de coding	Proibido (termos)	Liberado
Provedor	Alibaba Cloud (China)	OpenRouter (EUA)

Quando usar Alibaba: você usa o OpenClaw diariamente como ferramenta principal de código e quer custo previsível. O Lite cobre bem um uso moderado (50-100 tarefas/dia, dependendo da complexidade).

Quando usar OpenRouter: você usa esporadicamente, precisa de modelos fora do catálogo dos 8, quer modelos gratuitos, ou precisa usar a API fora de ferramentas de codificação.

Os dois juntos: os provedores coexistem no mesmo openclaw.json. Configure a Alibaba como modelo primário e o OpenRouter como fallback — quando a quota do Coding Plan acabar, o OpenClaw cai automaticamente para o OpenRouter.

{
  agents: {
    defaults: {
      model: {
        // Primário: usa a quota do Coding Plan
        primary: "bailian/qwen3.5-plus",
        // Fallback: quando a quota acabar, usa OpenRouter
        fallbacks: [
          "openrouter/moonshotai/kimi-k2.5",
        ],
      },
    },
  },
}

Riscos reais

Antes de assinar, considere:

Provedor chinês. A Alibaba Cloud opera sob jurisdição chinesa. Se você trabalha com código proprietário sensível, avalie se a política de dados atende seus requisitos.
Sem reembolso. Se você ativar o Lite, usar por 3 dias e perceber que não precisa, perdeu US$ 10. Não há período de teste.
Quota que falha, não degrada. Diferente do OpenRouter (onde você recarrega crédito), quando a quota do Coding Plan acaba, as chamadas retornam erro até o próximo ciclo de cobrança. Planeje seu uso ou configure um fallback.
Restrição de uso. Se a Alibaba detectar uso fora de ferramentas de codificação (scripts, backends, automações), pode suspender a chave sem aviso.

Troubleshooting

HTTP 401

A chave está errada ou não é do Coding Plan. Verifique se começa com sk-sp-. Chaves comuns (sk-) não funcionam com a URL do Coding Plan.

model_not_found

O prefixo bailian/ é obrigatório. Sem ele, o OpenClaw não sabe qual provedor usar.

errado: qwen3.5-plus
certo:  bailian/qwen3.5-plus

quota_exceeded

Quota de 5h, semanal ou mensal atingida. Verifique qual limite foi estourado no console da Alibaba (Model Studio > Usage). Opções: esperar o reset automático ou fazer upgrade para o Pro.

Modelo não aparece após configurar

O OpenClaw faz cache da lista de modelos. Delete o cache e reinicie:

# Remove o cache de modelos
rm ~/.openclaw/agents/main/agent/models.json

# Reinicia o gateway
openclaw gateway restart

Latência alta

A URL coding-intl.dashscope.aliyuncs.com é o endpoint internacional. Se você está no Brasil, a latência pode ser 200-400ms maior que provedores com servidores nos EUA. Para tarefas longas isso é irrelevante; para heartbeats curtos, pode incomodar.