Pular para conteúdo

Alibaba Coding Plan no OpenClaw: 8 modelos por US$ 10/mês

Categoria Tutorial

Tokens caros com API key avulsa. Esse é o problema recorrente de quem usa o OpenClaw todo dia: cada chamada ao modelo cobra por token (as unidades de texto que o modelo processa), e o custo acumula rápido quando você tem sub-agents, heartbeats e sessões longas.

A Alibaba Cloud empacotou 8 modelos de codificação num plano mensal fixo. Você paga US$ 10, recebe uma chave API única e usa qualquer um dos 8 modelos até o limite de requests. Este post cobre o que é o plano, como configurar no OpenClaw, e quando vale (ou não) a pena.


TL;DR

InfoLitePro
PreçoUS$ 10/mêsUS$ 50/mês
Requests/mês18.00090.000
Requests/5h1.2006.000
Requests/semana9.00045.000
Modelos8 (mesmo catálogo)8 (mesmo catálogo)
ReembolsoNãoNão

O que é o Coding Plan

O Coding Plan da Alibaba Cloud é uma assinatura que dá acesso a 8 modelos de IA sob uma única chave API (no formato sk-sp-*). Não é pay-as-you-go por token — é um pacote fechado com limite de requests por mês.

Os modelos vêm de quatro provedores diferentes:

ModeloProvedorForça
qwen3.5-plusAlibaba (Qwen)Modelo flagship, raciocínio geral
qwen3-max-2026-01-23Alibaba (Qwen)Geração anterior, contexto longo
qwen3-coder-nextAlibaba (Qwen)Otimizado para código, pré-release
qwen3-coder-plusAlibaba (Qwen)Codificação estável
kimi-k2.5Moonshot AITop em benchmarks de código, 262k contexto
glm-5Zhipu AIRaciocínio geral, chinês/inglês
glm-4.7Zhipu AIGeração anterior, mais rápido
MiniMax-M2.7MiniMaxMultimodal, contexto longo

Todos os 8 estão disponíveis nos dois planos (Lite e Pro). A diferença entre os planos é só a quota.

Restrições importantes:

  • Uso restrito a ferramentas de codificação (OpenClaw, Claude Code, Qwen Code). Proibido usar em scripts de backend, Postman, Dify ou qualquer outro uso programático.
  • Uso pessoal. Compartilhar a chave com outros usuários viola os termos.
  • Se a assinatura expirar sem renovação, a chave é resetada.
  • Sem reembolso — nem parcial, nem pro-rata.

Atenção: o que conta como “request”

Esse é o ponto que o marketing do plano não deixa claro. 18.000 requests não significa 18.000 chamadas API independentes.

Quando você pede ao OpenClaw para fazer uma tarefa — refatorar um arquivo, escrever um teste, debugar um erro — o agente faz múltiplas chamadas ao modelo internamente. Cada chamada é um request. Uma tarefa simples consome 5-10 requests. Uma tarefa complexa (com múltiplos arquivos, sub-agents, ou longas cadeias de raciocínio) pode consumir 10-30+ requests.

tarefa simples (1 arquivo, direto):     ~5-10 requests
tarefa média (2-3 arquivos, iteração):  ~10-20 requests
tarefa complexa (multi-agent, debug):   ~20-30+ requests

Na prática:

18.000 requests ÷ ~10 requests por tarefa = ~1.800 tarefas/mês (Lite)
90.000 requests ÷ ~10 requests por tarefa = ~9.000 tarefas/mês (Pro)

Não é ilimitado. Monitore o consumo no console da Alibaba Cloud (Model Studio > Usage). Quando a quota acaba, as chamadas falham com erro — não converte para pay-as-you-go, não degrada para um modelo menor. Simplesmente para.


Como configurar no OpenClaw

1. Criar conta e ativar o plano

Crie uma conta na Alibaba Cloud (versão internacional). Acesse o Model Studio, navegue até a seção Coding Plan e ative o plano Lite ou Pro.

2. Gerar a API key

No Model Studio, vá em API Keys e gere uma nova chave. A chave do Coding Plan começa com sk-sp- — diferente das chaves comuns que começam com sk-. Se a sua chave não começa com sk-sp-, você está usando pay-as-you-go, não o plano fixo.

3. Editar o openclaw.json

Abra o arquivo de configuração do OpenClaw (~/.openclaw/openclaw.json) e adicione o provedor:

{
  models: {
    providers: {
      // Provedor Alibaba (Bailian é o nome interno da plataforma)
      bailian: {
        // URL internacional — não use a URL .cn
        baseUrl: "https://coding-intl.dashscope.aliyuncs.com/v1",
        // Chave do Coding Plan (formato sk-sp-*)
        apiKey: "sk-sp-SUA_CHAVE_AQUI",
        apiType: "openai-completions",
      },
    },
  },
  agents: {
    defaults: {
      model: {
        // Modelo principal: qwen3.5-plus é o flagship
        primary: "bailian/qwen3.5-plus",
      },
    },
  },
}

4. Reiniciar o gateway

# Reinicia o gateway para carregar a nova configuração
openclaw gateway restart

5. Verificar

# Lista os modelos disponíveis e o status de cada provedor
openclaw models status

Você deve ver os 8 modelos da Alibaba listados com status available.

6. Trocar modelo na sessão

Para mudar de modelo no meio de uma conversa:

/model qwen3-coder-next

Isso troca o modelo da sessão atual (a conversa ativa) sem alterar o padrão global.


Alibaba vs OpenRouter: quando usar cada um

Se você leu o post sobre multi-model routing com OpenRouter, pode estar pensando: qual dos dois faz mais sentido?

CritérioAlibaba Coding PlanOpenRouter pay-as-you-go
PreçoFixo US$ 10/mêsPor token (varia por modelo)
Modelos Qwen4 variantes incluídasSim, preço variável
Kimi K2.5IncluídoUS$ 0.45/M input
Limite18k requests/mês (Lite)Sem limite (saldo)
Quando acabaErro, sem fallbackRecarrega crédito
Modelos gratuitosNão temStep Flash :free
Uso fora de codingProibido (termos)Liberado
ProvedorAlibaba Cloud (China)OpenRouter (EUA)

Quando usar Alibaba: você usa o OpenClaw diariamente como ferramenta principal de código e quer custo previsível. O Lite cobre bem um uso moderado (50-100 tarefas/dia, dependendo da complexidade).

Quando usar OpenRouter: você usa esporadicamente, precisa de modelos fora do catálogo dos 8, quer modelos gratuitos, ou precisa usar a API fora de ferramentas de codificação.

Os dois juntos: os provedores coexistem no mesmo openclaw.json. Configure a Alibaba como modelo primário e o OpenRouter como fallback — quando a quota do Coding Plan acabar, o OpenClaw cai automaticamente para o OpenRouter.

{
  agents: {
    defaults: {
      model: {
        // Primário: usa a quota do Coding Plan
        primary: "bailian/qwen3.5-plus",
        // Fallback: quando a quota acabar, usa OpenRouter
        fallbacks: [
          "openrouter/moonshotai/kimi-k2.5",
        ],
      },
    },
  },
}

Riscos reais

Antes de assinar, considere:

  • Provedor chinês. A Alibaba Cloud opera sob jurisdição chinesa. Se você trabalha com código proprietário sensível, avalie se a política de dados atende seus requisitos.
  • Sem reembolso. Se você ativar o Lite, usar por 3 dias e perceber que não precisa, perdeu US$ 10. Não há período de teste.
  • Quota que falha, não degrada. Diferente do OpenRouter (onde você recarrega crédito), quando a quota do Coding Plan acaba, as chamadas retornam erro até o próximo ciclo de cobrança. Planeje seu uso ou configure um fallback.
  • Restrição de uso. Se a Alibaba detectar uso fora de ferramentas de codificação (scripts, backends, automações), pode suspender a chave sem aviso.

Troubleshooting

HTTP 401

A chave está errada ou não é do Coding Plan. Verifique se começa com sk-sp-. Chaves comuns (sk-) não funcionam com a URL do Coding Plan.

model_not_found

O prefixo bailian/ é obrigatório. Sem ele, o OpenClaw não sabe qual provedor usar.

errado: qwen3.5-plus
certo:  bailian/qwen3.5-plus

quota_exceeded

Quota de 5h, semanal ou mensal atingida. Verifique qual limite foi estourado no console da Alibaba (Model Studio > Usage). Opções: esperar o reset automático ou fazer upgrade para o Pro.

Modelo não aparece após configurar

O OpenClaw faz cache da lista de modelos. Delete o cache e reinicie:

# Remove o cache de modelos
rm ~/.openclaw/agents/main/agent/models.json

# Reinicia o gateway
openclaw gateway restart

Latência alta

A URL coding-intl.dashscope.aliyuncs.com é o endpoint internacional. Se você está no Brasil, a latência pode ser 200-400ms maior que provedores com servidores nos EUA. Para tarefas longas isso é irrelevante; para heartbeats curtos, pode incomodar.


Próximo passo

Esc