Skip to Content
Referência da APILimites de Taxa

Limites de Taxa

A API para Desenvolvedores tem limite de taxa por organização, por minuto, com o orçamento definido pelo seu plano. Cada resposta autenticada com key informa exatamente onde você está, para que possa regular seu tráfego antes de atingir o limite.

Cabeçalhos de limite de taxa

Cada resposta autenticada com key carrega três cabeçalhos:

CabeçalhoSignificado
RateLimit-LimitA cota de requisições da sua organização para a janela atual.
RateLimit-RemainingRequisições restantes na janela atual.
RateLimit-ResetSegundos até a janela atual ser reiniciada.

A janela é uma janela deslizante de 60 segundos — o orçamento por plano é expresso por minuto. Leia RateLimit-Remaining e diminua a velocidade à medida que ele se aproxima de zero.

HTTP/1.1 200 OK RateLimit-Limit: 120 RateLimit-Remaining: 117 RateLimit-Reset: 41 Content-Type: application/json

Quando você excede o limite

Uma requisição que excede o orçamento retorna 429 com o envelope de erro padrão e um cabeçalho Retry-After que informa quantos segundos esperar:

HTTP/1.1 429 Too Many Requests Retry-After: 41 RateLimit-Limit: 120 RateLimit-Remaining: 0 RateLimit-Reset: 41 Content-Type: application/json
{ "error": { "type": "rate_limit_error", "code": "rate_limit_exceeded", "message": "You have exceeded your plan's request allowance." } }

Lidando com o 429

  • Respeite Retry-After — espere o número de segundos indicado antes de repetir.
  • Aplique um recuo exponencial se continuar recebendo 429.
  • Use RateLimit-Remaining de forma proativa para limitar rajadas antes que sejam rejeitadas.

Falha aberta

O limitador de taxa foi projetado para falhar aberto: se o próprio limitador estiver indisponível, as requisições passam em vez de serem bloqueadas. Você nunca deve ver 429 espúrios causados por uma queda do limitador — mas também não deve depender do limitador para impor a correção no seu próprio cliente. Regule seu tráfego usando os cabeçalhos RateLimit-*.

Cota de consultas

Executar um agent (POST /agents/{id}/query) é adicionalmente medido contra a cota de consultas do seu plano, no lado do servidor. Excedê-la retorna 429 na via bloqueante, ou um único evento error na via de streaming. Consulte a página de Consulta de Agent para conhecer os detalhes.

Last updated on