A Uber estourou o budget de AI em um trimestre
A Uber tem mais de dez bilhões de dólares em free cash flow e opera mais de dez bilhões de viagens por ano. Mesmo assim, quando Dara Khosrowshahi foi perguntado sobre o custo de AI internamente, a resposta foi direta: a empresa consumiu o orçamento anual inteiro de AI em um único trimestre.
O que ele descreveu a seguir é o problema que todo time de produto vai enfrentar nos próximos dois anos, independentemente do tamanho do budget.
A reação da Uber foi fazer duas coisas ao mesmo tempo: frear contratações de engenheiros e continuar incentivando o uso. A lógica era que se cada engenheiro estava entregando mais, a empresa não precisava de mais engenheiros no mesmo ritmo de antes, e o custo de AI cobriria parte da diferença. Não é uma conta óbvia de fazer em tempo real, porque o custo de AI é visível no momento em que você paga a fatura, mas o ganho de produtividade aparece distribuído ao longo de semanas e meses, em entregas que de outra forma teriam levado mais tempo ou exigido mais pessoas.
O que a Uber fez em seguida foi mais interessante do que a decisão de frear headcount. Khosrowshahi descreveu uma distinção entre dois modos de uso: exploração e escala. Para explorar, a empresa usa os modelos mais caros, os frontier models, porque a qualidade do output importa quando você está tentando descobrir se uma interação nova funciona.
Para escalar, depois que o padrão está validado, o caminho é migrar para modelos mais baratos ou de código aberto. A separação parece óbvia quando você a ouve, mas a maioria das organizações não faz esse corte de forma consciente: usa o modelo mais acessível para tudo, ou usa o mais caro para tudo, e nos dois casos o resultado é ruim por motivos opostos.
Tem um detalhe operacional que fica implícito nessa divisão e que vale explicitar. Um modelo de fronteira como o Claude Opus 4.6 ou o GPT-4o custa, dependendo do volume e do contexto, entre dez e trinta vezes mais por token que uma versão menor ou destilada. Se você está rodando um agente que processa logs de onboarding de usuários para identificar padrões de abandono, a diferença de qualidade entre o modelo grande e o pequeno provavelmente é marginal para esse caso específico, e você está pagando trinta vezes mais sem ganho real.
🔗A Stack abriu o Builder Pass: 7 dias gratuitos do curso de IA e automação da PM3 com a Alura, com projeto prático e certificado. Link: https://productgurus.short.gy/uV8PC0
Agora, se você está usando um modelo para avaliar se uma nova feature de search vai ser recebida bem antes de construí-la, a diferença de qualidade pode determinar se o time constrói a coisa certa ou passa dois meses no caminho errado. O custo do modelo caro é baixo comparado ao custo de construir a coisa errada.
O que a Uber aprendeu na prática, estourando um budget de um ano em noventa dias, é que a pergunta certa não é “quanto estamos gastando em AI?” mas sim “em qual decisão esse gasto está ocorrendo?”. A maioria dos times ainda não faz essa distinção porque AI entrou nos fluxos de trabalho de forma orgânica: um engenheiro começa a usar Cursor, outro usa Claude para review de código, outro usa um agente para triage de tickets, e o custo vai acumulando por caminhos que nenhum budget tradicional foi desenhado para capturar. O gasto não aparece num único centro de custo, aparece distribuído por times, ferramentas e subscriptions individuais até que alguém olha a fatura consolidada e se surpreende.
Khosrowshahi mencionou que estão vendo devs na Índia fazendo dez vezes mais commits do que faziam antes, usando agentes autônomos. Esse número não é verificável de fora, mas o que importa é a observação que ele fez logo em seguida: o padrão de adoção dentro da empresa é completamente imprevisível. Os times que avançaram mais rápido com AI não são os que você esperaria, e os que você esperaria às vezes ainda estão engatinhando. Isso tem uma implicação direta para qualquer empresa que está tentando “implementar AI”: o rollout centralizado raramente é onde a coisa acontece de verdade. A adoção real aparece em cantos aleatórios da organização, e o trabalho de gestão é detectar onde está acontecendo e desbloquear, não controlar onde deveria acontecer.
Uma coisa que fica sem resposta para mim é como você toma essa decisão de frear headcount sem criar um problema diferente. Se o custo de AI está subindo porque os engenheiros estão sendo mais produtivos, e você usa essa produtividade maior como justificativa para contratar menos, você está apostando que o custo de AI vai continuar subindo em proporção menor que o ganho de produtividade.
Isso pode ser verdade por um tempo, mas modelos ficam mais baratos, novos modelos ficam mais caros, e a linha entre exploração e escala muda toda vez que um novo modelo de fronteira é lançado, o que significa que o equilíbrio que a Uber está tentando encontrar agora vai precisar ser recalibrado de novo em seis meses, e a empresa tem dez bilhões em caixa para absorver os erros desse recálculo enquanto aprende, uma margem que a maioria dos times não tem disponível para aprender da mesma forma.
A UserGuiding é uma plataforma no-code que permite criar tours guiados, checklists de ativação, tooltips contextuais e segmentação por comportamento de usuário, sem depender de engenharia para cada iteração. Você configura o fluxo, define os gatilhos e publica direto em cima do seu produto. Você tem 20% de desconto. Acesse aqui e use o cupom: PRODUCTGURUS.