O que o iFood entendeu antes de quase todo mundo sobre IA
Em 10 de outubro de 2025, a Prosus publicou uma daquelas métricas que parecem feitas para virar manchete: o Large Commerce Model, desenvolvido primeiro com o iFood, rodava com custo 60 vezes menor do que modelos proprietários de classe parecida e, ao mesmo tempo, entregava desempenho melhor em tarefas de ecommerce.
A conta dos 60x chama atenção, mas ela sozinha não explica o caso. O ponto mais interessante é que o iFood encontrou um lugar onde IA genérica começa a ficar cara demais para o tipo de problema que precisa resolver: entender intenção de compra dentro de um fluxo com milhões de usuários, cardápios, histórico, horário, localização, desconto, tempo de entrega e chance real de conversão.
Quando a tarefa é essa, a melhor IA talvez seja a que sabe menos sobre o mundo e mais sobre o seu negócio.
O Large Commerce Model, ou LCM, foi apresentado pela Prosus como um modelo treinado com dados de mais de 500 milhões de usuários e mais de 10 trilhões de tokens.
No iFood, ele aparece de forma mais visível no Ailo, assistente de IA que permite pedir comida pelo WhatsApp ou pelo app a partir de frases comuns, como “quero uma comida leve que chegue em até 30 minutos” ou “quero restaurantes em promoção”. A interface parece simples, quase óbvia em 2026, mas o que está por trás dela não é um chatbot tentando soar educado. É uma tentativa de transformar linguagem natural em pedido, e pedido é uma métrica muito menos tolerante a teatro do que engajamento em conversa.
Durante os testes, segundo o iFood, mais de 70 mil pessoas usaram o Ailo, somando mais de 100 mil interações desde junho de 2025. A empresa reportou 48% mais chance de uma busca virar pedido em comparação com o fluxo tradicional do app e 33% menos tempo para finalizar um pedido no WhatsApp. A Prosus também divulgou outros resultados do LCM em produção: push notifications com 4x mais pedidos, aumento de 66% na conversão das recomendações “you may also like this” e busca em farmácia gerando 4,6% mais pedidos.
Esses números explicam por que o caso é diferente da maioria das iniciativas de IA que aparecem em produto. Um assistente genérico pode responder bem. Um assistente vertical precisa vender melhor, reduzir atrito ou aumentar frequência. Se ele conversa bonito e não muda comportamento, é decoração cara e muito cara por sinal.
A parte contraintuitiva é que o iFood não parece ter escolhido entre “usar API” e “construir tudo dentro de casa”. O próprio material da empresa diz que o Ailo usa uma arquitetura híbrida com Anthropic, OpenAI e AWS para combinar precisão, velocidade e segurança. Essa nuance importa porque a ideia não é abandonar modelos genéricos, mas parar de tratá-los como resposta universal.
Em algumas partes do fluxo, faz sentido alugar inteligência de fronteira. Em outras, especialmente quando existe volume, repetição e dados proprietários, pagar a mesma tarifa cognitiva para cada microdecisão começa a parecer desperdício operacional.
Durante um bom tempo, parecia mais sensato dizer que quase nenhuma empresa deveria treinar modelo próprio, porque OpenAI, Anthropic, Google e Meta têm mais capital, mais gente técnica e mais escala de infraestrutura. Essa leitura ainda vale para muitas empresas.
O erro seria aplicar a mesma regra para uma plataforma com mais de 60 milhões de usuários, milhões de pedidos e uma base histórica que sabe, com muito mais precisão do que qualquer modelo genérico, como um brasileiro escolhe comida numa segunda-feira à noite depois de cancelar duas entregas no último mês.
O LCM não precisa ser melhor que o Claude em escrita, melhor que o GPT-5 em raciocínio geral ou melhor que o Gemini em busca aberta. Ele precisa saber se uma pessoa com fome agora, em um bairro específico, usando WhatsApp, com determinado histórico de pedidos e certa sensibilidade a promoção, tem mais chance de comprar sushi, pizza, mercado ou farmácia. Isso é contexto e também é onde mora o dinheiro.
IA genérica entende linguagem; IA vertical entende o negócio que a linguagem está tentando acionar.
Essa diferença muda a conversa de produto. Quando um time adiciona um chat ao app, ele normalmente está mexendo na superfície da experiência. Quando o iFood conecta linguagem natural a busca, recomendação, push, canal e pedido, a IA começa a mexer no sistema de decisão do produto. A fronteira deixa de ser “o usuário consegue conversar?” e passa a ser “o produto consegue decidir melhor com base no que só ele sabe?”.
A Databricks chegou a uma conclusão parecida em outro domínio, com menos barulho e menos apelo para consumidor final. Para gerar documentação de tabelas e colunas no Unity Catalog, a empresa treinou um modelo sob medida gastando menos de US$ 1.000 em treinamento e experimentação, com dois engenheiros trabalhando por cerca de um mês, e reportou queda de 10x no custo de inferência.
A tarefa era pequena perto do que o iFood faz, mas o raciocínio era parecido: quando uma tarefa tem fronteira clara, volume alto e feedback rápido, chamar sempre o maior modelo disponível vira desperdício. Um modelo menor, adaptado ao contexto do produto, pode resolver melhor e custar menos.
A própria OpenAI aponta esse caminho nas docs de otimização de modelo quando trata fine-tuning e distillation como formas de criar modelos menores, mais rápidos e mais baratos para tarefas específicas. Isso torna a discussão menos ideológica, digamos assim. O fornecedor da API sabe que nem toda tarefa deveria terminar no modelo mais caro. A diferença é que, para muitas empresas, esse raciocínio ainda não chegou em quem toma decisões e alinha com os times.
O cuidado necessário no caso do iFood é a conta dos 60x. A Prosus divulgou o número, mas não abriu todos os detalhes da comparação: quais modelos entraram no benchmark, qual foi o mix de entrada e saída, como cache e batching foram tratados, quanto de engenharia entrou na conta e quais tarefas específicas definiram “melhor desempenho”. Para confiar totalmente no número, seria preciso ver a metodologia inteira. Ainda assim, mesmo que a vantagem real fosse menor, a direção do caso continuaria relevante, porque a economia aparece exatamente onde a escala torna cada centavo por requisição um problema acumulado.
Uma empresa pequena pode se iludir com a ideia de IA proprietária e gastar energia onde deveria usar API pronta. Uma plataforma grande pode se iludir no sentido oposto e pagar API genérica para tarefas que já viraram repetição estatística dentro do próprio produto. O iFood está no segundo grupo. A cada busca, push, pedido, avaliação, cancelamento e recompra, a empresa acumula sinais que não existem no dataset público de nenhum modelo generalista.
A maioria das discussões internas sobre IA ainda começa com a pergunta errada: “qual modelo vamos usar?”. Antes disso vem uma pergunta mais chata e mais útil: quais decisões do produto acontecem tantas vezes, com tanto dado próprio e tanta consequência econômica, que continuar usando modelo genérico virou uma forma elegante de desperdiçar margem?
No iFood, essa decisão aparece na busca que vira pedido, no WhatsApp que encurta o fluxo, na recomendação que aumenta conversão, no push que volta a ser relevante e no modelo que aprende com cliques, compras, cancelamentos e avaliações. A IA deixa de ser uma camada conversacional e vira memória operacional. Essa mudança é pequena na interface e enorme na conta.
Para PMs, founders e executivos, a consequência é desconfortável porque quebra duas crenças convenientes ao mesmo tempo.
A primeira é que basta plugar uma API boa e esperar a vantagem aparecer.
A segunda é que modelo próprio é sempre vaidade técnica.
O caso do iFood mostra uma região intermediária, mais difícil de explicar em reunião e mais importante para a estratégia: usar modelos genéricos onde eles são melhores, construir inteligência vertical onde o contexto proprietário muda custo, qualidade e conversão.
O próximo ciclo de IA em produto provavelmente será menos sobre quem tem o chat mais impressionante e mais sobre quem sabe onde a inteligência precisa estar. Em alguns produtos, ela vai continuar fora, alugada por chamada. Em outros, vai precisar entrar no fluxo, aprender com o comportamento real e carregar a memória que nenhum fornecedor externo tem.
A parte incômoda é que muita empresa só vai descobrir a diferença depois de transformar a própria margem em experimento, e isso já está acontecendo.
🔗 Construa uma carreira à prova do futuro, liderando produtos mais inteligentes e eficientes com IA. Acesse: https://go.pm3.com.br/ProductGurus-AI-Specialist
Cupom de 10%: PRODUCTGURUS
Ouça o episódio sobre iFood e Inteligência Artificial aqui:
