IA Generativa: A Bolha Desinfla - Andina Link Virtual Expo

A famosa empresa Starbucks retirou seu sistema inteligente de estoque de mais de onze mil cafeterias nos Estados Unidos, basicamente porque não sabia distinguir um leite integral de outro tipo.

A Uber acabou confessando recentemente que gastou o orçamento anual para inteligência artificial em apenas quatro meses.

E a Microsoft acabou de pedir aos seus próprios engenheiros que parassem de usar o Claude Code porque a conta estava ficando inpaga.

A euforia corporativa em relação à IA acabou?

Por: Gabriel E. Levy B.

A história do Starbucks soa quase como uma comédia negra.

Em setembro de 2025, a rede de cafés especiais anunciou com orgulho um acordo com a NomadGo, uma startup de Washington fundada por um ex-executivo da Microsoft.

A promessa parecia imbatível. Baristas apontariam um tablet para as prateleiras e um sistema de visão computacional contaria todo o estoque oito vezes mais rápido que um humano, com noventa e nove por cento de precisão.

A empresa o implantou em mais de onze mil lojas norte-americanas, embora tenha percebido que desde o primeiro dia algo estava errado.

O próprio vídeo promocional da empresa mostrou o sistema falhando em reconhecer uma garrafa de xarope de hortelã-pimenta enquanto contava as garrafas vizinhas. Estava lá, à vista de todos. Eles nem se deram ao trabalho de esconder, só acharam que era um bug menor que os engenheiros da desenvolvedora poderiam corrigir logo.

Em janeiro de 2026, a Reuters publicou uma investigação devastadora.

Entrevistas com baristas, vídeos de erros, fotos vazadas.

Um funcionário com treze anos na rede, Jake Domey, disse que em sua loja eles jogaram fora três sacos inteiros de lixo cheios de comida devido ao excesso de estoque, ou seja, porque a Inteligência Artificial pediu suprimentos que as lojas realmente não precisavam.

O maior desperdício que Domey viu em toda a sua carreira, nem mesmo um novato com dias de treinamento cometeria um erro desse nível.

O motivo? As garrafas de xarope Torani são idênticas, com rótulos de cores diferentes.

Leite integral, desnatado e de aveia vêm em quase os mesmos recipientes brancos.

O que em uma demonstração com luz perfeita parecia ficção científica, na escuridão da cafeteria às sete da manhã, com um barista apressado, confundia sistematicamente os produtos disponíveis, criando faltas em alguns produtos e em outros em saturação de estoques.

Em 18 de maio de 2026, um boletim interno informou que eles haviam decidido retirar definitivamente o sistema de inteligência artificial que incorporaram para controlar os inventários e, em menos de três dias, a notícia se espalhou rapidamente pela imprensa internacional.

A explicação oficial falava de padronização e consistência.

A realidade, segundo os próprios funcionários, era mais simples: a ferramenta nunca funcionou.

O outro calcanhar de Aquiles são os tokens

Antes de entender por que o projeto saiu do controle para Uber, Microsoft e outros, é preciso entender uma palavra que quase ninguém fora do mundo tecnológico conhece: token.

Um token é a unidade mínima com a qual modelos de inteligência artificial contabilizam o trabalho que realizam. Não é exatamente uma palavra ou uma letra. É algo no meio, um pequeno pedaço de texto.

A palavra olá pode ser um único token. A palavra hipopótamo pode ser dividida em dois ou três. Uma frase completa, em quinze ou vinte. Toda vez que um engenheiro pergunta algo ao Claude, ChatGPT ou qualquer outro modelo, os tokens que entram (a pergunta) e os tokens que saem (a resposta) são contados. E por cada um você paga.

O problema é que as ferramentas modernas, aquelas que chamam de agentes, não respondem com uma única frase e ficam silenciosas. Eles trabalham sozinhos por horas. Eles leem arquivos inteiros, tentam opções, se corrigem, começam do zero.

Uma única consulta pode consumir centenas de milhares de tokens.

Aí está a armadilha que ninguém esperava. Quanto mais útil a ferramenta se tornar, mais engenheiros a utilizam. Quanto mais eles usam, mais tokens consomem. Quanto mais tokens eles consomem, maior a nota. A promessa original era exatamente o oposto. Mais IA, menos custos. Mas a matemática simbólica decidiu se rebelar contra o Script.

A Uber gastou o orçamento de um ano em quatro meses

Em meados de abril, o The Information publicou uma entrevista com Praveen Neppalli Naga, diretor de tecnologia da empresa. O que ele disse deixou mais de um CFO no Vale do Silício sem resposta.

A Uber implementou o Claude Code, a ferramenta de agendamento com IA da Anthropic, em dezembro de 2025.

Em março, oitenta e quatro por cento de seus 5.000 engenheiros já o utilizavam. Setenta por cento de todo o código enviado ao sistema veio de máquinas, não de humanos. Parece um sonho de produtividade realizado.

Mas então chegaram as contas. O engenheiro médio gastava entre cento e cinquenta a duzentos e cinquenta dólares por mês. Os usuários mais intensivos consumiram entre quinhentos e dois mil dólares cada.

O próprio Naga gastou $1.200 em uma única sessão demo de duas horas. Sim, mil e duzentos dólares. Duas horas.

A frase que ele repetiu para a jornalista Laura Bratton resume tudo. Ele voltou à estaca zero porque o orçamento que achava que precisava para o ano inteiro já tinha sido esgotado.

O mais curioso sobre o caso é que a Uber tinha consumo gamificado.

Havia rankings internos que classificavam os engenheiros pela quantidade de inteligência artificial usada. Eles literalmente transformaram gastos descontrolados em um jogo com um pódio. E então ficaram chocados ao ficar sem dinheiro.

Eles não estão sozinhos.

A Meta criou um painel interno chamado Claudeonomics, onde mais de oitenta e cinco mil funcionários competiam para ser o rei do consumo de tokens, com apelidos como Token Legend ou Cache Wizard.

O usuário principal queimou duzentos e oitenta e um bilhões de tokens em trinta dias. Nem Mark Zuckerberg nem o CTO entraram no top 250.

A Meta fechou o painel em até dois dias após o vazamento.

A Amazon, por sua vez, pressiona seus desenvolvedores a fazerem com que mais de oitenta por cento utilizem ferramentas de IA toda semana.

Os funcionários chamaram o fenômeno de tokenmaxxing e começaram a inflar artificialmente seu consumo apenas para cumprir métricas. Um estudo da empresa Jellyfish revelou algo devastador. Os usuários mais intensivos consomem dez vezes mais tokens que a média, mas alcançam apenas o dobro da produtividade.

O golpe final veio da Microsoft

E então, em 14 de maio, veio a bomba que realmente abalou o Vale do Silício. Tom Warren, do The Verge, revelou em sua newsletter que a Microsoft estava cancelando quase todas as licenças internas do Claude Code para engenheiros da divisão de Experiências e Dispositivos. Essa divisão é o que Windows, Office, Outlook, Teams e Surface fazem. Milhares de pessoas. O coração produtivo da empresa.

O prazo para migração para a ferramenta interna da Microsoft, GitHub Copilot CLI, é 30 de junho. Assim que o ano fiscal se encerra. Pura coincidência.

O detalhe mais suculento da questão é o paradoxo corporativo. Em novembro de 2025, a Microsoft anunciou um investimento de até cinco bilhões de dólares na Anthropic, criadora de Claude.

A mesma Microsoft que investiu cinco bilhões na empresa, seis meses depois, diz aos próprios funcionários para pararem de usar o produto porque ele custa muito caro.

O memorando interno assinado pelo Vice-Presidente Executivo Rajesh Jha vendeu a decisão com argumentos de unificação tecnológica. Fontes anônimas que falaram com o The Verge disseram o contrário. Há um componente financeiro que pesa muito, e muito.

O que ninguém quer reconhecer em voz alta

Bryan Catanzaro, vice-presidente de deep learning aplicado da Nvidia, empresa que vende os chips que alimentam toda essa loucura, disse à Axios em 26 de abril uma frase que se espalhou pelo mundo: Para sua equipe, o custo da computação está muito acima do custo dos funcionários.

Leia novamente: Ele é executivo sênior da Nvidia, a empresa que mais se beneficia do boom da inteligência artificial, admitindo que atualmente é mais caro usar IA do que pagar pessoas.

O Goldman Sachs, em seu relatório de 8 de maio, projetou que o consumo global de tokens aumentará vinte e quatro vezes até 2030.

A Gartner alertou que, embora o custo unitário por token caia noventa por cento no mesmo período, o custo total das empresas vai subir porque agentes de IA consomem entre cinco e trinta vezes mais tokens do que um chatbot normal.

As quatro grandes, Amazon, Microsoft, Alphabet e Meta, vão gastar setecentos e vinte e cinco bilhões de dólares em infraestrutura de IA só em 2026. Setenta e sete por cento a mais do que no ano passado.

E enquanto isso, em uma cafeteria em Connecticut, um barista conta xaropes com um lápis e um caderno.

Nos escritórios da Uber, um diretor de tecnologia retorna ao painel para recalcular.

Na Microsoft, milhares de engenheiros voltaram a programar manualmente porque é impossível continuar pagando muito por IA.

A inteligência artificial não está afundando. A Anthropic tem um faturamento de trinta bilhões de dólares por ano, seu crescimento é imparável. Mas a história que nos foi contada, de que a IA iria cortar custos e substituir trabalhadores sem suar, está passando por seu primeiro grande teste de realidade. E, por enquanto, os números não estão saindo como prometido.

Em resumo, três sucessos seguidos desinflam a promessa da inteligência artificial. A Starbucks aposentou seu estoque inteligente porque confundia leites com xaropes. A Uber gastou o orçamento anual de IA em quatro meses. A Microsoft cancelou as licenças Claude Code para seus próprios engenheiros porque a conta estava impagável. Até um vice-presidente da Nvidia admitiu que usar IA custa mais do que pagar humanos. A bolha mostra rachaduras.

Related Posts