Wikipédia sitiada: inteligência artificial ameaça sua sustentabilidade

Na era da inteligência artificial, a Wikipédia enfrenta um paradoxo perturbador: embora seu conteúdo seja mais consultado do que nunca, sua sustentabilidade está em risco. As IAs consomem massivamente seus dados, mas os usuários humanos interagem cada vez menos com a plataforma. Esse desequilíbrio coloca em xeque um projeto que, sem publicidade ou recursos públicos, depende exclusivamente de doações para sobreviver.

“Nosso conteúdo é gratuito, nossa infraestrutura não”

Por: Gabriel E. Levy B.

Desde a sua criação em 2001, a Wikipédia se estabeleceu como a enciclopédia livre mais consultada do mundo. Seu modelo colaborativo e sem fins lucrativos, gerenciado pela Wikimedia Foundation, tem sido financiado principalmente por pequenas doações de usuários e contribuições de algumas empresas de tecnologia.

No entanto, a ascensão da inteligência artificial perturbou esse equilíbrio. Desde janeiro de 2024, o consumo de largura de banda da Wikipédia aumentou 50%, principalmente devido a bots automatizados que extraem dados para treinar modelos de IA. Esses bots acessam conteúdo multimídia e páginas menos frequentadas, contornando os sistemas de cache e gerando altos custos nos data centers.

Rebecca MacKinnon, vice-presidente de defesa global da Wikimedia Foundation, expressou preocupação: “Nosso conteúdo é gratuito, nossa infraestrutura não”. A crescente pressão da IA sobre os recursos técnicos da Wikipédia ameaça sua viabilidade como uma plataforma de conhecimento livre

O paradoxo do tráfego: mais consultas, menos usuários

Apesar do aumento no consumo de dados, a Wikipédia experimentou um declínio no número de visitantes humanos. De acordo com dados da Similarweb, em março de 2025, Wikipedia.org recebeu 500 milhões de visitas a menos do que ChatGPT.com. Nos últimos três anos, perdeu mais de 1.100 milhões de visitas mensais, uma queda de 22,7%.

Essa redução não é isolada: em janeiro de 2022, a Wikipédia acumulou aproximadamente 4.900 milhões de visitas mensais, mas em março de 2025 esse número caiu para menos de 3.800 milhões. Paralelamente, as plataformas de IA experimentaram um crescimento vertiginoso.

Só o ChatGPT, no mesmo período, passou de menos de 600 milhões de visitas mensais para mais de 4.300 milhões, uma expansão de mais de 600%.

Esse fenômeno se deve ao fato de que os usuários agora acessam informações por meio de interfaces de IA, como ChatGPT ou assistentes virtuais, que consultam a Wikipedia em segundo plano sem que o usuário interaja diretamente com a plataforma.

Além disso, de acordo com o relatório DataReportal, 62% dos usuários on-line globais preferem receber respostas instantâneas por meio de mecanismos de pesquisa de conversação ou aplicativos de inteligência artificial, em vez de visitar sites tradicionais.

Como resultado, embora o conteúdo da Wikipédia seja mais amplamente utilizado do que nunca, a interação direta com a página diminui drasticamente, enfraquecendo os mecanismos que permitem seu financiamento e participação da comunidade, afetando as doações e o envolvimento da comunidade.

Quem paga pelo conhecimento gratuito?

O modelo da Wikipédia, baseado em colaboração e doações, enfrenta um desafio sem precedentes. Grandes empresas de tecnologia, como OpenAI e Google, usam massivamente seu conteúdo para treinar modelos de IA, mas suas contribuições financeiras são limitadas.

Em 2019, o Google doou US$ 3,1 milhões para a Wikimedia Foundation e forneceu ferramentas de aprendizado de máquina para facilitar a criação de conteúdo. No entanto, essas contribuições não compensam o custo crescente do tráfego gerado pela IA. A Wikimedia Foundation lançou o Wikimedia Enterprise, um serviço comercial para empresas que exigem acesso em massa aos seus dados, mas até agora apenas o Google concordou em pagar por esse serviço.

A falta de compensação justa por parte das empresas que lucram com o conteúdo da Wikipédia levanta questões sobre a sustentabilidade do modelo de conhecimento livre na era da inteligência artificial.

Estudos de caso: o impacto da IA na Wikipédia

O aumento do tráfego gerado pela IA não apenas aumenta os custos de infraestrutura, mas também afeta a qualidade do conteúdo.

Um estudo recente revelou que mais de 5% dos novos artigos em inglês contêm trechos gerados por inteligência artificial, que muitas vezes são tendenciosos, erros factuais ou projetados para fins promocionais secretos

Em muitos casos, esses textos automatizados acabam deslocando as contribuições humanas mais rigorosas, gerando um efeito de saturação de informações que complica a verificação editorial dentro da própria comunidade. Editores voluntários alertam que, devido ao crescente volume de entradas suspeitas, o processo de revisão manual tornou-se quase insustentável, especialmente em idiomas menos monitorados, como sueco, cebuano ou waray-waray, onde os bots automatizados proliferam há anos.

Além disso, a Wikimedia Foundation observou que os bots de IA consomem 65% dos recursos técnicos mais caros, incluindo largura de banda, armazenamento redundante e processamento de solicitações por meio de APIs complexas, apesar de representarem apenas 35% do total de visualizações de página.

Essa desproporção não apenas aumenta os custos operacionais, mas também diminui o desempenho geral do sistema para usuários humanos, aumentando a pressão sobre uma infraestrutura financiada quase inteiramente por doações individuais.

A situação é tal que, durante os picos de tráfego gerados pela IA, foram relatadas interrupções temporárias em projetos irmãos como Wikimedia Commons e Wikidata, afetando pesquisadores e editores que dependem dessas plataformas para a criação de novos conteúdos livres.

Em resposta, a Wikimedia Foundation lançou um conjunto de dados estruturado no Kaggle, sob licenças de reutilização aberta, com o objetivo de facilitar o treinamento de modelos de IA sem sobrecarregar seus servidores.

Este pacote de dados tenta canalizar parte do tráfego automatizado para fontes mais sustentáveis, reduzindo a necessidade de rastreamento constante e em tempo real.

No entanto, essa medida, embora tecnicamente útil, representa apenas um remendo temporário contra a magnitude do problema.

Não resolve o ponto crítico: a ausência de uma política global de compensação econômica por empresas de tecnologia que usam massivamente o conteúdo da Wikipédia como fonte primária.

De acordo com a plataforma Online Queso, apenas uma fração das empresas que se beneficiam direta ou indiretamente do conhecimento livre hospedado na Wikipédia contribuíram financeiramente para a manutenção do projeto.

A lógica “tudo de graça” que rege a relação entre IA e conhecimento comum pode estar se aproximando de seu ponto de ruptura.

Em conclusão, a Wikipédia está em uma encruzilhada crítica.

Embora seu conteúdo seja mais consultado por IAs do que nunca, seu modelo de financiamento baseado em doações enfrenta sérias ameaças.

Para garantir a sustentabilidade do conhecimento livre, é imperativo que as grandes empresas de tecnologia assumam a responsabilidade proporcional ao uso dessa fonte inestimável de informações.