IA chinesa DeepSeek corta preço de tokens em 75% no modelo V4‑Pro
O chatbot de inteligência artificial (IA) DeepSeek acirrou a concorrência no mercado em termos de preço. Nos últimos dias, a plataforma anunciou um corte agressivo de preços para a utilização de tokens de um dos seus mais recentes modelos de linguagem.
A medida afeta o V4‑Pro, que estava em fase promocional com 75% de desconto pelo uso. A partir de 31 de maio de 2026, quando ele voltaria ao valor original, os preços serão mantidos de forma permanente no valor da oferta.
Os valores agora definitivos do DeepSeek são os seguintes:
- Entrada de dados (em acerto de cache): de 0,0145 para US$ 0,003625 por 1 milhão de tokens;
- Entrada de dados (em falha de cache): de US$ 1,74 para US$ 0,435 por 1 milhão de tokens;
- Saída de dados: de US$ 3,48 para US$ 0,87 por 1 milhão de tokens.
Os valores dizem respeito aos pedidos feitos para o modelo de linguagem e os respectivos conteúdos produzidos pela IA. Os tokens são as unidades fundamentais de dados de um LLM, usados para processar e gerar informações — eles não correspondem exatamente a uma palavra ou letra.
The DeepSeek-V4-Pro discount has been extended until May 31, 2026, 15:59 UTC! https://t.co/aCdTC9CUkA pic.twitter.com/kd0taLhZhH
— DeepSeek (@deepseek_ai) April 29, 2026
As IAs cobram pelo volume de tokens movimentados nas interações, já que todo o processo exige grande poder de processamento. Tarefas que demandam maior esforço, como em programação e ações agênticas, tendem a ser as que mais geram gastos.
Há ainda uma grande diferença no valor de input (entrada de tokens): o acerto de cache significa que o chatbot já tinha o conteúdo solicitado gerado ou reutilizou dados previamente processados em uma resposta, enquanto o erro de cache é mais caro por envolver a geração desse conteúdo a partir dos conhecimentos daquela IA pela primeira vez.
O que o desconto do DeepSeek significa para o mercado
O DeepSeek já havia movimentado o setor de IA uma vez: quando foi lançado em janeiro de 2025, o chatbot chinês causou espanto pelo custo computacional inferior em treinamento em comparação com modelos ocidentais, ainda bastante custosos para operar.
A nova movimentação pode gerar reações parecidas: atualmente, plataformas de IA estão em uma fase de restrição de limites de tokens ou aumento de preços pelo uso da API, dado o modelo de negócios ainda pouco sustentável de algumas dessas companhias e os altos custos com data centers.
Para efeitos de comparação, o GPT-5.5 da OpenAI custa até US$ 5 por 1 milhão de tokens de entrada de dados e até US$ 30 no resultado. Já os preços do Claude Code subiram tanto que fizeram até mesmo a Microsoft cancelar licenças de uso interno do serviço.
O DeepSeek pode em breve atingir um valor de mercado de US$ 50 bilhões, muito após a revelação dos novos modelos V4. Tanto a versão Flash de baixo custo quanto a Pro rodam a partir de chips Ascend de alto desempenho da Huawei, reduzindo a dependência das burocráticas encomendas da Nvidia, já com muita demanda e com restrições devido às tensões comerciais entre China e EUA.
Quer ficar informado sobre as principais novidades do mercado de IA? Acesse a seção especial sobre o tema no site do TecMundo!





COMENTÁRIOS