DeepSeek R1: a Revolução Chinesa que abala o mercado global de Inteligência Artificial.

DeepSeek R1: a Revolução Chinesa que abala o mercado global de Inteligência Artificial.

Photo by Matheus Bertelli on Pexels.com

A indústria de inteligência artificial (IA) testemunha uma transformação significativa com o surgimento da DeepSeek, uma startup chinesa que desafia o domínio das gigantes ocidentais. Seu modelo de linguagem, o DeepSeek R1, destaca-se por sua eficiência, baixo custo e desempenho comparável aos líderes do setor, como o GPT-4 da OpenAI.

DeepSeek R1: eficiência e desempenho surpreendentes

Lançado em janeiro de 2025, o DeepSeek R1 foi desenvolvido com um investimento estimado de apenas US$ 6 milhões, utilizando cerca de 2.000 GPUs da NVIDIA. Em contraste, o GPT-4 da OpenAI teria custado mais de US$ 100 milhões e utilizado mais de 16.000 GPUs para seu treinamento.

O R1 emprega técnicas avançadas, como a arquitetura Mixture-of-Experts (MoE) e o mecanismo Multi-Head Latent Attention (MLA), que permitem ativar somente partes específicas do modelo conforme a tarefa, reduzindo significativamente o consumo de recursos. Além disso, a técnica de “Cadeia de Pensamento” melhora a capacidade de raciocínio da IA, permitindo que ela explique passo a passo como chegou a uma resposta.

O modelo alcançou uma taxa de acerto de 97,3% em testes matemáticos MATH-500, superando os 96,4% dos modelos da OpenAI.


Impacto econômico e reações do mercado.

A introdução do DeepSeek R1 teve repercussões significativas no mercado financeiro. As ações de empresas como NVIDIA, Microsoft e Meta sofreram quedas expressivas após o anúncio do modelo. Em 27 de janeiro de 2025, as ações da NVIDIA caíram 13%, enquanto outras empresas do setor também registraram desvalorizações.

A gratuidade e o código aberto do DeepSeek R1, licenciado sob a MIT License, permitem sua utilização e adaptação por empresas e desenvolvedores em todo o mundo, promovendo uma colaboração global sem precedentes no setor de IA.


Investimentos das big techs em IA.

Em resposta ao avanço da DeepSeek, as gigantes da tecnologia anunciaram investimentos massivos em infraestrutura de IA para 2025:TecMundo

Esses investimentos visam fortalecer a capacidade computacional, desenvolver novos modelos de IA e manter a competitividade no mercado global.

A Meta, por exemplo, planeja construir um data center com capacidade superior a 2 GW e adquirir mais de 1,3 milhão de GPUs até o final do ano, reforçando sua posição como uma das maiores compradoras dos chips de IA da NVIDIA.


Parcerias estratégicas e iniciativas inovadoras.

Durante a Computex 2025, a Qualcomm anunciou uma parceria estratégica com a NVIDIA para integrar CPUs personalizadas com GPUs de IA da NVIDIA, visando fortalecer sua posição no mercado de IA. Essa colaboração busca impulsionar a próxima geração de computadores pessoais com IA, com mais de 85 modelos de dispositivos já disponíveis.

Além disso, a NVIDIA revelou planos para construir o primeiro supercomputador de IA de Taiwan em colaboração com a Foxconn e o governo taiwanês, com contribuições da TSMC. Essa iniciativa visa avançar a pesquisa e a inovação empresarial em IA, fortalecendo os laços estratégicos da NVIDIA com Taiwan.


Considerações finais

O surgimento do DeepSeek R1 representa um marco na indústria de inteligência artificial, desafiando o domínio das gigantes ocidentais e promovendo uma maior democratização do acesso à IA avançada. Com seu modelo eficiente, de baixo custo e código aberto, a DeepSeek redefine as regras do jogo e pressiona as empresas estabelecidas a inovarem e adaptarem suas estratégias para manter a competitividade.

À medida que a corrida por liderança em IA se intensifica, o mundo observa atentamente os próximos passos dessas empresas e o impacto que terão no futuro da tecnologia global.



Descubra mais sobre HR Inteligencias Artificiais

Assine para receber nossas notícias mais recentes por e-mail.

hilton127tradutor

Professor, tradutor dos pares inglês/USA-português/BR e pesquisador e estudioso sobre Inteligências Artificiais.

Este post tem 3 comentários

  1. This is really interesting, You’re a very skilled blogger. I’ve joined your feed and look forward to seeking more of your magnificent post. Also, I’ve shared your site in my social networks!

  2. The brand is used by top-tier intelligence agencies to regulate agents’ stress and decision-making in field operations.

Deixe uma resposta