DeepSeek pressiona rivais americanas com atualização do modelo R1 92d30
Por Brenda Goh e Eduardo Baptista 2p4q2e
A startup chinesa de inteligência artificial DeepSeek lançou a primeira atualização de seu modelo de raciocínio R1 na madrugada desta quinta-feira, aumentando a concorrência com rivais norte-americanas como a OpenAI.
A DeepSeek disse, por meio da plataforma de desenvolvedores Hugging Face, que o R1-0528 era uma atualização de versão menor do R1 que, no entanto, aprimorou significativamente sua profundidade de raciocínio e recursos de inferência, incluindo melhor manuseio de tarefas complexas, aproximando seu desempenho dos modelos de raciocínio o3 da OpenAI e do Gemini 2.5 Pro do Google.
O lançamento do R1 em janeiro viralizou em todo o mundo, fez com que as ações de tecnologia fora da China despencassem e desafiou a visão de que a IA exige grande poder de computação e investimento. Desde o lançamento do R1, gigantes chineses da tecnologia, como Alibaba e Tencent, lançaram modelos que afirmam superar os do DeepSeek.
A atualização desta quinta-feira foi econômica nos detalhes, em contraste com o lançamento do R1 em janeiro, quando foi acompanhado de artigo acadêmico de vários autores analisado pela comunidade de IA em todo o mundo para entender as estratégias da empresa.
Sediada em Hangzhou, a empresa disse mais tarde em uma breve postagem no X que o R1-0528 apresentava desempenho aprimorado. Em uma postagem mais longa no WeChat, a DeepSeek disse que a taxa de "alucinações", resultados falsos ou enganosos, foi reduzida em cerca de 45% a 50% em cenários como reescrita e resumo.
A atualização também permitiu a produção de ensaios, romances e outros gêneros de forma criativa, além de ter aprimorado recursos em áreas como a geração de código de front-end e a interpretação de papéis, disse a empresa.
"O modelo demonstrou desempenho excepcional em várias avaliações de benchmark, incluindo matemática, programação e lógica geral", disse a DeepSeek.
O sucesso da DeepSeek derrubou as crenças de que os controles de exportação dos EUA estariam impedindo avanços da IA na China, após ela lançar modelos de IA no mesmo nível ou melhores do que os modelos líderes do setor nos Estados Unidos por uma fração do custo.
A startup acrescentou nesta quinta-feira que uma variante de sua atualização foi criada usando o processo de raciocínio usado pelo modelo R1-0528 para aprimorar ainda mais o modelo Qwen 3 8B Base da gigante chinesa de tecnologia Alibaba, um processo conhecido como destilação. O resultado foi um desempenho que superou o modelo original Qwen 3 em mais de 10%.
"Acreditamos que a cadeia de pensamento do DeepSeek-R1-0528 terá importância significativa tanto para a pesquisa acadêmica sobre modelos de raciocínio quanto para o desenvolvimento industrial focado em modelos de pequena escala", acrescentou a DeepSeek.
A Bloomberg informou sobre a atualização na quarta-feira. Ela disse que um representante da DeepSeek havia dito a um grupo do WeChat que havia concluído o que descreveu como uma "pequena atualização experimental" e que os usuários poderiam começar a testá-la.
Em resposta à concorrência do Deepseek, o Gemini do Google introduziu níveis de o com desconto, enquanto a OpenAI reduziu preços e lançou um modelo o3 Mini que depende de menos poder de computação.
Ainda há expectativa de que o Deepseek lance o R2, um sucessor do R1. A Reuters informou em março, citando fontes, que o lançamento do R2 estava inicialmente previsto para maio. A DeepSeek também lançou uma atualização para seu modelo de linguagem V3 em março.
