DeepSeek lança modelo de IA “topo de linha” um ano depois de chocar o mundo
A DeepSeek, startup chinesa de IA, lançou novas versões de seu modelo de inteligência artificial, V4 Flash e V4 Pro, prometendo desempenho de ponta e baixo custo, intensificando a concorrência com gigantes como OpenAI e Anthropic, enquanto enfrenta acusações de uso de hardware e técnicas proibidas.
|
24/04 às 11:35
Pontos principais
- A DeepSeek lançou as séries V4 Flash e V4 Pro, seu novo modelo de IA, um ano após o sucesso do R1.
- Os novos modelos são descritos como a "plataforma open source mais poderosa do mercado", com avanços em raciocínio e agentes autônomos.
- A tecnologia inclui uma Hybrid Attention Architecture e uma janela de contexto ampliada para 1 milhão de tokens.
- O V4 Pro utiliza a técnica Mixture-of-Experts, resultando em custos de inferência significativamente mais baixos que os concorrentes.
- A DeepSeek admite limitações de infraestrutura, mas espera redução de custos com a entrada em operação de clusters com chips Ascend 950 da Huawei.
- A empresa está em negociações com Tencent e Alibaba para sua primeira rodada de captação com investidores externos.
- Autoridades dos EUA acusam a DeepSeek de usar técnicas de "destilação" e acesso a chips Nvidia proibidos para a China.
Mencionado nesta matéria
Pessoas
Vey-Sern Ling (diretor-gerente do Union Bancaire Privée)
Organizações
DeepSeekOpenAIAnthropicHugging FaceHuawei Technologies Co.TencentAlibabaMiniMaxUnion Bancaire PrivéeBaiduByteDanceZhipuNvidiaGoogle
Lugares
Vale do SilícioHangzhouChinaMongólia InteriorEUA

