Modelo terá ~1 trilhão de parâmetros MoE com janela de 1M tokens; preço do Ascend 950PR da Huawei subiu 20%.
A DeepSeek adiou o lançamento do V4 — modelo com aproximadamente 1 trilhão de parâmetros em arquitetura MoE e janela de 1 milhão de tokens — para garantir compatibilidade com os chips Huawei, excluindo NVIDIA e AMD do acesso antecipado. A decisão quebra a convenção da indústria.
O preço do chip Ascend 950PR da Huawei subiu 20% com pedidos em massa de Alibaba, ByteDance e Tencent. A DeepSeek trabalha diretamente com Huawei e Cambricon Technologies para reescrever partes do código do modelo para otimização no hardware doméstico chinês.
Help Apiyi • 3 abr, 09:00
Thechinaacademy • 3 abr, 09:00
Theinformation • 3 abr, 09:00
29 mar, 09:00
25 mar, 09:00
7 mar, 09:00
2 mar, 15:30
1 mar, 13:19