Phi-4-reasoning-vision e as lições do treinamento de um modelo multimodal de raciocínio
Microsoft Research: Blog detalhando arquitetura e processo de treinamento do Phi-4-reasoning-vision-15B.
|
05/03 às 09:00
Pontos principais
- Arquitetura mid-fusion combina SigLIP-2 com Phi-4 Reasoning
- Treinado principalmente com dados open-source e curadoria multietapas
Mencionado nesta matéria
Organizações
MicrosoftMicrosoft Research
Lugares
Redmond, Washington
