Microsoft lança Phi-4-reasoning-vision-15B, mo...

Pontos principais

Phi-4-reasoning-vision-15B lançado como open-weight no HuggingFace e GitHub

15 bilhões de parâmetros com arquitetura mid-fusion SigLIP-2 + Phi-4

Três modos de pensamento: hybrid, think e nothink

Compete com modelos que exigem 10x mais computação

A Microsoft lançou o Phi-4-reasoning-vision-15B, modelo multimodal open-weight de 15 bilhões de parâmetros que combina o codificador de imagem SigLIP-2 com o Phi-4 Reasoning em uma arquitetura mid-fusion. O modelo processa tanto imagens quanto texto e oferece três modos de raciocínio: hybrid (padrão, o modelo decide), think (cadeia de raciocínio forçada) e nothink (saída direta).

O Phi-4-reasoning-vision compete com sistemas que exigem 10 vezes mais computação, destacando-se em raciocínio matemático e científico, interpretação de gráficos, leitura de documentos e compreensão de interfaces gráficas. Disponível no HuggingFace, GitHub e Microsoft Foundry sob licença permissiva.

Microsoft lança Phi-4-reasoning-vision-15B, modelo open-weight que compete com sistemas 10x maiores

Pontos principais

Fontes

Microsoft criou Phi-4-reasoning-vision-15B para saber quando pensar — e quando não pensar

Phi-4-reasoning-vision e as lições do treinamento de um modelo multimodal de raciocínio

Leia também

Microsoft lança MAI-Thinking-1, primeiro grande modelo de raciocínio treinado do zero pela empresa

Anthropic lança Claude Opus 4.7 com 87,6% no SWE-bench Verified

Microsoft lança três modelos próprios de IA: transcrição, voz e imagem

Nvidia revela GPU Vera Rubin na GTC e projeta $1 trilhão em pedidos de chips

DeepSeek V4 lança na próxima semana: modelo de 1 trilhão de parâmetros otimizado para chips chineses

Comentários

Microsoft lança Phi-4-reasoning-vision-15B, modelo open-weight que compete com sistemas 10x maiores

Pontos principais

Fontes

Microsoft criou Phi-4-reasoning-vision-15B para saber quando pensar — e quando não pensar

Phi-4-reasoning-vision e as lições do treinamento de um modelo multimodal de raciocínio

Leia também

Microsoft lança MAI-Thinking-1, primeiro grande modelo de raciocínio treinado do zero pela empresa

Anthropic lança Claude Opus 4.7 com 87,6% no SWE-bench Verified

Microsoft lança três modelos próprios de IA: transcrição, voz e imagem

Nvidia revela GPU Vera Rubin na GTC e projeta $1 trilhão em pedidos de chips

DeepSeek V4 lança na próxima semana: modelo de 1 trilhão de parâmetros otimizado para chips chineses

Comentários