AGÊNCIA DE INTELIGÊNCIA EM NOTÍCIAS
ELOVIRAL
E
Voltar
Hardware11 de março de 2026 às 16:323 leituras

NVIDIA FP4 permite rodar modelos de 70B parâmetros em GPU única

A NVIDIA disponibilizou a quantização NVFP4 para GPUs da série RTX 50 Blackwell. A compressão para aproximadamente 4,5 bits efetivos reduz a necessidade de VRAM em 3,5 vezes comparado ao FP16. Em testes práticos, modelos que antes exigiam clusters multi-GPU agora rodam em uma única placa de vídeo com perda mínima de qualidade. A tecnologia é um marco para democratizar o acesso a modelos de linguagem de grande escala.

Relacionados

1