linux-BR.org

Notícias de software livre e tecnologias

Há também o ponto de que os servidores terão latência, mas, em vez de contabilizar isso, a NVIDIA mostrou seu desempenho na taxa de transferência, não imitando a situação do mundo real, de acordo com a AMD.Além disso, a NVIDIA usou o tipo de dados de desempenho de desempenho VLLM FP16 na AMD enquanto comparava seus resultados com o DGX-H100, que usou o Tensorrt-llm com o FP8 Datatype para exibir esses supostos resultados mal interpretados.A AMD fez três execuções de desempenho usando o Tensorrt-Llm da NVIDIA, o último notável que mediu os resultados de latência entre Mi300x e VLLM usando o conjunto de dados FP16 contra o H100 com Tensorrt-llm.A AMD enfatizou que, em seu teste, usou o VLLM com o conjunto de dados FP16 devido ao seu uso generalizado e a VLLM não suporta FP8.Enviaremos notícias de última hora e análises aprofundadas de CPUs, GPUs, AI, hardware fabricante e mais direto para sua caixa de entrada.

Fonte: https://www.tomshardware.com/pc-components/gpus/amd-strikes-back-at-nvidia-with-new-mi300x-benchmarks-mi300x-shows-30-higher-performance-than-h100-even-with-an-optimized-software-stack