O Sagemaker agora oferece o Tensorrt-Llm da NVIDIA como parte da mais recente versão do LMI DLC (0,25.0), permitindo otimizações de ponta como Smoothquant, FP8 e lotes contínuos para LLMs ao usar o NVIDIA GPUS.
Hoje, a Amazon Sagemaker lança uma nova versão (0.25.0) de contêineres de aprendizado profundo (LMI) do modelo de grande inferência (DLCs) e adiciona suporte à biblioteca Tensorrt-Llm da NVIDIA.Os DLCs do Sagemaker LMI agora suportam as mais recentes técnicas de quantização, incluindo modelos pré-Quantizados com GPTQ, quantização de peso com reconhecimento de ativação (AWQ) e quantização just-in-time como Smoothquant.Para obter instruções e tutoriais sobre o uso de DLCs do Sagemaker LMI, consulte o paralelismo do modelo e a grande inferência do modelo e nossa lista dos DLCs LMI do Sagemaker disponível.Além disso, você pode usar as mais recentes técnicas de quantização – GPTQ, AWQ e Smoothquant – que estão disponíveis com DLCs LMI.
Trending posts dos últimos 30 dias
-
Supernic NVIDIA Connectx-8 de próxima geração para redes de 800 Gbps
25 de novembro de 2024By Auto News Bot | 0 Comments -
Biblioteca Python Crypto Atualizada para roubar chaves particulares
23 de novembro de 2024By Auto News Bot | 0 Comments -
Diretor de Ciências Aplicadas da AWS sobre por que o Gen Ai precisa de raciocínio automatizado
3 de dezembro de 2024By Auto News Bot | 0 Comments -
O CURL remove o back -end experimental HTTP em rust
21 de dezembro de 2024By Auto News Bot | 0 Comments
3D ARM BSD BSDDAY ChatGPT CoC conferências containers debian Desktop Environment Documentação emacs eventos FLISOL FreeBSD Free Software Foundation games GDPR jogos joomla KDE linux Linux-BR LISP Mail malware Microsoft Mozilla NVIDIA open source PGP Privacidade python RISC segurança software livre suse ubuntu União Européia virtualização VPN Vulkan vulnerabilidade Windows youtube
Comentários
Nenhum comentário para mostrar.
- dezembro 2024
- novembro 2024
- outubro 2024
- setembro 2024
- agosto 2024
- julho 2024
- junho 2024
- maio 2024
- abril 2024
- março 2024
- fevereiro 2024
- janeiro 2024
- dezembro 2023
- novembro 2023
- outubro 2023
- setembro 2023
- agosto 2023
- julho 2023
- junho 2023
- maio 2023
- abril 2023
- janeiro 2023
- novembro 2022
- junho 2022
- janeiro 2022
- abril 2021
- outubro 2020
- setembro 2020
- agosto 2020
- junho 2020
- abril 2020
- fevereiro 2020
- janeiro 2020
- abril 2019
- março 2019
- fevereiro 2019
- dezembro 2018
- novembro 2018
- outubro 2018
- setembro 2018
- agosto 2018
- julho 2018
- junho 2018
- maio 2018
- abril 2018