Usaremos a métrica MMLU, que possui exemplos de dados de teste suficientes (acima de 14K) e no qual o modelo mixtral tem um desempenho muito bom (precisão de 70,6%), mas não muito bem.Implantamos o VLLM em muitas configurações: 2, 4 e 8 GPUs (paralelismo do tensor).Multiplicamos os QPs resultantes por 4, 2 e 1, respectivamente.Implantamos o serviço Fireworks LLM usando muitas configurações diferentes e, semelhante ao VLLM, mostramos números apenas da configuração vencedora.Outros métodos como Smoothquant e AWQ tentam melhorar o desempenho de um modelo, mas ainda ficam aquém, especialmente durante a geração.
Trending posts dos últimos 30 dias
-
A nova distração da KDE: OS Linux imutável baseado em BTRFS, com Flatpak e Snap
2 de novembro de 2024By Auto News Bot | 0 Comments -
Animando vídeos usando transições CSS e folhas de sprite
5 de novembro de 2024By Auto News Bot | 0 Comments -
Esta semana no plasma KDE: tudo o que você queria e mais
9 de novembro de 2024By Auto News Bot | 0 Comments
3D ARM BSD BSDDAY ChatGPT CoC conferências containers debian Desktop Environment Documentação emacs eventos FLISOL FreeBSD Free Software Foundation games GDPR jogos joomla KDE linux Linux-BR LISP Mail malware Microsoft Mozilla NVIDIA open source PGP Privacidade python RISC segurança software livre suse ubuntu União Européia virtualização VPN Vulkan vulnerabilidade Windows youtube
Comentários
Nenhum comentário para mostrar.
- novembro 2024
- outubro 2024
- setembro 2024
- agosto 2024
- julho 2024
- junho 2024
- maio 2024
- abril 2024
- março 2024
- fevereiro 2024
- janeiro 2024
- dezembro 2023
- novembro 2023
- outubro 2023
- setembro 2023
- agosto 2023
- julho 2023
- junho 2023
- maio 2023
- abril 2023
- janeiro 2023
- novembro 2022
- junho 2022
- janeiro 2022
- abril 2021
- outubro 2020
- setembro 2020
- agosto 2020
- junho 2020
- abril 2020
- fevereiro 2020
- janeiro 2020
- abril 2019
- março 2019
- fevereiro 2019
- dezembro 2018
- novembro 2018
- outubro 2018
- setembro 2018
- agosto 2018
- julho 2018
- junho 2018
- maio 2018
- abril 2018