Para implementações fortran de inferência para vários modelos GPT, consulte https://github.com/certik/fastgpt
O futuro da inferência do modelo LLM (e a inferência do modelo de fundação em geral) está em programas leves e dedicados, não mais abstração.Se você tiver problemas para executar alguma coisa ou ter comentários, sugestões, solicitações de recursos, etc., entre em contato ou abra um problema.Na máquina que usei (um Amazon EC2 com 8 núcleos e 32 GB de RAM, não pergunte), ela funciona muito lentamente (0,25 tok/s).Modelo de código aberto
Se você não quiser lidar com os jogos de licença da Meta, existem modelos de lhama de código aberto.Em seguida, execute manualmente especificando o tokenizer:
Llama2 de Meta
O extrato atual.py usa muita memória e não conseguiu encobrir o modelo LLAMA 7B em 32 GB de RAM.
Trending posts dos últimos 30 dias
-
Modelo de negócios de código aberto lutas no WordPress
11 de outubro de 2024By Auto News Bot | 0 Comments -
A nova distração da KDE: OS Linux imutável baseado em BTRFS, com Flatpak e Snap
2 de novembro de 2024By Auto News Bot | 0 Comments
3D ARM BSD BSDDAY ChatGPT CoC conferências containers debian Desktop Environment Documentação emacs eventos FLISOL FreeBSD Free Software Foundation games GDPR jogos joomla KDE linux Linux-BR LISP Mail malware Microsoft Mozilla NVIDIA open source PGP Privacidade python RISC segurança software livre suse ubuntu União Européia virtualização VPN Vulkan vulnerabilidade Windows youtube
Comentários
Nenhum comentário para mostrar.
- novembro 2024
- outubro 2024
- setembro 2024
- agosto 2024
- julho 2024
- junho 2024
- maio 2024
- abril 2024
- março 2024
- fevereiro 2024
- janeiro 2024
- dezembro 2023
- novembro 2023
- outubro 2023
- setembro 2023
- agosto 2023
- julho 2023
- junho 2023
- maio 2023
- abril 2023
- janeiro 2023
- novembro 2022
- junho 2022
- janeiro 2022
- abril 2021
- outubro 2020
- setembro 2020
- agosto 2020
- junho 2020
- abril 2020
- fevereiro 2020
- janeiro 2020
- abril 2019
- março 2019
- fevereiro 2019
- dezembro 2018
- novembro 2018
- outubro 2018
- setembro 2018
- agosto 2018
- julho 2018
- junho 2018
- maio 2018
- abril 2018