GGML-K8: Execute modelos GGML com Kubernetes

5 de dezembro de 2023 361

Para destruir o cluster de Kubernetes e os recursos de back -end:
Sinta -se à vontade para abrir um problema ou um PR se tiver alguma sugestão ou dúvida!Certifique -se de ter os recursos necessários disponíveis no cluster Kubernetes para executar o modelo.Certifique -se de criar a zona hospedada da rota53 e o certificado ACM validado.Não tenha medo, com GGML e Kubernetes, você pode implantar lhama e Mistral usando máquinas AWS baratas!Este repositório é um script de implantação de llama.cpp de prova de conceito para o EC2 que escala automaticamente com o Kubernetes.

Fonte: https://github.com/danielgross/ggml-k8

linux-BR.org

GGML-K8: Execute modelos GGML com Kubernetes

Trending posts dos últimos 30 dias

Em profundidade, veja os golpes de phishing de financiamento do GitHub

Funcionários da Intel dos EUA “preocupados” a China dominará em breve o lançamento reutilizável

Transformando a CLI Gemini em um sistema multi-agente com apenas solicitações

Árvores gigantes da Amazônia ficam mais altas à medida que as florestas engordam no dióxido de carbono

Mulher chinesa condenada após uma apreensão “maior” de bitcoin

Comentários