linux-BR.org

Notícias de software livre e tecnologias

A infraestrutura otimizada da AI-IA do Google Cloud possibilita que as empresas treinem, ajustem e tçam inferência nos modelos de IA de última geração mais rapidamente, em maior escala e a menor custo.O Cloud TPU V5E fornece uma plataforma de inferência de alto desempenho, custo-benefício, escalável e confiável para modelos LLMs e AI generativos.O GridSpace aproveita a infraestrutura do Google Cloud TPU para alimentar sua plataforma de IA de conversação completa-construindo e integrando a conversação em tempo real ASR, LLMS, pesquisa semântica e TTS neural.O novo Cloud TPU V5E permite a inferência de alto desempenho e custo-benefício por uma ampla cargas de trabalho de IA, incluindo os mais recentes modelos de idiomas grandes de última geração (LLMS) e modelos generativos de IA.Escalamos nossos modelos de IA para bilhões de conversas por ano em serviços financeiros, mercados de capitais e assistência médica com a infraestrutura de IA do Google Cloud.

Fonte: https://cloud.google.com/blog/products/compute/how-cloud-tpu-v5e-accelerates-large-scale-ai-inference