linux-BR.org

Notícias de software livre e tecnologias

Os modelos atuais de IA para imagens, vídeos e voz são impressionantes, mas encontrar o modelo certo para cada tarefa pode ser demorado, e mover dados entre os modelos é uma tarefa árdua.Mas não há razão para que um modelo de IA não possa treinar para abordar outras formas de dados, seja uma planilha do Excel, um modelo 3D ou uma fotografia com dados de profundidade.Isso acontecerá para trabalhadores do conhecimento, criativos e usuários finais. ” – Kyle Shannon, Storyvine
O OpenAI fornece três recursos multimodais específicos.Um usuário pode solicitar o agente de IA com vários meios e alternar perfeitamente entre imagens, texto e avisos de voz na mesma conversa.Isso acontecerá para trabalhadores do conhecimento, criativos e usuários finais. ”
O apoio do ChatGpt para imagem e voz é apenas um gostinho do que está por vir.

Fonte: https://spectrum.ieee.org/chatgpt-multimodal