linux-BR.org

Notícias de software livre e tecnologias

A demonstração permite que os usuários controlem aspectos visuais clicando em objetos, bem como para ajustar propriedades textuais, como comprimento, sentimento, factualidade e linguagem.Ele suporta controles visuais (clique do mouse) e controles de idioma (comprimento, sentimento, factualidade e idioma).
A legenda-qualquer coisa é uma ferramenta versátil de processamento de imagens que combina os recursos de segmentar qualquer coisa, legenda visual e chatgpt.O projeto é baseado no segmento de qualquer coisa, BLIP/BLIP-2, CHATGPT.Nossa solução gera legendas descritivas para qualquer objeto dentro de uma imagem, oferecendo uma variedade de estilos de idiomas para acomodar diversas preferências do usuário.

Fonte: https://github.com/ttengwang/Caption-Anything