Os pesquisadores publicam algoritmo de ataque para chatgpt e outros LLMs

2 de agosto de 2023 631

Permitido html: a, b, br, blockquote, i, li, pre, u, ul, p

HTML: A, B, BR, BlockQuote, I, Li, Pre, U, Ul, P Enquanto isso requer acesso à rede neural do LLM, a equipe descobriu que, executando o GCG contra muitos modelos de código aberto, os resultados foramtransferível até para modelos fechados.Os avisos também são transferíveis, o que significa que um determinado sufixo geralmente funciona em muitos modelos LLMs diferentes, mesmo de código fechado.Os ataques apresentados aqui são simples de implementar, já apareceram em formas semelhantes antes e, finalmente, seriam descobertos por qualquer equipe dedicada que pretenda usar mal o LLMS.O autor principal Andy Zou, um aluno de doutorado da CMU, escreveu sobre o trabalho no Twitter.

Fonte: https://www.infoq.com/news/2023/08/llm-attack/

linux-BR.org

Os pesquisadores publicam algoritmo de ataque para chatgpt e outros LLMs

Trending posts dos últimos 30 dias

Melhore o desempenho do WordPress com cache de objetos

O declínio do Google e a ascensão das pesquisas alternativas como fonte de tráfego

Os usuários reclamaram depois que a AMD retirou a criptografia de memória de suas CPUs de consumo

Argus: assistente de codificação de IA de código aberto com revisão de código integrada

Anotações do Amazon S3: anexe contexto rico e consultável diretamente aos seus objetos

Comentários