Permitido html: a, b, br, blockquote, i, li, pre, u, ul, p
Permitido html: a, b, br, blockquote, i, li, pre, u, ul, p
HTML: A, B, BR, BlockQuote, I, Li, Pre, U, Ul, P Enquanto isso requer acesso à rede neural do LLM, a equipe descobriu que, executando o GCG contra muitos modelos de código aberto, os resultados foramtransferível até para modelos fechados.Os avisos também são transferíveis, o que significa que um determinado sufixo geralmente funciona em muitos modelos LLMs diferentes, mesmo de código fechado.Os ataques apresentados aqui são simples de implementar, já apareceram em formas semelhantes antes e, finalmente, seriam descobertos por qualquer equipe dedicada que pretenda usar mal o LLMS.O autor principal Andy Zou, um aluno de doutorado da CMU, escreveu sobre o trabalho no Twitter.