Finetuning LLMs com eficiência com adaptadores

27 de maio de 2023 348

Grandes modelos de idiomas (LLMs) como Bert, GPT-3, GPT-4, Llama e outros são treinados em um grande corpus de dados e têm conhecimento geral.No entanto, enquanto o ajuste do prefixo antecende os tensores ajustáveis às incorporações, o método adaptador adiciona camadas adaptadoras em dois lugares, conforme ilustrado na figura abaixo.No entanto, como os LLMs são “grandes”, a atualização de várias camadas em um modelo de transformador pode ser muito caro, então os pesquisadores começaram a desenvolver alternativas eficientes em parâmetro.Por exemplo, suponha que a primeira camada totalmente conectada projete uma entrada 1024-dimensional até 24 dimensões, e a segunda camada totalmente conectada o projeta novamente em 1024 dimensões.(Os leitores interessados podem encontrar uma visão geral dos diferentes métodos de Finetuning LLM em meu artigo anterior, Finetuning Language Models: uma introdução às idéias e abordagens principais.)

Fonte: https://magazine.sebastianraschka.com/p/finetuning-llms-with-adapters

linux-BR.org

Finetuning LLMs com eficiência com adaptadores

Trending posts dos últimos 30 dias

Gerando uma categoria específica de invólucros de retorno de chamada C em torno dos métodos C ++

Novo Profiler de CPU-Time de Java 25

Funcionário não licenciado demitido após alucinações de chatgpt encontradas no arquivamento

Fazendo meu trabalho diário no Chimera Linux

Google Beam: Atualizações para o Projeto Starline da E/O 2025

Comentários