linux-BR.org

Notícias de software livre e tecnologias

De acordo com a documentação do Openai, o GPTBOT será identificável pelo token do agente do usuário “GPTBOT”, com sua corda completa sendo “Mozilla/5.0 Applewebkit/537.36 (khtml, como gecko; compatível; gptbot/1.0; +https: //penai.com/gptbot) “.

Benj Edwards
– 11 de agosto de 2023 21:22 UTC

Sem anúncio, o OpenAI adicionou recentemente detalhes sobre seu rastreador da web, o GPTBOT, ao seu site de documentação on -line.O OpenAI afirma que implementou filtros, garantindo que as fontes por trás dos paywalls, aquelas que coletam informações de identificação pessoal ou qualquer conteúdo que violarem as políticas do OpenAI não serão acessadas pelo GPTBOT.Por exemplo, o bloqueio do conteúdo dos futuros modelos de IA pode diminuir a pegada cultural de um site ou uma marca se a AI Chatbots se tornar uma interface principal do usuário no futuro.O OpenAI coletou os dados que terminam em setembro de 2021, que é o ponto de corte atual de “conhecimento” para os modelos de idiomas da OpenAI.

Fonte: https://arstechnica.com/information-technology/2023/08/openai-details-how-to-keep-chatgpt-from-gobbling-up-website-data/