linux-BR.org

Notícias de software livre e tecnologias

Muitos sites já se mudaram para bloquear o rastreador da web que o OpenAI usa para raspar dados e treinar ChatGPT, incluindo o New York Times, CNN, Reuters e Medium.
Por Emma Roth, uma escritora de notícias que cobre as guerras de streaming, tecnologia do consumidor, criptografia, mídia social e muito mais.Afinal, os sites não podem fechar completamente os rastreadores do Google, ou não serão indexados na pesquisa.O Google acabou de anunciar que está dando aos editores de sites uma maneira de optar por não ter seus dados usados para treinar os modelos de IA da empresa, permanecendo acessíveis através da pesquisa do Google.O Google-Extended está disponível no robots.txt, também conhecido como arquivo de texto que informa os rastreadores da Web se eles podem acessar determinados sites.

Fonte: https://www.theverge.com/2023/9/28/23894779/google-ai-extended-training-data-toggle-bard-vertex