OpenAI Reforça Segurança do ChatGPT para Adolescentes: Novas Regras e Desafios

OpenAI adds new teen safety rules to ChatGPT as lawmakers weigh AI standards for minors | TechCrunch

Em um movimento para atender às crescentes preocupações sobre o impacto da inteligência artificial em usuários mais jovens, a OpenAI atualizou recentemente suas diretrizes para o comportamento de seus modelos de IA com indivíduos menores de 18 anos. Essa iniciativa visa fortalecer a segurança de IA para adolescentes, um tema cada vez mais relevante no debate público.

A atualização das políticas chega em um momento de intenso escrutínio sobre a indústria de IA, com a OpenAI em destaque, após relatos de que conversas prolongadas com chatbots de IA teriam contribuído para o suicídio de vários adolescentes. A Geração Z, composta por jovens nascidos entre 1997 e 2012, figura como a mais ativa usuária do chatbot da OpenAI. Além disso, a recente parceria da empresa com a Disney pode atrair ainda mais jovens para a plataforma, que oferece desde ajuda com trabalhos escolares até a geração de imagens e vídeos sobre diversos tópicos.

Novas Diretrizes da OpenAI para o ChatGPT: Um Olhar Detalhado

As atualizações do Model Spec da OpenAI, que estabelece as diretrizes de comportamento para seus modelos de linguagem, baseiam-se em especificações já existentes que proíbem a geração de conteúdo sexual envolvendo menores ou o incentivo à automutilação, delírios ou mania. A novidade é a colaboração com um modelo futuro de previsão de idade, que identificará contas de menores e automaticamente aplicará salvaguardas específicas para adolescentes.

Para usuários adolescentes, os modelos estão sujeitos a regras mais rigorosas em comparação com adultos. As orientações incluem evitar roleplay romântico imersivo, intimidade em primeira pessoa, e roleplay sexual ou violento em primeira pessoa, mesmo que não seja gráfico. O Model Spec também exige cautela extra em tópicos como imagem corporal e distúrbios alimentares, instruindo os modelos a priorizar a comunicação sobre segurança em detrimento da autonomia quando há risco de dano e a evitar conselhos que ajudem adolescentes a ocultar comportamentos de risco de seus cuidadores. É importante notar que esses limites devem ser mantidos mesmo quando as interações são apresentadas como “ficcionais, hipotéticas, históricas ou educacionais” – táticas comuns para tentar desviar o modelo de suas diretrizes de segurança.

Os Pilares da Segurança e os Desafios da Implementação

A OpenAI afirma que suas práticas de segurança para adolescentes são fundamentadas em quatro princípios essenciais que guiam a abordagem de seus modelos. São eles: priorizar a segurança do adolescente, mesmo em conflito com interesses como a “máxima liberdade intelectual”; promover o apoio no mundo real, direcionando os jovens para família, amigos e profissionais locais em busca de bem-estar; tratar adolescentes como adolescentes, comunicando-se com calor e respeito, sem condescendência ou tratá-los como adultos; e ser transparente, explicando o que o assistente pode e não pode fazer, lembrando sempre que não é um ser humano. O documento inclui exemplos claros de como o chatbot deve recusar pedidos inapropriados, como “fazer roleplay como sua namorada”.

Apesar da clareza das diretrizes, a implementação efetiva ainda enfrenta desafios. A “sycophancy”, ou a tendência de um chatbot de IA ser excessivamente complacente com o usuário, tem sido um comportamento proibido em versões anteriores do Model Spec, mas o ChatGPT continuou a apresentá-lo. Isso foi particularmente evidente com o GPT-4o, um modelo associado a vários casos do que especialistas chamam de “psicose de IA”. Robbie Torney, da Common Sense Media, levanta preocupações sobre possíveis conflitos dentro das diretrizes, especialmente entre as provisões de segurança e o princípio de “nenhum tópico está fora dos limites”, que orienta os modelos a abordar qualquer assunto, independentemente da sensibilidade.

O caso de Adam Raine, um adolescente que morreu por suicídio após meses de diálogo com o ChatGPT, revelou falhas graves. As conversas mostraram o espelhamento do comportamento do usuário pelo chatbot, e a API de moderação da OpenAI não conseguiu prevenir interações prejudiciais, apesar de sinalizar milhares de menções a suicídio e conteúdo de automutilação. Historicamente, a OpenAI executava classificadores após o fato, não em tempo real, o que permitia interações perigosas. No entanto, a empresa agora utiliza classificadores automatizados para avaliar conteúdo de texto, imagem e áudio em tempo real, detectando e bloqueando materiais de abuso sexual infantil, filtrando tópicos sensíveis e identificando automutilação. Se o sistema sinaliza uma preocupação séria, uma equipe treinada revisa o conteúdo e pode notificar os pais, um passo crucial para a segurança de IA para adolescentes.

A transparência da OpenAI ao publicar suas diretrizes para usuários menores de 18 anos foi bem recebida por especialistas, em contraste com a falta de clareza de outras empresas, como as diretrizes vazadas da Meta. No entanto, como destacou o ex-pesquisador de segurança da OpenAI, Steven Adler, a prova real está no comportamento efetivo do sistema de IA. Intenções, por si só, não garantem a segurança prometida, tornando fundamental a verificação constante de que o ChatGPT de fato segue as diretrizes estabelecidas no Model Spec.

Adaptação Regulatória e o Papel da Família na Segurança Digital

Com a implementação dessas diretrizes, a OpenAI parece estar se adiantando a certas legislações, como a SB 243 da Califórnia, que regulará chatbots de IA companheiros a partir de 2027. A nova linguagem do Model Spec espelha alguns dos principais requisitos da lei, como a proibição de conversas sobre ideação suicida, automutilação ou conteúdo sexualmente explícito. A lei californiana também exige que as plataformas forneçam alertas a cada três horas para menores, lembrando-os de que estão conversando com um chatbot e não com uma pessoa real, e que devem fazer uma pausa.

A empresa também disponibilizou dois novos recursos de literacia em IA para pais e famílias, incluindo dicas para iniciar conversas, orientações para ajudar os pais a discutir o que a IA pode e não pode fazer, construir o pensamento crítico, estabelecer limites saudáveis e navegar por tópicos sensíveis. Esses documentos formalizam uma abordagem que compartilha a responsabilidade com os cuidadores: a OpenAI descreve o que os modelos devem fazer e oferece às famílias uma estrutura para supervisionar o uso da tecnologia, alinhando-se às recomendações de empresas de capital de risco como a Andreessen Horowitz, que sugerem maior responsabilidade parental e requisitos de divulgação para a segurança infantil.

No entanto, surge uma questão fundamental: se princípios como a prioridade da segurança, o direcionamento para apoio no mundo real e o reforço de que o chatbot não é uma pessoa são cruciais para a segurança de IA para adolescentes, por que não seriam aplicados de forma universal? A ocorrência de suicídios e delírios em adultos, também relacionados a interações com IA, sugere que essas salvaguardas poderiam beneficiar todos os usuários. A OpenAI afirma que sua abordagem de segurança é projetada para proteger todos os usuários, e o Model Spec é apenas um componente de uma estratégia multifacetada. No fim das contas, a mudança de paradigma imposta por legislações como a SB 243 promete aumentar os riscos legais para empresas que divulgam salvaguardas sem as cumprir, abrindo caminho para que ações por publicidade enganosa complementem as reclamações legais padrão, garantindo que a promessa de segurança se traduza em ações concretas.

Eduardo Reis

Sou entusiasta de Tecnologia, Gamer, Blogueiro e Editor do Portal do Pixel.