Finalizando o primeiro dia da reunião anual da American Psychiatric Association (APA 2026), o painel sobre inteligência artificial reuniu quatro especialistas com perfis complementares – psiquiatria forense, ética médica, desenvolvimento de ferramentas de IA e política de saúde. Foram discutidas as questões éticas e práticas relacionadas ao uso da inteligência artificial na psiquiatria, explorando riscos, aplicações clínicas e implicações legais.

Panorama, aplicações e riscos na psiquiatria clínica e forense
Dra. Bella Acosta Arias, psiquiatra forense e professora assistente da Yale School of Medicine
A IA é a tecnologia que busca emular capacidades tipicamente humanas, como aprendizado, compreensão, resolução de problemas, tomada de decisão, criatividade e autonomia. A velocidade com que essas capacidades estão sendo desenvolvidas, somada à ausência de regulações torna o momento atual crítico para os profissionais de saúde.
As principais aplicações na psiquiatria em desenvolvimento ou já em uso são:
- Suporte diagnóstico: sistemas capazes de gerar listas de diagnósticos diferenciais com base nas respostas do paciente durante a entrevista clínica, incluindo análise da linguagem e do conteúdo do discurso;
- Planejamento de tratamento individualizado: ferramentas que cruzam o histórico farmacológico do paciente — medicamentos tentados, doses, respostas e efeitos adversos — para sugerir as próximas opções terapêuticas mais prováveis de sucesso dentro daquele perfil específico;
- Rastreamento comportamental: integração com relógios inteligentes e wearables capazes de monitorar padrões de sono, atividade física e interação social. Um sistema pode, por exemplo, alertar um paciente bipolar de que seu padrão de sono encurtado e o aumento de atividade nas últimas 72 horas são consistentes com pródromo maníaco;
- Predição de risco: modelos que ponderam fatores de proteção e de risco para ideação suicida ou homicida, auxiliando na estratificação clínica;
- Chatbots terapêuticos: plataformas de escuta empática disponíveis 24 horas, capazes de auxiliar pacientes na navegação de circunstâncias cotidianas difíceis;
- Documentação clínica automatizada: sistemas de transcrição em tempo real que registram a consulta integralmente, geram notas estruturadas, sugerem hipóteses diagnósticas e esboçam planos terapêuticos;
- Processamento de linguagem natural (NLP): tecnologia capaz de analisar a prosódia, o ritmo, o volume e a tonalidade da voz do paciente para identificar padrões associados com embotamento afetivo, pressão do pensamento ou outras alterações do estado mental;
- Neuroimagem e biomarcadores: IA aplicada à identificação de padrões em imagens cerebrais que possam diferenciar transtornos mentais.
O caso Raine v. OpenAI
Para exemplificar alguns impasses, a Dra. Acosta Arias trouxe o processo movido pela família de um adolescente de 14 anos que começou a interagir com o ChatGPT fazendo perguntas escolares simples e, ao longo de meses, passou a compartilhar pensamentos suicidas com a plataforma mais de 200 vezes. Segundo as alegações, o sistema em alguns momentos sugeriu que o jovem buscasse ajuda, mas em outros auxiliou na redação de uma carta de despedida à mãe e forneceu orientações sobre o método de suicídio, o que culminou com a morte do adolescente. A família alega que a plataforma facilitou a ideação suicida, graças a falhas graves nos mecanismos de proteção. Uma vez que grandes modelos de linguagem são projetados para agradar, para validar e para manter o usuário engajado, eles raramente contrariam o usuário consistentemente. Em um paciente com ideação suicida ou psicose, essa tendência pode ser um reforçador perigoso.
O sistema COMPAS e o problema do viés algorítmico
Para desmistificar a ideia de neutralidade e objetividade dos modelos algoritmos, a Dra. Acosta Arias apresentou o COMPAS (Correctional Offender Management Profiling for Alternative Sanctions), desenvolvido em 1998 com o objetivo de auxiliar juízes em decisões sobre fiança, liberdade condicional e encaminhamento para programas alternativos à prisão. O sistema avaliava variáveis como “personalidade criminosa”, “isolamento social”, “uso de substâncias”, “instabilidade de moradia” e “família disfuncional” – fatores que, por razões históricas e sociais documentadas, eram desproporcionalmente prevalentes em populações minoritárias. Assim, o algoritmo atribuía sistematicamente escores de risco mais altos a réus negros, que na prática reincidiam com menor frequência do que réus brancos classificados como baixo risco. Uma vez que o COMPAS foi alimentado com dados racistas – o conjunto de casos com os quais foi treinado refletia décadas de vieses na aplicação da justiça, o racismo foi reproduzido no modelo estatístico.
Como os modelos de linguagem funcionam, onde falham e como usá-los na prática forense
Dr. Alan Newman, psiquiatra forense da Park Dietz & Associates e professor clínico da UCSF
Os grandes modelos de linguagem são sistemas de previsão da próxima palavra, análogos à função de autocompletar do teclado do celular, porém executados sobre bilhões de palavras, com profundidade e velocidade que parecem pensamento genuíno. A consequência mais importante desse mecanismo para o uso profissional é que a confiabilidade do modelo é diretamente proporcional à intensidade do treinamento sobre o tema consultado. Quando se trata de conceitos amplamente representados na literatura e nos dados de treinamento, as respostas tendem a ser altamente precisas. No entanto, diante de questões peculiares e raras na literatura, quando treinamento é esparso, o modelo não diz não sei, ele extrapola a partir de padrões próximos e produz uma resposta coerente, verossímil, bem redigida e frequentemente incorreta ou inteiramente fabricada. Em ambos os casos o tom e a estrutura da resposta são similares.
Outro fenômeno problemático é a bajulação. Os modelos são treinados para serem úteis e agradáveis, validar as premissas do usuário em vez de questioná-las. Do lado dos pacientes, se pensarmos em um indivíduo psicótico que interage longamente com um chatbot, ele pode ter seus delírios validados e reforçados. Para o clínico, um psiquiatra que pede ao modelo que avalie seu relatório pericial receberá, provavelmente, uma avaliação generosa. Se em seguida perguntar ao mesmo modelo o que há de errado no relatório do perito adversário, receberá uma crítica detalhada. Para encerrar, Dr. Newman mostrou o uso de ferramentas agênticas no contexto forense. Diferentemente dos chatbots tradicionais (pergunta-resposta), as ferramentas agênticas recebem acesso a arquivos e executam tarefas complexas de forma semiautônoma, como leitura paralela de centenas de documentos, extração de fatos, construção de cronologias, cruzamento de depoimentos por tópico, geração de prompts otimizados para buscas mais profundas.
Multimorbidade e o risco de prejuízo cognitivo: uma revisão sistemática
Tecnologia de voz ambiente, legislação comparada e margens de erro aceitáveis
Dr. Michael Jan Wise, consultor psiquiátrico britânico com mais de duas décadas de liderança em saúde mental comunitária, membro eleito anualmente do Comitê de Ética Médica da BMA e co-chair da Seção de Psiquiatria Digital da Associação Europeia de Psiquiatria
O NHS britânico já incorporou formalmente a ambient voice technology (AVT), os sistemas de transcrição clínica em tempo real, em seu plano decenal de transformação digital. Os sistemas de AVT capturam o áudio da consulta, processam o conteúdo em nuvem e geram automaticamente o registro no prontuário eletrônico do paciente, mas há preocupações em torno da tecnologia. Em relação à qualidade do registro, os seres humanos ainda superam os registros automatizados em completude, organização e utilidade clínica. Em relação à formação médica, o temor é que os profissionais não aprendam a sintetizar uma consulta complexa ou formular uma hipótese diagnóstica sem auxílio algorítmico.
O Dr. Wise apresentou o estudo NOHARM (Numerous Options Harm Assessment for Risk in Medicine), conduzido por pesquisadores de Stanford e Harvard. O estudo utilizou 100 casos reais de consultas de atenção primária encaminhadas a especialistas, com 12.747 anotações de especialistas para 4.249 opções de manejo clínico, testados contra 31 modelos de linguagem diferentes. Os resultados foram ambíguos. Os melhores modelos produziram recomendações clinicamente danosas em até 22,2% dos casos, mas superaram médicos generalistas em segurança em uma margem de 9,7 pontos percentuais. A maioria dos erros (76,6%) foram de omissão: o modelo deixou de recomendar algo essencial. Dr. Wise, então, questionou se estamos aplicando à IA um padrão de excelência que não aplicamos aos humanos. Sistemas híbridos, nos quais múltiplos agentes de IA se criticam mutuamente antes de gerar uma recomendação, reduzem significativamente os erros.
O Dr. Wise encerrou com dois exemplos de aplicações que exemplificam o potencial transformador da IA em saúde mental. O primeiro é um sistema de EEG de 8 canais aprovado pela FDA como dispositivo médico de software, que realiza uma leitura de 90 segundos e alcança 84% de acurácia. Além disso, o sistema consegue identificar com antecedência 30% de pacientes que não responderão bem à estimulação magnética transcraniana repetitiva (rTMS). O segundo exemplo é a terapia de avatares para esquizofrenia refratária. O paciente é orientado a externalizar sua alucinação auditiva, escolhendo o tom, o timbre, a rugosidade e a velocidade da voz até que corresponda exatamente ao que ouve internamente, e cria uma face que associa à voz. A alucinação, até então confinada ao interior do paciente, é compartilhada com o terapeuta no espaço real.
Os resultados demonstram redução significativa no sofrimento, na frequência e no impacto funcional das alucinações auditivas. Com IA integrada ao protocolo, o envolvimento humano direto pode diminuir em até 20%, ampliando o acesso a um tratamento que seria de outra forma restrito por escassez de profissionais qualificados.
Diretrizes éticas da APA e as fronteiras da responsabilidade clínica
Charles Dike, professor de psiquiatria e Deputy Chair for State Affairs da Yale School of Medicine e CEO do Connecticut Mental Health Center
Charles Dike apresentou o documento de diretrizes éticas sobre IA que o Comitê de Ética da APA está finalizando. O documento traz que todo uso de IA deve atender ao melhor interesse do paciente e a IA deve funcionar como inteligência aumentada – não como inteligência artificial autônoma. Desse modo, o médico não pode abdicar de seu papel de supervisão e a responsabilidade clínica permanece integralmente sobre o profissional, independentemente de qualquer erro ter origem na ferramenta. O documento acrescenta dois princípios novos aos quatro princípios clássicos da bioética (beneficência, não maleficência, respeito à autonomia e justiça): veracidade (a obrigação de dizer a verdade sobre como as ferramentas funcionam e quais são seus limites) e verificabilidade (a transparência do processo de tomada de decisão clínica). Se o médico não consegue explicar como o algoritmo chegou àquela conclusão, ele não pode utilizá-la.
Além disso, é necessário que haja equidade algorítmica – o algoritmo deve gerar resultados iguais para todos os grupos e priorizar os melhores resultados para os grupos mais vulneráveis. Dike também discutiu sobre a injustiça epistêmica, quando a autoridade do algoritmo, apresentada sob a aparência de objetividade, suprime narrativas alternativas e formas de conhecimento que não foram capturadas em seus dados de treinamento, sacrificando a individualidade humana, elemento central da psiquiatria. O documento estabelece que psiquiatras devem informar os pacientes sempre que IA desempenhar papel relevante no diagnóstico, na tomada de decisão ou no planejamento do tratamento.
Autoria

Tayne Miranda
Editora médica de Psiquiatria da Afya ⦁ Residência em Psiquiatria pela Universidade de São Paulo (USP) ⦁ Mestranda em Psicologia Social pelo Instituto de Psicologia da Universidade de São Paulo (IP-USP) ⦁ Médica pela Universidade Federal da Bahia (UFBA) ⦁ Psiquiatra do PROADI-SUS pelo Hospital Israelita Albert Einstein ⦁ Foi Psiquiatra Assistente do Hospital Universitário da Universidade de São Paulo
Como você avalia este conteúdo?
Sua opinião ajudará outros médicos a encontrar conteúdos mais relevantes.