A incorporação de recursos de inteligência artificial (IA) à medicina vem impactando a forma como o raciocínio clínico é executado, aprendido e ensinado. Ferramentas baseadas em grandes modelos de linguagem (LLMs) agora são capazes de simular processos cognitivos humanos com fluência e coerência impressionantes, gerando hipóteses diagnósticas, sugerindo condutas e até justificando decisões clínicas de modo persuasivo – porém nem sempre correto. Diante desse cenário, o desafio para a educação médica não é apenas técnico, mas epistemológico: como formar profissionais capazes de usar a IA sem perder a capacidade de pensar criticamente e de raciocinar de forma independente?
O artigo Educational Strategies for Clinical Supervision of Artificial Intelligence Use, publicado no New England Journal of Medicine em agosto de 2025, propõe uma estrutura para que docentes e preceptores supervisionem o uso de IA em contextos clínicos, enfatizando o desenvolvimento de pensamento crítico e construção de raciocínio clínico adaptativo. Os autores argumentam que, embora a IA ofereça ganhos de eficiência e aprendizagem, o uso não supervisionado pode gerar riscos pedagógicos e clínicos significativos, como o deskilling (perda de habilidades adquiridas), o never-skilling (falha em desenvolvê-las) e o mis-skilling (reforço de habilidades incorretas).
A revolução da IA na formação médica inverteu papéis tradicionais: muitos residentes e estudantes dominam melhor essas tecnologias do que seus próprios supervisores. Tal inversão exige um modelo de ensino baseado na aprendizagem compartilhada e ativa, em que docentes e aprendizes exploram criticamente as potencialidades e limitações da IA. Essa abordagem reconhece que, na era digital – mais do que nunca, o professor também é aprendiz.
Leia mais: Inteligência artificial no aumento da performance de estudo em metodologias ativas
Por um lado, a IA pode ampliar a capacidade cognitiva de estudantes ao reduzir a carga de tarefas repetitivas ou burocráticas e permitir foco em aspectos mais complexos da tomada de decisão. No entanto, quando usada de forma acrítica, tende a reduzir o engajamento mental, levando a um raciocínio superficial e ao desenvolvimento de uma espécie de dependência desses sistemas automatizados. Estudos citados pelo artigo mostram correlação negativa entre o uso frequente de ferramentas de IA e a habilidade de pensamento crítico, especialmente entre indivíduos mais jovens, e evidenciam que usuários que aceitam as respostas do modelo sem questionamento tendem a ter desempenho pior do que aqueles que não utilizaram IA.
Além disso, há o risco de mis-skilling – quando o aprendiz incorpora erros sistemáticos de modelos enviesados. Por exemplo, algoritmos que superestimam pneumonia em idosos ou insuficiência cardíaca em pacientes obesos podem distorcer o raciocínio clínico do usuário. Ou pior, quanto menor a experiência profissional, maior a chance de confiar cegamente na IA e perpetuar o erro. Por outro lado, quando clínicos experientes utilizam a IA de modo crítico, os resultados se potencializam. Assim, o benefício da IA depende menos da tecnologia em si e mais da capacidade humana de interpretá-la, validá-la e integrá-la adequada e eticamente à prática clínica.
Para lidar com esse cenário, os autores propõem o modelo DEFT-AI – Diagnosis, Evidence, Feedback, Teaching and Recommendation for AI engagement – um roteiro estruturado para transformar interações entre os estudantes e as ferramentas de IA em oportunidades educacionais. Inspirado em modelos clássicos de ensino clínico, o DEFT-AI serve como guia para docentes promoverem pensamento crítico diante de ferramentas digitais.
O processo começa com a “Discussão e Diagnóstico”, em que o preceptor investiga como o aluno/residente utilizou a IA: quais prompts foram usados, se houve checagem dos resultados e de que forma as respostas do modelo influenciaram o raciocínio. Em seguida, o passo da “Evidência” estimula o estudante a justificar suas conclusões, comparando-as com diretrizes, literatura científica e evidências clínicas – avaliando também a qualidade e validade do modelo de IA empregado. O terceiro componente, “Feedback”, convida à autoavaliação: o que o estudante aprendeu? Em quais aspectos dependeu demais da IA? Que lacunas cognitivas e clínicas precisam ser trabalhadas?
A etapa seguinte, “Ensino”, propõe o estímulo a um momento de aprendizado dialógico. O educador pode reforçar princípios de raciocínio clínico, explicar estratégias de prompting eficazes e discutir vieses algorítmicos. Por fim, o passo da “Recomendação para o uso de IA” define se o aprendiz está pronto para utilizar a ferramenta de modo autônomo, com supervisão parcial ou apenas em tarefas de baixo risco.
Dessa estrutura, podem surgir tipicamente dois tipos de padrões de interação entre humanos e IA:
- Padrão “centauro”: delega-se à IA as partes mecânicas do processo e retém-se o julgamento crítico.
- Padrão “ciborgue”: humano e IA se integram de forma contínua, “co-construindo” raciocínios e decisões.
Nenhum é intrinsecamente superior; o ideal seria um “equilíbrio adaptativo”, escolhendo o padrão conforme a complexidade da tarefa e o risco envolvido. Em decisões diagnósticas ou de alta incerteza, recomenda-se o padrão centauro, com checagem minuciosa. Já em tarefas operacionais ou criativas, como a elaboração de alguns tipos de documentos, comunicações ou resumos, o modo ciborgue pode ser mais eficiente.
Um aspecto essencial dessa supervisão clínica é o desenvolvimento da literacia em IA – a competência para avaliar criticamente as ferramentas de IA e os algoritmos. O preceptor deve estimular o aluno a questionar a confiabilidade do modelo utilizado: há estudos revisados por pares demonstrando sua acurácia? Existem scorecards ou registros regulatórios? A instituição validou esse sistema em sua população? Além disso, é essencial a avaliação do output gerado pela IA. O clínico deve comparar as respostas da ferramenta com evidências independentes – como diretrizes clínicas e literatura médica em geral -, reforçando a premissa de que a confiança na IA passa pela necessidade de verificação humana.
Nessa perspectiva, a prática de “engenharia de prompts” – a elaboração criteriosa, adequada e assertiva das perguntas feitas à IA – é descrita como uma habilidade emergente para o médico moderno. Prompts claros, contextualizados e livres de vieses aumentam a qualidade das respostas. Instruções que pedem explicações à IA (como “explique seu raciocínio”) favorecem a transparência e permitem ao usuário avaliar a lógica subjacente realizada pelo modelo. Essa abordagem aproxima o diálogo com IA de uma consulta “entre pares” – um “pensar em voz alta” que transforma o uso passivo em aprendizado ativo.
Portanto, é essencial que a educação médica cultive o princípio do “verificar e confiar” (verify and trust). A IA deve ser vista como um apoio, uma extensão da mente clínica; não como sua substituta. Assim, o papel do médico educador é duplo: prevenir uma dependência acrítica e, ao mesmo tempo, potencializar o aprendizado mediado por essa tecnologia. Isso provavelmente exigirá reformas curriculares, investimento em formação docente e colaboração entre escolas médicas, sistemas de saúde e desenvolvedores de tecnologias de IA.
Sem estrutura de governança e mecanismos robustos de validação, a introdução indiscriminada de IA pode comprometer a segurança do paciente e o processo formativo. Contudo, se usada de forma reflexiva e supervisionada, ela pode se tornar um catalisador de competência clínica, pensamento crítico e prática adaptativa – pilares do cuidado médico no século XXI.
Autoria

Renato Bergallo
Editor-chefe de Medicina de Família e Comunidade do Whitebook ⦁ Graduação em Medicina pela Universidade Federal Fluminense (UFF) ⦁ Residência em Medicina de Família e Comunidade pela Universidade do Estado do Rio de Janeiro (UERJ) e em Administração em Saúde (UERJ) ⦁ Mestre em Saúde da Família (UFF) ⦁ Doutorando em Saúde Pública pela Escola Nacional de Saúde Pública (ENSP/Fiocruz) ⦁ Direto Médico na Conviver Health ⦁ Professor do Departamento de Medicina Integral, Familiar e Comunitária da UERJ
Como você avalia este conteúdo?
Sua opinião ajudará outros médicos a encontrar conteúdos mais relevantes.