Logotipo Afya
Anúncio
Carreira28 maio 2026

Diagnósticos por IA na emergência: apoio à decisão ou risco ao raciocínio clínico?

Diagnósticos por IA avançam na emergência, mas evidências mostram que o raciocínio clínico humano segue essencial para decisões seguras.

Existe uma crescente tentativa de transformar qualquer discussão sobre inteligência artificial na saúde em uma disputa sobre quem é melhor em diagnósticos, o médico ou a máquina. Por isso, a seguir você confere o que as evidências recentes mostram sobre diagnósticos por IA e raciocínio clínico humano em ambientes de alta pressão, como emergências, e em que medida essas duas formas de pensar podem muito mais se complementar do que disputarem entre si.

Leia também: Inteligência artificial a serviço da Medicina: aplicações, vantagens e desafios

 

Doctor interacting with AI healthcare interface, futuristic hologram icons over digital background, concept of medical tech innovation and diagnostics

Limites dos LLMs nos diagnósticos por IA

Em uma avaliação comparativa, Gün (2025) testou a capacidade do GPT-4 de manejar 15 cenários padronizados de emergência em comparação com um médico emergencista. Os resultados revelam que a IA alcançou alta concordância (5/5 nos critérios de avaliação) em 53,3% dos casos, apresentando melhor desempenho em quadros clínicos mais estruturados e baseados em protocolos, como crise asmática, cetoacidose diabética e infarto com supra de ST.

Mas o mesmo estudo também direcionou a atenção para situações de incertezas, múltiplas variáveis e raciocínio clínico menos linear, como em casos de AVC, politraumatizados em choque ou distúrbios acidobásicos mistos. Nesses casos de emergência, a performance da IA foi consideravelmente menor.

Quando analisamos estudos que comparam IA e médicos em cenários reais, o resultado demonstra que a acurácia diagnóstica isolada raramente conta toda a história de um paciente. Isso reforça a visão de que, a IA é um ótimo copiloto para o médico em contextos mais padronizados, mas o julgamento para situações atípicas ainda permanece humano.

Saiba mais: Compreenda a importância da validação de LLMs na área da saúde

 

Riscos dos diagnósticos por IA na triagem

Um ponto crítico na jornada do paciente em plataformas virtuais, cada vez mais frequentes, é a triagem inicial. Muitas vezes, antes mesmo de falar com um médico, o paciente já passou por buscadores, grupos de WhatsApp, aplicativos de sintomas ou modelos de linguagem tentando interpretar o que está sentindo.

Foi nesse contexto que Fraser et al. (2023) compararam a acurácia diagnóstica e de triagem do ChatGPT (versões 3.5 e 4.0), Ada Health e WebMD com a avaliação de médicos para pacientes atendidos em um departamento de emergência.

Acurácia diagnóstica e segurança na triagem

A taxa de acerto do diagnóstico principal ficou entre 30% e 40% para os sistemas avaliados, enquanto os médicos atingiram cerca de 47%. Ao considerar os três diagnósticos mais prováveis, a diferença diminuiu, sugerindo que humanos e ferramentas de IA operam, em parte, com aproximações de probabilidade.

Os dados também mostraram que o ChatGPT 3.5 apresentou 41% de triagens consideradas inseguras. Mesmo com a evolução para a versão 4.0, que reduziu as triagens inseguras para 22%, a acurácia diagnóstica de primeira escolha foi de apenas 33%.

No contexto brasileiro, em muitos serviços, o primeiro contato do paciente acontece por chatbot, formulário automatizado ou atendimento assíncrono. Isso melhora o fluxo e acesso, mas na prática, é importante o cuidado com o uso de ferramentas que possam subestimar sinais de alerta, como dor torácica atípica ou dispneia leve em paciente idoso, podendo atrasar uma conduta que depende de minutos.

Como a IA pode acelerar processos e reduzir erros

Taylor et al. (2024) discutem como a inteligência artificial pode ser utilizada na medicina de emergência para reduzir erros diagnósticos relacionados à fragmentação da informação e à fadiga decisória, fatores frequentes na nossa realidade de plantões de 12h ou 24h no SUS ou na rede privada brasileira.

Talvez um dos usos mais importantes da IA aplicada aos ambientes de emergência brasileiro seja funcionar como ferramenta de apoio em contextos em que o médico atende muitos pacientes em sequência, alterna entre casos de baixa e alta complexidade e ainda precisa lidar com prontuários fragmentados, exames em sistemas diferentes e comunicação imperfeita entre níveis de atenção, como normalmente é a realidade de muitos atendimentos.

O papel da IA não seria pensar no lugar do médico, mas organizar dados, resumir informações, ampliar o repertório de hipóteses e funcionar como uma camada adicional de suporte à decisão.

Uso da IA na radiologia de emergência

Um exemplo disso vem da radiologia. Em um estudo multicêntrico, Ahn et al. (2022) avaliaram o uso de IA na interpretação de radiografias de tórax. O uso da ferramenta aumentou a sensibilidade na detecção de achados críticos como pneumotórax e nódulos. Também gerou um ganho de 10% no tempo de interpretação dos exames e emissão dos laudos. No de atendimento crítico, virtual ou presencial, esse tipo de ganho pode significar mais agilidade na decisão, menor acúmulo de tarefas e, em alguns contextos, impacto direto na segurança do cuidado prestado ao paciente.

Diagnósticos por IA substituem o médico?

No fim, talvez a pergunta mais útil não seja se a IA diagnostica melhor do que nós, médicos, mas em quais etapas do cuidado ela realmente agrega valor sem aumentar riscos.

Autoria

Foto de Juliana Karpinski

Juliana Karpinski

Editora médica assistente de Carreira da Afya. Médica e Jornalista formada pela Universidade Federal do Paraná (UFPR). MBA em Gestão Estratégica pela UFPR.

Como você avalia este conteúdo?

Sua opinião ajudará outros médicos a encontrar conteúdos mais relevantes.

Compartilhar artigo

Referências bibliográficas

Newsletter

Aproveite o benefício de manter-se atualizado sem esforço.

Anúncio

Leia também em Carreira