Logotipo Afya
Anúncio
Oncologia23 dezembro 2025

Algoritmo de linguagem natural identifica pacientes com câncer com rede de apoio

Algoritmo de NLP identifica baixo suporte social em pacientes com câncer a partir de notas clínicas do prontuário eletrônico.

Para quem trabalha diariamente com pacientes oncológicos, é evidente que o suporte social influencia o tratamento tanto quanto muitos marcadores biológicos. Mulheres com bom apoio familiar faltam menos às consultas, toleram melhor quimioterapia, aderem a hormonioterapia e têm menos ansiedade. Já aquelas isoladas ou com conflitos familiares costumam faltar as consultas, interromper medicações e chegar ao pronto-socorro em piores condições clínicas. 

O problema é que o apoio social raramente é registrado de forma padronizada no prontuário porque essas informações surgem em conversas informais (“meu marido saiu de casa”; “eu moro sozinha”; “não tenho quem me leve para a sessão de quimioterapia”, etc). Esses detalhes ficam perdidos em anotações extensas escritas de formas diferentes por cada profissional envolvido no cuidado. 

Com o crescimento dos prontuários eletrônicos e da inteligência artificial, surge uma pergunta prática: será que conseguimos usar essas informações soltas para identificar rapidamente quem está em risco social? . É isso que o estudo de Kroenke e colaboradores tenta responder. Ele descreve o desenvolvimento e a validação de um algoritmo de processamento de linguagem natural (NLP) para extrair automaticamente dados sobre apoio social de quase meio milhão de notas clínicas de quase 8 mil mulheres com câncer de mama. O objetivo é criar um sistema capaz de alertar equipes de oncologia sobre quem precisa de maior suporte permitindo abordagem precoce e personalizada. 

Trata-se de um tema atual, diretamente ligado a qualidade de vida, adesão terapêutica e em última instância sobrevida. 

algoritmo de linguagem natural no câncer

Metodologia 

O estudo reuniu um volume impressionante de dados: 

  • 7989 mulheres com diagnóstico de câncer de mama entre 2006 e 2021; 
  • 565258 notas clínicas e 68760 mensagens de pacientes no portal eletrônico; 

Foram feitas coleta de dados desde 1 mês antes até 13 meses após o diagnóstico 

A equipe desenvolveu o algoritmo em etapas:  

  1. Construção de um léxico de termos relacionados ao apoio social baseado em literatura, anotações reais e entrevistas com enfermeiras navegadoras; 
  1. Revisão manual de trechos para entender como cada termo era usado (por exemplo, “filho acompanha” vs “filho é dependente”) 
  1. Criação de regras complexas (regex) para identificar menções relevantes e excluir usos irrelevantes 
  1. Inclusão não só de notas médicas, mas também de mensagens enviadas pelos pacientes pelo portal, que muitas vezes revelavam dificuldades sociais 
  1. Desenvolvimento de 11 módulos que representam diferentes dimensões de suporte social 
  1. Validação rigorosa em três etapas: duas rodadas de ajuste (20 pacientes cada) e uma rodada final de teste (100 pacientes). 

Além das notas de texto livre, os autores também analisaram dados estruturados como códigos (CID) relacionados a problemas sociais e presença/ausência de contato de emergência pessoal. 

A avaliação do algoritmo incluiu métricas como acurácia, sensibilidade, especificidade e F1-score, comparando automaticamente o que o algoritmo detectava com revisão manual de prontuários (o padrão-ouro). 

População envolvida 

A amostra foi bem diversa: 

  • Idade média de 60,7 anos (variando de mulheres jovens a idosas) 
  • Estadiamento: 55% estágio I; 29% estágio II e cerca de 12% estágio III ou IV 
  • Diversidade racial: 59% brancas, 17% asiáticas, 12% hispânicas e 7% negras 
  • Alto índice de comorbidades: 59%

O dado mais impressionante é que 98,3% das pacientes tinham pelo menos uma menção a apoio social em alguma nota. Isso reforça que mesmo sem padronização, equipes de oncologia registram questões sociais, mas não de maneira estruturada. 

Resultados 

Os autores identificaram 11 categorias de apoio social a partir do texto livre, com diferentes níveis de disponibilidade: 

  • Mais frequentes: estado civil (92%), filhos (89%), presença de acompanhante em consultas (84%), com quem a paciente mora (62%) 
  • Moderadamente frequentes: amigos, ajuda emocional, luto por perda recente 
  • Raras: conflito familiar (8%), transporte inadequado (15%), isolamento social explícito (14%) 

A qualidade do algoritmo foi muito boa para os módulos mais comuns: 

  • Acurácia entre 0,81 e 0,95 
  • F1-score variando entre 0,75 e 1,0 para módulos bem documentados 

Módulos menos frequentes tiveram desempenho menor, principalmente pela escassez de dados e pela sutileza da linguagem usada para descrever isolamento. 

Além disso os autores testaram um “score de suporte social” simplesmente somando o número de módulos positivos. Compararam esse score com o MOS-SS (instrumento validado de apoio social) preenchido por 4145 mulheres na coorte. A correlação foi clara: quanto maior o número de módulos identificados pelo algoritmo, maior o escore do MOS-SS. Cerca de 7% das mulheres foram classificadas como tendo suporte social muito baixo, número semelhante a estimativas populacionais de isolamento social. 

Mensagem prática 

Este estudo traz lições importantes para quem trabalha na linha de frente com pacientes oncológicos. 

  • Questões sociais são amplamente registradas, mas de forma desorganizada 

Notas de evolução contêm uma riqueza de informações sobre apoio social que raramente conseguimos localizar em consultas rápidas. Um algoritmo que lê tudo isso automaticamente pode economizar tempo e melhorar triagem. 

  • Pacientes com baixo suporte social existem, mas são difíceis de identificar 

Muitas vezes elas não verbalizam explicitamente, mas deixam pistas nas consultas (“não tenho quem me leve”; “vou sozinha”, “meu marido faleceu neste ano”). O algoritmo ajuda a transformar essas pistas em informação prática. 

  • A tecnologia não substitui o julgamento clínico, mas orienta prioridades 

Imagine um ambulatório cheio com 40 consultas por dia. Um sinal automático no prontuário sugerindo que aquela paciente vive sozinha, está em luto ou perdeu o contato de emergência pode ser o gatilho para acionar assistente social ou navegação. 

  • Pode mudar o cuidado populacional 

Em grandes sistemas de saúde esse tipo de algoritmo permite identificar em massa mulheres vulneráveis e direcionar recursos, como grupos de apoio, transporte, visitas domiciliares, terapia. 

  • O modelo é replicável 

Nada no algoritmo é específico para câncer de mama. Com ajuste do léxico, pode ser aplicado a qualquer doença crônica, como câncer de pulmão, insuficiência cardíaca, doença renal crônica, etc. 

A verdadeira inovação deste trabalho não é tecnológica, mas clínica: trazer o apoio social, historicamente invisível, para dentro do prontuário de forma objetiva e utilizável. 

Em uma era em que falamos muito de medicina personalizada baseada em genômica, este estudo lembra algo simples: às vezes o fator que mais determina evolução é se a paciente tem quem segure sua mão na consulta e em casa.

Autoria

Foto de Gabriel Madeira Werberich

Gabriel Madeira Werberich

Possui graduação em Medicina pela Universidade do Estado do Rio de Janeiro (2009). Residência de Clínica Médica pela UERJ/Hospital Universitário Pedro Ernesto(HUPE)/Policlínica Piquet Carneiro(PPC). Residência Medica em Oncologia Clínica pelo Instituto Nacional de Câncer (INCA). Fellowship (R4) de Oncologia Clínica no Hospital Sírio Libanês (2016). Concluiu a residência médica de Radiologia e Diagnóstico por Imagem no HUCFF-UFRJ e R4 de Radiologia do Centro de Imagem do Copa Dor, com ênfase em Ressonância Magnética de Medicina Interna, e mestrado em Medicina na UFRJ concluído em 2023. Tem experiência na área de Clínica Médica, Oncologia Clínica e Diagnóstico por Imagem em Tórax, Medicina Interna e Radiologia Oncologica. Pos-Graduação em curso de Inteligencia Artificial aplicada a Saúde.

Como você avalia este conteúdo?

Sua opinião ajudará outros médicos a encontrar conteúdos mais relevantes.

Compartilhar artigo

Referências bibliográficas

Newsletter

Aproveite o benefício de manter-se atualizado sem esforço.

Anúncio

Leia também em Oncologia