Em indivíduos com diabetes tipo 1, o cálculo correto da dose de insulina prandial para as refeições continua sendo um dos componentes mais desafiadores do tratamento. Mesmo com a evolução dos sistemas híbridos de circuito fechado e de algoritmos cada vez mais avançados, a precisão da contagem de carboidratos (CC) pelo usuário permanece um fator determinante para o sucesso glicêmico no período pós-prandial. Além disso, mesmo em pacientes com uma boa prática, outros fatores como o índice glicêmico, a quantidade de gorduras e proteínas podem impactar significativamente, levando a maior risco de variabilidade glicêmica.
Contar carboidratos exige conhecimento nutricional, interpretação visual, estimativa de porções e acesso a informações confiáveis — elementos que variam amplamente na prática cotidiana. O uso de ferramentas baseadas em inteligência artificial generativa (GenAI), como os modelos de linguagem ChatGPT e Gemini, surge como uma alternativa para automatizar e padronizar esse processo, potencialmente reduzindo o erro humano e facilitando o autocuidado.
Pensando na possível facilidade que ferramentas de IA podem trazer no manejo do DM1, foi elaborado e publicado na Diabetes Care recentemente um estudo que avaliou, de forma inédita, a acurácia da estimativa de carboidratos feita por modelos de GenAI em diferentes contextos da vida real, comparando seu desempenho com uma base clínica validada e quantificando a margem de erro com ferramentas estatísticas robustas. Pela importância do tema e o uso cada vez mais corriqueiro da inteligência artificial em nosso dia a dia, trazemos o estudo para discussão.
Saiba mais: Diretriz brasileira sobre terapia nutricional em pacientes com DM1
Métodos do estudo
O estudo foi um ensaio prospectivo, comparativo e baseado em simulações controladas, que analisou 50 refeições reais, divididas igualmente entre:
- 25 refeições pré-embaladas (com rotulagem nutricional explícita), e
- 25 refeições não industrializadas, preparadas em ambientes domésticos, restaurantes ou serviços de catering.
Cada refeição foi testada em três cenários distintos, desenhados para representar o espectro de situações que uma pessoa com DM1 pode vivenciar ao longo da rotina:
- Contexto social (dados mínimos): apenas o nome do prato e uma fotografia da refeição.
- Contexto de restaurante (dados moderados): nome do prato, imagem e lista de ingredientes.
- Contexto doméstico (dados completos): nome, imagem, lista de ingredientes e as respectivas quantidades.
Duas ferramentas de GenAI foram testadas, o ChatGPT-4o (OpenAI) e a Gemini Advanced (Google). As respostas dos modelos foram solicitadas em linguagem natural, da mesma forma como um paciente interagiria em tempo real com essas plataformas, fornecendo as informações conforme supramencionado. Para cada refeição, os modelos retornaram o valor estimado de carboidratos em gramas.
Esses valores foram então comparados com a quantificação de referência obtida utilizando o software MetaDieta — um sistema clínico amplamente utilizado na Europa com base em tabelas alimentares reconhecidas.
A acurácia das respostas foi quantificada pelo erro percentual absoluto médio (MAPE), e as diferenças entre os modelos foram avaliadas com testes de Wilcoxon e Mann–Whitney U, considerando significância estatística para P < 0,05.
Resultados
A eficácia da contagem de carboidratos por IA dependeu amplamente, como esperado, da quantidade de dados fornecidos. O desempenho dos modelos foi diretamente proporcional ao grau de detalhamento das informações fornecidas:
Com dados mínimos (contexto social):
- O GPT apresentou um erro médio (MAPE) de 34,8%, enquanto o Gemini teve 45%.
- A diferença não atingiu significância estatística (P = 0,162), mas já sugeria tendência de maior precisão com o GPT.
Com dados moderados (cenário de restaurante):
- O GPT obteve melhora significativa, com MAPE de 18,1%, frente a 28,8% do Gemini (P < 0,001).
- Nesse cenário, que simula o desafio clínico mais comum — refeições fora de casa com acesso parcial à composição — o GPT mostrou desempenho consistentemente superior.
Com dados completos (cenário doméstico):
- Ambos os modelos apresentaram excelente desempenho: MAPE de 13,7% para o GPT e 13% para o Gemini, sem diferença estatística (P = 0,834).
- Isso reforça que, em condições ideais, com fornecimento de quantidades e ingredientes detalhados, ambos os sistemas conseguem fornecer estimativas bastante confiáveis.
Análise por tipo de refeição
O estudo também examinou a influência do tipo de refeição na acurácia:
- Para o GPT, refeições pré-embaladas apresentaram melhor desempenho quando acompanhadas de dados completos (MAPE 11% vs. 16,3% nas não industrializadas, P < 0,001), refletindo a vantagem da padronização e da rotulagem nutricional.
- Curiosamente, em situações com dados mínimos, o GPT foi mais preciso com refeições não pré-embaladas (MAPE 25%) do que com as embaladas (MAPE 44,6%, P < 0,001), sugerindo que a imagem e o nome do prato foram suficientes para ativar inferências contextuais mais eficazes quando a IA não era enviesada por embalagens genéricas ou mal rotuladas.
- Já o Gemini apresentou padrão mais linear: seu desempenho só se tornou competitivo quando recebeu dados completos, com MAPE de 8,7% nas refeições pré-embaladas (vs. 17,2% nas não industrializadas, P = 0,002), indicando maior dependência do detalhamento e menor capacidade de inferência sem suporte contextual
Conclusão e mensagem prática
Este estudo fornece uma nova evidência de que ferramentas baseadas em IA generativa podem desempenhar um papel na estimativa de carboidratos em tempo real, oferecendo uma alternativa viável, escalável e personalizada para pacientes com diabetes tipo 1, especialmente aqueles que enfrentam dificuldades com a contagem manual.
Entre os modelos avaliados, o ChatGPT-4o demonstrou desempenho superior em cenários realistas, como refeições em restaurantes, onde o paciente dispõe apenas de informações parciais — uma situação extremamente comum no cotidiano. Contudo, é fundamental atentarmos para o MAPE elevado (ou seja, a baixa acurácia) da tecnologia para a análise simplesmente da imagem de um prato, provando que por mais que possa ter um papel, ainda não consegue simplificar a tarefa ao ponto que muitos pacientes desejariam.
O estudo reforça, portanto, que a qualidade e confiabilidade das informações fornecidas são determinantes para o desempenho da IA: quanto mais estruturados os dados (por exemplo, pesos e porções), maior a acurácia da resposta. Outro ponto relevante é que, embora o foco do estudo tenha sido a estimativa de carboidratos, os autores reconhecem a importância de incorporar, futuramente, a influência de gorduras, proteínas e fibras na resposta glicêmica pós-prandial. Isso permitirá que as IAs evoluam de estimadores passivos para assistentes terapêuticos completos, otimizando cálculos de dose de insulina em sistemas fechados e protocolos de decisão automatizados.
Em resumo, a GenAI tem potencial para reduzir a o trabalho paciente, aumentar a precisão do manejo pós-prandial e tornar o cuidado com o diabetes mais acessível. O estudo não propõe a substituição da educação alimentar tradicional, mas sim sua complementação com tecnologia, de modo a promover segurança, autonomia e melhor controle glicêmico em contextos reais. Há a necessidade, contudo, de melhorias de sua acurácia e da dedicação dos pacientes em termos de alimentar informações adequadas para que possamos confiar completamente nos dados. A ver como a tecnologia pode evoluir neste cenário – potencial, há.
Como você avalia este conteúdo?
Sua opinião ajudará outros médicos a encontrar conteúdos mais relevantes.