Pesquisadores avaliaram 250 respostas geradas chatbots de IA generativa disponíveis ao público geral e publicaram o estudo através do artigo científico: Chatbots generativos orientados por inteligência artificial e desinformação médica: uma auditoria de precisão, referenciamento e legibilidade.
Os chatbots baseados em inteligência artificial (IA) têm sido rapidamente adotados em pesquisa, educação, negócios, marketing e medicina. A maioria das interações, no entanto, vem de não especialistas que usam chatbots como mecanismos de busca, inclusive para consultas cotidianas sobre saúde e medicina.
O estudo analisou as respostas de chatbots nas áreas de saúde e medicina propensas à desinformação. Cinco chatbots populares foram avaliados. Em fevereiro de 2025, cada chatbot foi solicitado a responder 10 perguntas de cinco categorias: câncer, vacinas, células-tronco, nutrição e desempenho atlético, usando perguntas abertas e fechadas projetadas para induzir os modelos a fornecerem desinformação ou conselhos contraindicados.
Dois especialistas de cada categoria avaliaram as respostas como “não problemáticas”, “um tanto problemáticas” ou “altamente problemáticas” usando uma matriz de codificação baseada em critérios objetivos e predefinidos. As citações foram pontuadas quanto à precisão e completude, e cada resposta recebeu uma pontuação de Facilidade de Leitura de Flesch.
Quase metade (49,6%) das respostas foram problemáticas: 30% um tanto problemáticas e 19,6% altamente problemáticas. A qualidade das respostas não diferiu significativamente entre os chatbots (p=0,566). Alucinações (interpretações equivocadas) do chatbot e citações fabricadas impediram que qualquer chatbot produzisse uma lista de referências totalmente precisa. Todas as pontuações de legibilidade foram classificadas como ‘Difícil’ (30–50), equivalente ao nível de estudante universitário do segundo ao último ano.
O estudo conclui que os chatbots auditados tiveram um desempenho ruim ao responder perguntas em áreas de saúde e medicina, propensas à desinformação. Diante da expansão dessas ferramentas, os dados reforçam a necessidade de educação pública, capacitação profissional e regulação, para que a IA apoie — e não comprometa — a saúde pública, escreveram os autores do estudo.
O estudo foi liderado pelo Dr. Nicholas B. Tiller, Ph.D., vinculado ao Lundquist Institute for Biomedical Innovation do UCLA Medical Center, nos EUA, e foi publicado online em 14/04/2026 no periódico BMJ Open.
Fonte: https://bmjopen.bmj.com/content/bmjopen/16/4/e112695.full.pdf