genESOM: IA cria dados sintéticos para reduzir testes em animais

Inês Margarida Carvalho • June 21, 2026 06:03

Os estudos pré-clínicos de fármacos colocam frequentemente os investigadores perante um equilíbrio difícil. Por motivos éticos, os cientistas procuram recorrer ao menor número possível de animais.

O problema é que, quando os ensaios com ratos ficam demasiado reduzidos, a estatística deixa de ser robusta: efeitos reais do tratamento perdem-se no ruído.

Agora, uma equipa na Alemanha afirma ter encontrado uma forma de contornar este impasse. Desenvolveu um sistema de IA capaz de gerar dados sintéticos realistas com o objectivo de diminuir o recurso a testes em animais.

A proposta do modelo é recuperar sinais que se esfumam em experiências subdimensionadas, mantendo sob controlo o risco de falsos positivos.

O dilema no laboratório

Por razões éticas, os testes pré-clínicos devem usar o número mais baixo possível de animais, desde que os resultados continuem fiáveis.

A dificuldade é que amostras pequenas muitas vezes não permitem chegar a uma resposta aproveitável: a variabilidade entre ratos pode ocultar aquilo que o medicamento está realmente a provocar.

Jörn Lötsch, cientista de dados e farmacologista clínico na Universidade Goethe de Frankfurt, juntou-se a Alfred Ultsch, informático na Universidade Philipps de Marburgo, para abordar o problema pelo lado matemático.

Nenhum dos dois conduz, por si, experiências com animais. Ainda assim, ambos trabalham há anos na mesma questão de base: como extrair um sinal limpo de conjuntos de dados demasiado pequenos para sustentarem conclusões firmes.

Ensinar à IA os padrões dos ratos

A dupla criou o genESOM e treinou-o com dados reais de ratos fornecidos pelo Instituto Fraunhofer de Medicina Translacional e Farmacologia.

O conceito é fácil de enunciar, mas difícil de executar na prática.

Trata-se de um tipo de IA generativa assente em milhares de neurónios artificiais que se organizam para reproduzir a estrutura interna de um conjunto de dados - uma abordagem conhecida como mapa auto-organizável.

Depois de aprender essa estrutura, o sistema consegue criar novos pontos de dados que se enquadram nela.

Na maioria dos métodos generativos, a aprendizagem e a geração são feitas num único processo. Já Lötsch e Ultsch optaram, de forma intencional, por separar as duas fases: primeiro aprender e só depois sintetizar.

Manter os resultados credíveis

Os métodos generativos têm um risco bem conhecido: amplificam aquilo que observam. Um desvio aleatório pode reaparecer duplicado ou triplicado, tornando-se suficientemente “alto” para um teste estatístico o interpretar como um efeito real do tratamento.

Este fenómeno chama-se inflação do erro e gera falsos positivos indistinguíveis de resultados verdadeiros. O genESOM inclui uma protecção interna para lidar com isso.

Antes de criar novos pontos, a equipa introduz propositadamente um sinal de erro artificial. À medida que os pontos adicionais se acumulam, os investigadores acompanham o crescimento desse sinal “plantado”.

Quando a inflação ultrapassa um limiar, o modelo interrompe a geração. Esse ponto de paragem é determinado pelos próprios dados, e não por um palpite do investigador sobre quando deve parar.

Menos animais, resultados equivalentes

O método foi testado num estudo pré-clínico sobre esclerose múltipla. No trabalho original, 26 ratos foram distribuídos por três grupos de tratamento para avaliar um fármaco experimental.

Lötsch e Ultsch reduziram deliberadamente o conjunto para 18 animais, com seis ratos por grupo, para simular uma experiência mais pequena. Nessa versão reduzida, todos os efeitos de tratamento detectados anteriormente desapareceram.

Os testes estatísticos não encontraram nada. Mesmo ferramentas de aprendizagem automática não conseguiram distinguir entre os três grupos. O sinal tinha sido engolido pelo ruído.

De seguida, os investigadores aplicaram o genESOM ao conjunto mais pequeno. Todos os efeitos que tinham surgido na experiência com 26 animais regressaram com a mesma intensidade.

Não apareceram novos falsos positivos. O sinal manteve-se preservado.

A aprendizagem profunda ficou aquém

Outras abordagens de IA não passaram pela mesma prova. Redes complexas de aprendizagem profunda - as que dominam as manchetes sobre IA generativa - não conseguiram recuperar, a partir do conjunto reduzido, os efeitos originais do tratamento.

Esses modelos produziram pontos de dados com aparência plausível. No entanto, as estruturas geradas deixaram de conseguir transportar o sinal original do tratamento através dos testes estatísticos.

Os mapas auto-organizáveis são mais antigos do que as actuais redes de aprendizagem profunda. Projectam os dados numa grelha estruturada, preservando as relações entre os pontos.

Em conjuntos pequenos e “desarrumados”, esta abordagem mais antiga consegue funcionar onde métodos mais vistosos acabam por estagnar.

A IA não resolve tudo

O método não salva uma experiência que já nasceu demasiado frágil. Se um estudo começa com três ratos por grupo, o genESOM não tem estrutura suficiente para aprender.

Se os números forem reduzidos em excesso, a ampliação tende sobretudo a reforçar a variação aleatória - transformando uma experiência pequena e ruidosa numa experiência maior, mas igualmente ruidosa.

“Se forem incluídos animais a menos numa experiência e esse número for depois simplesmente complementado com IA generativa, a experiência pode rapidamente tornar-se cientificamente inútil devido à amplificação de resultados aleatórios”, afirmou Lötsch.

A solução é real, mas tem limites. Em vários conjuntos de dados analisados pela equipa, a redução consistente situa-se entre 30 e 50 por cento.

Essa redução de 30 a 50 por cento aplica-se a estudos exploratórios com animais - não a ensaios confirmatórios nem a investigação em humanos, onde existem critérios diferentes para definir o que é um volume de dados adequado.

Além disso, o método foi validado com apenas um número limitado de conjuntos de dados animais, e ainda não se sabe com que consistência se manterá em diferentes áreas de investigação.

O futuro dos testes em animais

No desenvolvimento de medicamentos, entre um terço e metade dos ratos usados em estudos de fase inicial poderão, em teoria, ser substituídos por pontos de dados calculados que se comportam como medições reais.

“Com o genESOM, podemos dar um contributo importante para reduzir o número de experiências com animais em grandes áreas da investigação pré-clínica”, disse Lötsch.

Até este estudo, ninguém tinha demonstrado que um modelo generativo pudesse substituir ratos em falta sem inflacionar falsos positivos. O sistema genESOM parece fazer precisamente isso - e também sabe quando deve parar.

O que muda é a matemática por trás das experiências exploratórias.

Os laboratórios poderão planear estudos iniciais mais pequenos, recuperar padrões relevantes a partir de dados limitados e diminuir o número de animais necessário para chegar a conclusões úteis.