Citogénesis: explicación breve

La odisea de Algorizmi hasta el algoritmo revela: la citogénesis no es un fenómeno originario de la era de internet y la IA. Existe desde hace más de 150 años. Pero ¿qué se esconde exactamente detrás del término? Una panorámica con referencias adicionales.

Ciclo de citación de desinformación

La palabra citogénesis, procedente del inglés (citogenesis), designa un ciclo en el que informaciones falsas o no verificadas, mediante citas repetidas, pasan a parecer verdaderas. El cómic xkcd acuñó el término a principios de los años 2000. Una información errónea se toma de una fuente sin respaldo, se vuelve a citar y, con su creciente difusión, queda cuasi legitimada. Con cada nueva referencia aumenta su credibilidad aparente, aunque la información nunca haya sido correcta.

Fuente de la imagen: https://en.wikipedia.org/wiki/Wikipedia:List_of_citogenesis_incidents

Autorefuerzo mediante IA

En la era de la IA, la citogénesis cobra una relevancia especial: los modelos de lenguaje, las herramientas de investigación automatizadas y los sistemas generativos pueden reforzar involuntariamente este tipo de errores, porque la desinformación ampliamente difundida suele servir como dato de entrenamiento. Al reproducir la información sin verificación de fuentes se crea un ciclo que se autoalimenta y que puede propagarse mucho más rápido que antes.

Una vez que la desinformación queda firmemente arraigada en modelos de IA, por lo general resulta muy costoso eliminarla. Las redes neuronales grandes y profundas absorben el “conocimiento” de los datos de entrenamiento en objetos matemáticos complejos y no fácilmente interpretables (parámetros del modelo). La información original ya no se almacena como un “registro” individual, sino como un patrón que afecta al modelo en su conjunto.

Por ello, es poco probable eliminar desinformación de modelos de IA, especialmente de aquellos basados en conjuntos de entrenamiento muy grandes y ampliamente difundidos. Un círculo vicioso difícil de romper, ya que depurar datos falsos requiere mucha inversión, pero ofrece un retorno difícil de cuantificar: datos mejorados. En este sentido, la transparencia en las fuentes, una base de datos verificable y mecanismos robustos de fact-checking se vuelven cada vez más importantes para asegurar la integridad de los espacios digitales de conocimiento.

Ejemplo: Al-Juarismi y “Algorithums”

El proyecto “La odisea de Algorizmi hasta el algoritmo” de van-Helsing.ai muestra cómo, a través de una citogénesis de más de 150 años, una conjetura sin pruebas pudo convertirse en una “verdad” asumida. El punto de partida fue una suposición señalada explícitamente como tal por Joseph Reinaud en 1849. Creía que Al-Juarismi había dado nombre a la palabra “algoritmo”. Sin una sola prueba primaria, la mera hipótesis fue elevada más tarde a hecho. Fueron decisivos, sobre todo, científicos alemanes que afirmaron que la tesis estaba demostrada. A partir de entonces, el relato fue difundido por enciclopedias de todos los idiomas sin pruebas. Hoy existen millones de textos que reproducen esa narrativa sin que nadie compruebe de verdad si alguna vez fue cierta.

Toda la historia aquí en PDF: van-Helsing.ai – La odisea de Algorizmi hasta el algoritmo (166 páginas, estado: diciembre de 2025)

Romper citogénesis con algoritmos

¿Por qué es esto un problema? ¿Por qué es relevante? El contenido de los modelos de IA se diluye por citogénesis cada vez más frecuentes: interpretan la frecuencia de una información como indicio de veracidad. A esto se suman innumerables enlaces cruzados, que también sugieren “autenticidad” para una IA. Pero precisamente ahí está lo insidioso: el problema se basa en el desequilibrio entre capacidad de prueba y frecuencia de citación. Una desinformación no se convierte en verdad por repetición. Más bien se convierte en ejemplo de una información globalmente engañosa. El impacto no debe subestimarse, porque los algoritmos se convierten cada vez más en un sustituto de la religión: en una cosmovisión.

La IA puede ayudar de varias maneras a detectar citogénesis, por ejemplo mediante un análisis de citaciones. Ayuda a identificar quién citó a quién y cuándo. Sobre esa base, las citas pueden revisarse en cuanto a su corrección.

Fuente de la imagen: https://de.wikipedia.org/wiki/Zitationsanalyse

Pero la IA también ayuda de otras formas, incluso sin análisis de citaciones: por ejemplo, buscando en internet contradicciones relacionadas con una determinada información. Además, la IA permite encontrar, traducir e interpretar documentos originales —a veces antiquísimos— en enormes archivos en línea. A ello se suma la interacción entre enciclopedias comunitarias como Wikipedia y enciclopedias de IA como Grokipedia: su carácter complementario permite validar los posibles ejemplos de citogénesis en el portal respectivo del otro.

Citogénesis: explicación breve

Ciclo de citación de desinformación

Fuente de la imagen: https://en.wikipedia.org/wiki/Wikipedia:List_of_citogenesis_incidents

Autorefuerzo mediante IA

Ejemplo: Al-Juarismi y “Algorithums”

Romper citogénesis con algoritmos

Fuente de la imagen: https://de.wikipedia.org/wiki/Zitationsanalyse

1. Algoritmo - un término clave

¿Qué es el círculo vicioso de Papá Noel?

Etimologia del Algoritmo

1. Algoritmo – un término clave

2. Algoritmo – ¿un epónimo confirmado?

3. Algoritmo – Tesis A: Hisāb al-ġubār

4. Algorittmo – Tesis B: uso en la Edad Media

5. Algoritmo – Tesis C: retroproyección

6. Algoritmo — resultado y conclusiones