Die Odyssee von Algorizmi zum Algorithmus offenbart: Citogenesis ist kein originäres Phänomen des Internet- und KI-Zeitalters. Es gibt sie bereits seit über 150 Jahren. Doch was genau verbirgt sich hinter dem Begriff? Eine Übersicht mit weiterführenden Fundstellen.
Zitierkreislauf von Falschinformation
Das aus dem Englischen kommende Wort Citogenesis bezeichnet einen Kreislauf, in dem falsche oder ungesicherte Informationen durch wiederholtes Zitieren scheinbar wahr werden. Das Comic xkcd hat den Begriff Anfang der 2000er Jahre geprägt. Eine fehlerhafte Information wird von einer unbelegten Quelle übernommen, erneut zitiert und durch zunehmende Verbreitung quasi-legitimiert. Mit jedem weiteren Verweis wächst die scheinbare Glaubwürdigkeit, obwohl die Information nie korrekt war.

Bildquelle: https://en.wikipedia.org/wiki/Wikipedia:List_of_citogenesis_incidents
Selbstverstärkung durch KI
Im KI-Zeitalter gewinnt Citogenesis besondere Relevanz: Sprachmodelle, automatisierte Recherchetools und generative Systeme können unbeabsichtigt entsprechende Fehler verstärken, denn weit zirkulierende Fehlinformationen dienen häufig als Trainingsdaten. Durch Wiedergabe der Informationen ohne Quellenprüfung entsteht ein selbstverstärkender Kreislauf, der sich viel schneller verbreitet als früher.
Sind Falschinformationen erst einmal in KI-Modellen fest verankert, ist es in der Regel sehr aufwändig, sie dort wieder zu entfernen. Große, tiefe neuronale Netze absorbieren das Wissen aus den Trainingsdaten in komplexen, nicht leicht interpretierbaren mathematischen Objekten (Modellparametern). Die ursprüngliche Information ist nicht mehr als einzelner „Datensatz“ gespeichert, sondern als ein Muster, das sich auf das gesamte Modell auswirkt.
Die Entfernung von Falschinformationen aus KI-Modellen, insbesondere solchen, die auf sehr großen und weit verbreiteten Trainingsdatensätzen basieren, ist daher wenig wahrscheinlich. Ein Teufelskreis, der nur schwer zu durchbrechen ist, da die Beseitigung falscher Daten viel Invest erfordert, aber nur ein schwer greifbares Return on Invest ermöglicht: Das verbesserter Daten. Insofern werden transparente Quellenangaben, eine überprüfbare Datenbasis und robuste Fact-Checking-Mechanismen immer wichtiger, um die Integrität digitaler Wissensräume zu sichern.
Beispiel: Al-Hwarizmi und Algorithums
Das Projekt „Die Odyssee von Algorizmi zum Algorithmus“ von van-Helsing.ai verdeutlicht, wie über eine Citogenesis über 150 Jahre hinweg aus einer unbelegten Vermutung eine gefühlte Wahrheit entstehen konnte. Ausgangspunkt war eine als solche gekennzeichnete Vermutung von Joseph Reinaud im Jahr 1849. Er glaubte, dass Al-Hzwarimi der Namensgeber des Wortes Algorithmus sei. Ohne einen einzigen Primärbeleg wurde die bloße Vermutung später zur Tatsache erhoben. Ausschlaggebend dafür waren vor allem deutsche Wissenschaftler, die behaupteten, dass die These bewiesen wäre. Fortan wurde das Narrativ von Lexika aller Sprachen ohne Belege weiterverbreitet. Mittlerweile gibt es Millionen von Texten, die das Narrativ verbreiten, ohne dass irgendwer noch wirklich prüft, ob es jemals richtig gewesen ist.
Die ganze Story hier als PDF: van-Helsing.ai – Die Odyssee von Algorizmi zum Algorithmus (166 Seiten, Stand Dezember 2025)
Mit Algorithmen Citogensen durchbrechen
Warum ist das überhaupt ein Problem? Warum ist es relevant? Der Inhalt von KI-Modellen wird durch immer häufigere Citogenesis verwässert: Sie interpretieren die Häufigkeit einer Information als Indiz für Richtigkeit. Hinzu kommen unzählige Querverlinkungen, welche für eine KI ebenfalls Echtheit suggerieren. Doch genau das ist das Tückische: Denn das Problem beruht auf dem Missverhältnis von Belegbarkeit und Zitierhäufigkeit. Eine Falschinformation wird nicht durch Wiederholung zur Wahrheit. Sie wird vielmehr zum Beispiel einer weltweit irreführenden Information. Die Auswirkung ist nicht zu unterschätzen, denn Algorithmen werden immer mehr zum Religionsersatz – zu einem Weltbild.
KI kann auf verschiedene Arten und Weisen dabei helfen, Citogenesis aufzudecken, u.a durch eine Zitationsanalyse. Sie hilft zu erkennen, wer von wem wann zitiert wurde. Darauf basierend können die Zitate im Hinblick auf ihre Korrektheit überprüft werden.

Bildquelle: https://de.wikipedia.org/wiki/Zitationsanalyse
KI hilft aber auch so – ohne Zitationsanalyse: Zum Beispiel in dem sie im Internet nach Widersprüchen sucht, welche eine bestimmte Information betreffen. KI ermöglicht es zudem, z.T. uralte Original-Dokumente in riesigen Online-Archiven zu finden, zu übersetzen und zu interpretieren. Hinzu kommt das Wechselspiel von Community-Lexika wie wikipedia und KI-Lexika wie grokipedia: Ihre komplementäre Aufstellung macht es möglich, die potenziellen Beispiele einer Citogenesis beim jeweils anderen Portal validieren zu lassen.
Wie Algorithmen zur Aufdeckung einer Citogenesis genutzt werden kann, beschreibt die Methode der Algorithmic validated Plausibility (AVP).