Wurde ein Text von einem Menschen verfasst oder von einer künstlichen Intelligenz (KI) erstellt? Heutzutage ist es durchaus schwierig, den Unterschied zu erkennen. Unser Leitfaden hilft dir dabei, KI-Texte zu identifizieren.
In unserem Artikel möchten wir:
- Ein besseres Verständnis für die KI-Textgenerierung vermitteln.
- Die Unterschiede zwischen von Menschen verfassten und KI-generierten Texten erklären.
- Online-Tools und Methoden vorstellen, mit denen du KI-generierte Texte aufspüren kannst – zumindest in der Theorie.
Lass uns gemeinsam die Geheimnisse von KI-generierten Texten lüften und sicherstellen, dass du in der Lage bist, authentische menschliche Schreibarbeit von maschinell erstellten Inhalten zu unterscheiden. Legen wir los!
Was ist eigentlich KI? Die Grundlagen
Definition von KI und Sprachmodellen
Künstliche Intelligenz (KI) beschreibt die Fähigkeit von Maschinen oder Computersystemen, Aufgaben zu erledigen, die normalerweise menschliche Intelligenz erfordern. Dazu gehören:
- Lernen
- Problemlösen
- Mustererkennung
- Spracherkennung
- Entscheidungsfindung
KI nutzt Algorithmen und große Datenmengen, um Muster zu erkennen und daraus Schlüsse zu ziehen. Es gibt zwei Hauptarten: Schwache KI spezialisiert sich auf spezifische Aufgaben (z. B. Sprachassistenten), während starke KI menschenähnliches Denken und Bewusstsein anstrebt, was bisher allerdings noch Zukunftsmusik ist.
Lesetipp
Lies mehr zu den Basics von KI hier: Was ist KI? Alles zum Thema künstliche Intelligenz – einfach erklärt.
Sprachmodelle sind eine spezielle Art von künstlicher Intelligenz und darauf trainiert, die menschliche Sprache zu verstehen, zu replizieren und darauf zu reagieren. Sprachmodelle nutzen statistische und maschinelle Lerntechniken, um in großen Textmengen Muster zu erkennen und darauf basierend sinnvolle Texte zu erzeugen oder Fragen zu beantworten.
Im Wesentlichen funktionieren Sprachmodelle, indem sie die Wahrscheinlichkeit vorhersagen, welches Wort oder welche Wortkombination als Nächstes in einem Satz erscheint. Dafür werden riesige Textmengen analysiert, um Zusammenhänge zwischen Wörtern, Sätzen und Kontexten zu lernen.
Das folgende Video erklärt die Grundfunktionen von Sprachmodellen anschaulich und kurzweilig:
Es gibt verschiedene Typen von Sprachmodellen, die sich in ihrer Architektur, ihrem Trainingsansatz und ihren Anwendungsmöglichkeiten unterscheiden. Die wichtigsten Typen sind:
- N-Gramm-Modelle: Diese basieren auf der Wahrscheinlichkeit, dass eine bestimmte Wortfolge auftritt. Sie berücksichtigen nur eine begrenzte Anzahl vorhergehender Wörter (zum Beispiel die letzten zwei oder drei) und verwenden diese, um das nächste Wort zu predizieren. Beispiel: Ein Bigramm-Modell berücksichtigt immer nur die letzten zwei Wörter.
- Statistische Sprachmodelle: Diese Modelle verwenden große Korpora von Texten und ermitteln Wahrscheinlichkeiten für Wortfolgen. Sie zählen die Häufigkeit von Wortkombinationen und berechnen daraus Wahrscheinlichkeiten.
- Neuronale Sprachmodelle: Diese Modelle basieren auf künstlichen neuronalen Netzen, die gelernt haben, Wortwahrscheinlichkeiten zu berechnen. Sie haben die Fähigkeit, aus größeren Kontexten zu lernen und komplexere Sprachstrukturen zu erfassen.
- Transformator-basierte Modelle: Diese modernen Sprachmodelle basieren auf der Transformer-Architektur, die es ihnen ermöglicht, lange Textpassagen effizient zu verarbeiten, indem sie auf Selbstaufmerksamkeit (Self-Attention) setzen. Sie sind in der Lage, Kontextinformationen aus sehr langen Texten zu lernen und zu nutzen. Beispiele: GPT (Generative Pretrained Transformer), BERT (Bidirectional Encoder Representations from Transformers), T5 (Text-to-Text Transfer Transformer).
- Autoregressive Sprachmodelle: Diese Modelle generieren Text, indem sie das nächste Wort basierend auf den vorhergehenden Wörtern vorhersagen, wobei sie ein Wort nach dem anderen erzeugen.
Jedes dieser Modelle hat seine spezifischen Stärken und Anwendungsgebiete – von einfachen Vorhersagen bis hin zu komplexeren Aufgaben wie Textzusammenfassung, Übersetzung oder Bildbeschreibung.
Wie funktioniert ChatGPT?
Fast jeder hat schon einmal ChatGPT genutzt – aber wie funktioniert der Chatbot eigentlich?
ChatGPT funktioniert, indem es große Mengen an Texten aus dem Internet liest und daraus Muster und Zusammenhänge in der Sprache lernt. Es ist ein Transformator-basiertes Modell. Hier ist eine sehr vereinfachte Erklärung:
- Training: ChatGPT wurde mit riesigen Textmengen trainiert, die viele verschiedene Themen abdecken. Dabei hat es gelernt, wie Wörter, Sätze und Absätze zusammenhängen. Es merkt sich keine spezifischen Daten, sondern nur Muster in der Sprache.
- Verstehen der Eingabe: Wenn du eine Frage stellst oder einen Satz schreibst, analysiert ChatGPT diese Eingabe, um zu verstehen, was du meinst. Dabei schaut es auf die Wörter und ihren Kontext (etwa, welche Wörter zusammengehören).
- Antworten generieren: ChatGPT erstellt dann eine Antwort, die auf den gelernten Mustern basiert. Es wählt die wahrscheinlichsten Wörter und Sätze aus, die gut zu deiner Anfrage passen und sinnvoll erscheinen.
- Kein echtes "Verständnis": ChatGPT "versteht" die Dinge nicht so wie ein Mensch. Es erkennt nur Muster und nutzt diese, um Text zu generieren, der wie eine sinnvolle Antwort aussieht.
KI-Texterkennung: Warum eigentlich?
Die Fähigkeit, KI-generierte Texte von menschlich verfassten Inhalten zu unterscheiden, ist aus unterschiedlichen Gründen von Bedeutung.
Schutz vor Desinformation und Manipulation
Die Erkennung von KI-Texten kann dazu beitragen, Desinformation und Manipulation entgegenzuwirken. KI-generierte Inhalte können nämlich für die Verbreitung von Fake News oder zur gezielten Beeinflussung der öffentlichen Meinung eingesetzt werden.
Die Verbreitung von Fehlinformationen muss dabei noch nicht einmal mit bösen Absichten passieren, denn: Chatbots antworten häufig mit Falschinformationen. Eine Untersuchung von AlgorithmWatch und CASM Technology aus dem Juli und August 2024 ergab etwa, dass das GPT-3.5-Modell fast 30 Prozent falsche Informationen als Antwort auf Fragen zu den Landtagswahlen in Thüringen, Sachsen und Brandenburg liefert.
Einfluss auf Suchmaschinenoptimierung (SEO)
Für Unternehmen und Website-Betreiber ist die Unterscheidung zwischen KI-generierten und menschlich verfassten Texten auch im Bereich der Suchmaschinenoptimierung von großer Relevanz. Hochwertige, von Menschen erstellte Inhalte haben in der Regel bessere Chancen, in den Suchmaschinenrankings höher einzustufen.
Dieses Video geht tiefer ins Detail:
Ethische und rechtliche Fragen
Die Identifizierung von KI-generierten Texten kann zudem helfen, ethische und rechtliche Fragestellungen zu klären. Menschen haben das Recht zu wissen, ob sie mit maschinell erstellten Inhalten konfrontiert werden, und mögliche Urheberrechtsverletzungen können dadurch leichter aufgedeckt werden.
Warum die Fähigkeit, KI-generierte Texte zu erkennen, besonders für Lehrer von großer Wichtigkeit ist
Für Lehrer ist es wichtig, KI-generierte Texte erkennen zu können, weil es mehrere zentrale Aspekte des Bildungsprozesses betrifft:
Ehrlichkeit und akademische Integrität: Schüler könnten KI verwenden, um Aufgaben zu erledigen, ohne wirklich selbst daran zu arbeiten. Dies stellt ein Problem für die akademische Integrität dar, da es sich um eine Form des Plagiats handelt. Lehrer müssen in der Lage sein, zwischen echten Schülerbeiträgen und KI-generierten Inhalten zu unterscheiden, um sicherzustellen, dass die Schüler fair bewertet werden und sich die nötigen Fähigkeiten selbst erarbeiten.
Lernprozess und Kompetenzerwerb: Der Zweck von Aufgaben und Aufsätzen ist es, den Schülern zu helfen, bestimmte Fähigkeiten wie kritisches Denken, Ausdrucksfähigkeit und Recherchekompetenz zu entwickeln. Wenn Schüler KI nutzen, um diese Aufgaben zu umgehen, gefährden sie ihren eigenen Lernprozess. Lehrkräfte müssen KI-generierte Texte erkennen, um gezielt Unterstützung bieten zu können und sicherzustellen, dass die Schüler tatsächlich lernen.
Falsche Informationen oder Verzerrungen: KI-Modelle wie ChatGPT generieren Texte auf der Grundlage von Mustern und Daten, die sie aus dem Internet lernen. Dabei kann es vorkommen, dass KI-Texte ungenaue oder verzerrte Informationen enthalten. Lehrer müssen diese Texte erkennen, um sicherzustellen, dass die Schüler keine fehlerhaften Informationen als korrekt übernehmen.
Förderung von Originalität und Kreativität: Originalität und kreatives Denken sind zentrale Ziele der Bildung. Wenn Schüler KI nutzen, um kreative Aufgaben wie Essays oder Analysen zu erledigen, kann dies den kreativen Ausdruck und die Fähigkeit zur selbständigen Ideenentwicklung einschränken. Lehrer, die KI-generierte Texte erkennen können, fördern somit das kreative Potenzial der Schüler.
Anpassung von Lehrmethoden: Lehrkräfte, die sich der zunehmenden Nutzung von KI bewusst sind, können ihre Unterrichtsmethoden anpassen. Dies kann bedeuten, dass sie verstärkt auf mündliche Prüfungen, kollaboratives Arbeiten oder kreative Aufgaben setzen, die schwieriger von einer KI bewältigt werden können.
Mensch oder Maschine? Anzeichen für KI-Texte
Es gibt gewisse sprachliche Eigenheiten, die KI-generierte Texte von menschlichem Content unterscheiden.
Stil, Abwechslungsreichtum und Formatierung
KI-generierte Texte weisen im Vergleich zu von Menschen verfassten Texten oft Defizite in Hinblick auf Stil, Abwechslungsreichtum und Formatierung auf. Mögliche Indikatoren für KI-Texte könnten die folgenden sein:
- Eine geringe Originalität im Schreibstil
- Wenig Abwechslung in Satzstrukturen
- Zahlreiche (Wort-)Wiederholungen
- Bestimmte Grammatikfehler, zum Beispiel falsch gesetzte Kommas
- Ein SEO-lastiger Stil mit auffällig aneinandergereihten Keywords
Typische Fehler und Schwächen
Darüber hinaus können sprachliche Mängel darauf hindeuten, dass ein Text von einem KI-Textgenerator stammt. KI-Texte weisen oft folgende Merkmale auf:
- Schwierigkeiten bei der Verwendung von Abkürzungen und Fachbegriffen
- Fehler bei der Nutzung von Artikeln und Konjunktionen
- Unnatürlich lange Textabschnitte mit zahlreichen kurzen Sätzen
Lesetipp
Am schnellsten entwickelst du ein Gespür für die Charakteristika KI-generierter Texte, wenn du regelmäßig mit ihnen arbeitest. Lies dir dazu unseren Artikel zur KI-Texterstellung durch: KI-Texte schreiben: Die besten Tools und wichtige Tipps für hervorragenden KI-Content.
Was können KI-Erkennungstools?
KI-Erkennungstools bieten (vermeintlich) eine schnelle Möglichkeit, maschinell generierte Texte als solche zu identifizieren. Doch wie zuverlässig sind solche Detektoren wirklich?
Einen ersten Hinweis darauf, dass KI-Erkennungstools nicht besonders gut funktionieren, ist das Beispiel AI Classifier. Die Anwendung aus dem Hause OpenAI, dem Unternehmen hinter ChatGPT und DALL-E, ist seit dem Juli 2023 nicht mehr verfügbar.
Die OpenAI-Entwickler schreiben hierzu:
The classifier is very unreliable on short texts (below 1,000 characters). Even longer texts are sometimes incorrectly labeled by the classifier. Sometimes human-written text will be incorrectly but confidently labeled as AI-written by our classifier. We recommend using the classifier only for English text. It performs significantly worse in other languages and it is unreliable on code. Text that is very predictable cannot be reliably identified. For example, it is impossible to predict whether a list of the first 1,000 prime numbers was written by AI or humans, because the correct answer is always the same. AI-written text can be edited to evade the classifier.
Die Erkennungsrate von KI-Detektoren scheint also nicht besonders hoch auszufallen. Daher ist Vorsicht geboten, wenn du ein KI-Erkennungstool nutzt: nicht immer kann dem Urteil vertraut werden.
Du möchtest trotzdem ein digitales Werkzeug zur Identifikation von (potenziellen) KI-Texten nutzen? Zu den bekanntesten Anbietern von KI-Detektoren gehören die folgenden:
Scribbr
Das Tool von Scribbr bietet KI-Detektor und Plagiatsprüfung in einem – aber mit Abstrichen. Einfach anmelden und das Dokument der Wahl hochladen – es wird laut Scribbr "mit der größten Content-Datenbank der Welt verglichen, die 99 Milliarden Webseiten, 8 Millionen Veröffentlichungen und über 20 Sprachen umfasst". Anschließend erhältst du eine Einschätzung, wie groß das Risiko eines Plagiats für das hochgeladene Dokument zu sein scheint.
Für einen Detailbericht und die Information, ob für den Text KI benutzt wurde, musst du allerdings zahlen (sofern du einen deutschen Text prüfen willst – englischsprachige Texte kannst du bis zu einer gewissen Länge auch kostenlos auf KI checken). In der kostenlosen Version siehst du nur eine knappe Plagiatsrisikoanalyse sowie einige Quellen mit der größten Übereinstimmung.
Copyleaks
Sehr ähnlich wie Scribbr funktioniert die KI-Texterkennung von Copyleaks: das Tool prüft sowohl, ob KI genutzt wurde, als auch hinsichtlich möglicher Plagiatsprobleme. Detailberichte sind aber erst mit Premium-Plan einsehbar. Derzeit (Stand: Januar 2025) kostet die Kombination aus KI- und Plagiatserkennung rund 17 Dollar pro Monat.
Detectora von Tom Tlok
Detectora entstand, während Entwickler Tom Tlok sein Masterstudium in Artificial Intelligence & Data Science an der FH Wedel absolvierte. Es ermöglicht in der kostenlosen Demoversion eine KI-Prüfung, die allerdings nur für alte Sprachmodelle (GPT 3.5) und Fließtexte zuverlässig funktioniert. Für genauere Ergebnisse und die Erkennung neuester Sprachmodelle muss die Vollversion gekauft werden.
Ein interessantes Interview mit Tom Tlok findest du hier:
Weiterbildung zum KI-Manager mit dem BZKI
Künstliche Intelligenz wird zunehmend auch für kleine und mittlere Unternehmen zur Voraussetzung für anhaltende Wettbewerbsfähigkeit. Das Bildungszentrum für künstliche Intelligenz (BZKI) bildet deine Mitarbeiter zu IHK-zertifizierten KI-Managern aus – und das mit bis zu 100 Prozent staatlicher Förderung, sodass dir keinerlei Kosten entstehen.
FAQ
Noch Fragen? Hier sind die Antworten.
Wie kann ich erkennen, ob ein Text von einer KI geschrieben wurde?
KI-generierte Texte haben oft eine sehr gleichmäßige Satzstruktur, wiederholen sich manchmal inhaltlich und klingen oft zu "glatt" oder. Außerdem fehlen ihnen oft persönliche Erfahrungen oder emotionale Tiefe.
Gibt es Tools, die KI-Texte erkennen können?
Ja, es gibt verschiedene Online-Tools, die KI-generierte Texte analysieren, z. B. Detectora von Tom Tlok, OpenAI Text Classifier (eingestellt) oder Copyleaks AI Detector. Diese Tools berechnen Wahrscheinlichkeiten, aber sie sind nicht immer zuverlässig.
Sind KI-Texte immer leicht zu erkennen?
Nicht unbedingt. Moderne KI-Modelle wie GPT-4 oder Gemini sind sehr fortgeschritten und können menschliche Schreibweisen gut nachahmen. Manche KI-generierte Texte sind fast nicht von menschlichen zu unterscheiden.
Wie sicher sind KI-Erkennungstools?
Kein KI-Erkennungstool ist 100 % zuverlässig. Die Tools können falsche Ergebnisse liefern, sowohl in die eine als auch in die andere Richtung. Die beste Methode ist oft eine Kombination aus Tool-Analyse und menschlichem Urteilsvermögen.