Categories: BlogKI im Geschäft

KI-Inhaltsdetektoren. Sind sie es wert? | KI im Geschäft #38

Heute präsentieren Entwickler von KI-Inhaltsdetektoren diese als Werkzeuge zur Wahrung der Authentizität. Die Frage ist, sind sie das Vertrauen und die Investition wert? In diesem Artikel werden wir uns ansehen, wie KI-Inhaltsdetektoren funktionieren, warum sie möglicherweise aussterben könnten, welche Herausforderungen sie mit sich bringen und welche ethischen Dilemmata sie aufwerfen.

KI-Inhaltsdetektoren

KI-Inhaltsdetektoren basieren auf Sprachmodellen, die ähnlich denen sind, die zur Generierung von KI-Inhalten verwendet werden. Sie lassen sich in solche unterteilen, deren Aufgabe es ist, den Ursprung von Bildern, Texten und Musik zu überprüfen, die mit Unterstützung künstlicher Intelligenz erstellt wurden. Jeder Typ von “KI-Detektor” funktioniert etwas anders, aber keiner von ihnen kann mit absoluter Sicherheit zwischen menschlich erstellten und KI-generierten Inhalten unterscheiden.

KI-generierte Bilddetektoren spielen aufgrund der Macht der Medien zur Erzeugung von Fake News eine zunehmend wichtige Rolle. Sie analysieren Anomalien, charakteristische Stile und Muster und suchen nach Zeichen, die von Modellen wie DALL-E hinterlassen wurden.

Prominent unter den Detektoren, die zur Identifizierung von Bildern verwendet werden, ist das Tool “AI or Not” von Optic, das Bilddatenbanken nutzt, die von Midjourney, DALL-E und Stable Diffusion generiert wurden. Während die Ergebnisse unsicher sind, ist es ein Schritt in Richtung Entwicklung präziserer Identifikationsmethoden in der Zukunft.

Quelle: AI or Not (https://www.aiornot.com/)

Hinter dem Betrieb von KI-Detektoren, die KI-generierte Texte erkennen, stehen fortschrittliche Algorithmen, die die Struktur und Wortwahl des Textes analysieren und dann KI-spezifische Muster erkennen. Sie nutzen:

  • Classifier – ein Algorithmus, der Texte klassifiziert und Stil, Ton und Grammatik überprüft. Zum Beispiel könnte eine Produktbeschreibung, die zu jedem Produkt ihrer Art passen könnte, als KI-Kreation klassifiziert werden,
  • Embeddings – numerische Darstellungen von Wörtern, die es Maschinen ermöglichen, den Kontext ihrer Verwendung zu verstehen. Dank ihnen “versteht” das Programm, dass ein Text mit einer monotonen Auswahl von Wörtern das Werk von KI sein kann,
  • Perplexität – die ein Maß für die Unvorhersehbarkeit eines Textes ist. Texte, die von Menschen geschrieben werden, haben tendenziell eine höhere Perplexität, obwohl Texte, die von Natur aus einfach, utilitaristisch in typischer Form oder von Ausländern geschrieben sind, fälschlicherweise als KI-generiert klassifiziert werden können,
  • Diversität – dieser Faktor beschreibt die Variabilität in Satzlängen und -strukturen. Menschen neigen dazu, vielfältigere Texte zu schreiben als künstliche Intelligenz.

Die oben genannten Elemente werden von KI-Inhaltsdetektoren zusammen verwendet, um zu beurteilen, ob es sich um von Menschenhand geschriebene oder maschinell erzeugte Texte handelt.

Warum KI-Inhaltsdetektoren verwenden?

KI-Inhaltsdetektoren arbeiten in verschiedenen Bereichen – von Bildung über Marketing bis hin zu Rekrutierung. Hier sind die wichtigsten Gründe, sie als Werkzeug zur Unterstützung der Bewertung zu nutzen, jedoch nicht als definitiven Beweis dafür, ob Inhalte generiert wurden:

  • Identifizierung von KI-modifizierten Fotos bekannter Personen – um zu erkennen, ob das Foto eine reale Situation darstellt,
  • Verhinderung von Desinformation – Im Kontext des Kampfes gegen Desinformation helfen effektive KI-Inhaltsdetektoren Social-Media-Moderatoren, sich verbreitende falsche Informationen zu erkennen, um sich wiederholende Inhalte, die von Bots generiert wurden, zu identifizieren und zu eliminieren,
  • Begrenzung der Veröffentlichung von Texten mit geringem Wert – KI-Inhaltsdetektoren können Verlegern helfen, Texte abzulehnen, die generische Informationen enthalten, die von ChatGPT, Bing oder Bard nach Eingabe einer einfachen Anfrage generiert wurden.

Es ist jedoch wichtig zu beachten, dass der Ursprung des Textes nicht die Grundlage für Googles Abwertung eines Seitenrankings ist. Der Blog des Google Search Centers besagt, dass es für Google entscheidend ist, “qualitativ hochwertige Inhalte unabhängig davon zu belohnen, wie sie erstellt werden […]. Automatisierung wird seit langem verwendet, um nützliche Inhalte zu generieren, wie Sportergebnisse, Wettervorhersagen und Transkripte. KI kann neue Ausdrucks- und Kreativitätsniveaus eröffnen und ein wichtiges Werkzeug zur Unterstützung der Erstellung großartiger Webinhalte sein.”

Unzuverlässigkeit von KI-Inhaltsdetektoren. Realität oder Mythos?

Obwohl KI-Inhaltsdetektoren allgegenwärtig sind, kann ihre Effektivität fraglich sein. Die Hauptprobleme sind:

  • geringe Effizienz bei der Erkennung von KI-Inhalten,
  • Probleme mit falsch positiven Ergebnissen sowie
  • Schwierigkeiten bei der Anpassung der Detektoren an schnell diversifizierende und verbessernde neue KI-Modelle.

Tests, die von OpenAI durchgeführt wurden, zeigten, dass ihr Classifier GPT-generierten Text nur in 26 % der Fälle erkannte. Ein interessantes Beispiel für die Unzuverlässigkeit von Generatoren kann in einem Experiment gesehen werden, das von TechCrunch durchgeführt wurde und zeigte, dass das Tool GPTZero fünf von sieben KI-generierten Texten korrekt identifizierte. Während der OpenAI-Classifier nur einen identifizierte.

Quelle: GPTZero (https://gptzero.me/)

Darüber hinaus besteht das Risiko, ein falsch positives Ergebnis zu erhalten, d.h. einen von einem Menschen geschriebenen Text als KI-generiert zu identifizieren. Zum Beispiel wurde der Beginn des zweiten Kapitels von Miguel de Cervantes’ Don Quijote vom OpenAI-Detektor als höchstwahrscheinlich von künstlicher Intelligenz geschrieben markiert.

Während Fehler in der Analyse historischer literarischer Texte als amüsante Kuriosität betrachtet werden können, wird die Situation komplizierter, wenn wir Detektoren als Werkzeuge zur Bewertung von Texten verwenden möchten. Die US-Verfassung wurde von ZeroGPT als 92,15 % von künstlicher Intelligenz geschrieben markiert. Und laut einer von Forschern der Stanford University veröffentlichten Studie wurden 61 % der TOEFL-Essays, die von nicht muttersprachlichen Englisch sprechenden Studenten geschrieben wurden, als KI-generiert klassifiziert. Leider gibt es keine Daten darüber, wie hoch der Prozentsatz der Texte ist, die in anderen Sprachen fälschlicherweise als positiv klassifiziert wurden.

Ein weiteres Problem ist die Änderung der Klassifizierung bei nachfolgenden Durchläufen des Detektors. Dies liegt daran, dass es oft vorkommt, dass ein Detektor wie ZeroGPT oder Scribbr die Klassifizierung von Textfragmenten ändert, die er einmal als KI-generiert und ein anderes Mal als von Menschen geschrieben markiert.

Quelle: Scribbr (https://www.scribbr.com/ai-detector/)

KI-Bild- und Video-Detektoren werden hauptsächlich verwendet, um Deepfakes und andere KI-generierte Inhalte zu identifizieren, die zur Verbreitung von Desinformation verwendet werden können.

Aktuelle Erkennungswerkzeuge wie Deepware, Illuminarty und FakeCatcher liefern keine Testergebnisse zu ihrer Zuverlässigkeit. Im rechtlichen Kontext der Erkennung von KI-generiertem visuellem Material gibt es Initiativen, Wasserzeichen zu KI-Bildern hinzuzufügen. Dies ist jedoch eine sehr unzuverlässige Methode – man kann einfach ein Bild ohne Wasserzeichen herunterladen. Midjourney verfolgt einen anderen Ansatz beim Wasserzeichen, indem es den Nutzern überlässt, ob sie ein Bild auf diese Weise kennzeichnen möchten.

Vermeidung der KI-Erkennung. Ist es möglich und wie?

Unternehmer sollten sich bewusst sein, dass KI-Inhaltsdetektoren kein Ersatz für die menschliche Qualitätsbewertung sind und nicht immer zuverlässig sind. Ihre praktischen Wartungsprobleme können erhebliche Schwierigkeiten bereiten, ebenso wie der Versuch, zu vermeiden, dass Ihre Inhalte als KI-generiert klassifiziert werden. Besonders wenn die KI einfach ein Werkzeug in den Händen eines Fachmanns ist – das heißt, es handelt sich nicht um “von KI generierte Inhalte”, sondern um “Inhalte, die in Zusammenarbeit mit KI erstellt wurden”.

Es ist relativ einfach, jemanden in die generierten Materialien einzufügen, sodass die Art und Weise, wie sie erstellt werden, wirklich schwer zu erkennen ist. Wenn die Person, die generative KI verwendet, weiß, welchen Effekt sie erzielen möchte, kann sie die Ergebnisse einfach manuell anpassen.

Die grundlegende Frage liegt in dem Grund, warum wir die Erkennung vermeiden möchten, wenn die Inhalte von KI generiert wurden.

  • Wenn es sich um ein ethisches Problem handelt und beispielsweise die Urheberschaft veröffentlichter wissenschaftlicher Forschung betrifft – bleibt man auf die berufliche Ethik des Wissenschaftlers und den verantwortungsvollen Einsatz von KI-basierten Werkzeugen angewiesen.
  • Wenn der Arbeitgeber möchte, dass die Mitarbeiter auf die Nutzung von KI verzichten – bleibt eine vertragliche Regelung für die Nutzung generativer künstlicher Intelligenz.

Es wirft auch die Frage auf, ob wir den verantwortungsvollen Einsatz von KI durch Verbote und Kritiker (ZeroGPT und GPTZero!) oder durch eine Wertschätzung von Transparenz, Vertrauensbildung und ehrlichem Einsatz fortschrittlicher Technologien fördern wollen.

Quelle: ZeroGPT (https://www.zerogpt.com/)

Zusammenfassung

Die Antwort auf die Frage, ob KI-Inhaltsdetektoren nützlich sind, ist alles andere als klar. KI-Inhaltsdetektoren befinden sich noch in der Entwicklung, und ihre Zukunft ist schwer vorherzusagen. Eines ist sicher – sie werden sich mit der Entwicklung der KI-Technologie weiterentwickeln. Fortschritte in der KI, einschließlich der zunehmenden Fähigkeit von Sprachmodellen, den Schreibstil von Menschen zu imitieren, bedeuten, dass die KI-Inhaltsdetektion noch komplizierter werden könnte. Für Unternehmen ist dies ein Zeichen, diesen Entwicklungen zu folgen und sich nicht ausschließlich auf Werkzeuge, sondern auf ihre Bewertung von Inhalten und deren Eignung für den Zweck, für den sie erstellt wurden, zu verlassen. Und die sich schnell entwickelnde künstliche Intelligenz weise zu nutzen.

Wenn Ihnen unsere Inhalte gefallen, treten Sie unserer aktiven Community auf Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Robert Whitney

JavaScript-Experte und Dozent, der IT-Abteilungen schult. Sein Hauptziel ist es, die Produktivität des Teams zu steigern, indem er anderen beibringt, wie man effektiv beim Programmieren zusammenarbeitet.

View all posts →

Robert Whitney

JavaScript-Experte und Dozent, der IT-Abteilungen schult. Sein Hauptziel ist es, die Produktivität des Teams zu steigern, indem er anderen beibringt, wie man effektiv beim Programmieren zusammenarbeitet.

Share
Published by
Robert Whitney

Recent Posts

Die Rolle von KI in der Inhaltsmoderation | KI im Geschäft #129

Unternehmen haben Schwierigkeiten, eine große Menge an Inhalten zu verwalten, die online veröffentlicht werden, von…

4 days ago

Sentiment-Analyse mit KI. Wie hilft sie, Veränderungen im Geschäft voranzutreiben? | KI im Geschäft #128

In der Ära der digitalen Transformation haben Unternehmen Zugang zu einer beispiellosen Menge an Daten…

4 days ago

Beste KI-Transkriptionstools. Wie verwandelt man lange Aufnahmen in prägnante Zusammenfassungen? | KI im Geschäft #127

Wussten Sie, dass Sie die Essenz einer mehrstündigen Aufnahme aus einem Meeting oder einem Gespräch…

4 days ago

KI-Videoerstellung. Neue Horizonte in der Videoinhaltsproduktion für Unternehmen | KI im Geschäft #126

Stellen Sie sich eine Welt vor, in der Ihr Unternehmen ansprechende, personalisierte Videos für jeden…

4 days ago

LLMOps, oder wie man Sprachmodelle effektiv in einer Organisation verwaltet | KI im Geschäft #125

Um das Potenzial von großen Sprachmodellen (LLMs) vollständig auszuschöpfen, müssen Unternehmen einen effektiven Ansatz zur…

4 days ago

Automatisierung oder Augmentierung? Zwei Ansätze zur KI in einem Unternehmen | KI im Geschäft #124

Im Jahr 2018 hatte Unilever bereits eine bewusste Reise begonnen, um Automatisierungs- und Erweiterungsfähigkeiten in…

4 days ago