Skip to main content
SearchLoginLogin or Signup

Der KI XR Martin Luther Avatar.Ein technologisches Experiment mit theologischen Fragen

Dieser Text beschreibt die Entwicklung des KI XR Martin Luther Avatars und thematisiert die damit verbundenen Fragen an Technologie und Theologie. Der Avatar zeigt, was technologisch bereits möglich ist, und gibt einen Ausblick darauf, was bald Realität werden könnte.

Published onDec 23, 2024
Der KI XR Martin Luther Avatar.Ein technologisches Experiment mit theologischen Fragen
·

1. Der KI XR Martin Luther Avatar: Ein Zusammenspiel von Technologie und Theologie

Dieser Text beschreibt die Entwicklung des KI XR Martin Luther Avatars und thematisiert die damit verbundenen Fragen an Technologie und Theologie. Der Avatar zeigt, was technologisch bereits möglich ist, und gibt einen Ausblick darauf, was bald Realität werden könnte. Durch den Einsatz verschiedener Technologien werden theologische Perspektiven neu ausgelotet. Digitalisierung wirft zudem theologische Fragen auf, deren Antworten jedoch nicht in der Technologie selbst zu finden sind. Diese müssen vielmehr durch weiterführende theologische Diskurse erarbeitet werden.

Das Projekt des KI XR Martin Luther Avatars stellt ein experimentelles Vorhaben dar, da zunächst unklar war, ob die Umsetzung innerhalb des geplanten Zeitrahmens mit den im Jahr 2023 verfügbaren technischen Tools realisiert werden könnte. Zudem blieb bzw. bleibt weiterhin offen, welche Zielrichtung das Projekt verfolgen soll: den Bildungsbereich, die Gemeindearbeit, die Öffentlichkeitsarbeit oder die Nutzung als Fallstudie, welche Einsatzmöglichkeiten im kirchlichen Kontext haben kann. Im Entwicklungsprozess wurde ein agiler Ansatz gewählt, bei dem zunächst ein Minimal Viable Product (MVP) erstellt und schrittweise weiterentwickelt wurde

2. Die Idee: KI katapultiert Martin Luther ins 21. Jahrhundert. Das Experiment: Einen KI-gesteuerten 3D-Martin Luther Avatar erschaffen

Anfang 2023 wuchs das Interesse an KI erheblich, als ChatGPT Ende 2022 der Öffentlichkeit zugänglich wurde (Hines, 2023) und breite Diskussionen über die zukünftigen Möglichkeiten künstlicher Intelligenz die öffentlichen Debatten dominierten. Zahlreiche mögliche Anwendungsszenarien wurden diskutiert, insbesondere, was KI in den kommenden Jahren leisten könnte. Aufbauend auf unseren bisherigen Erfahrungen mit dem Metaverse und der Durchführung von Veranstaltungen in dieser virtuellen Umgebung begannen wir, die Integration von KI in Avatare zu erwägen und über Möglichkeiten nachzudenken, wie KI und Metaverse im kirchlichen Kontext genutzt werden könnten.

Diese Überlegungen führten uns zu der Idee, einen fotorealistischen Ganzkörper-Avatar zu schaffen, der von künstlicher Intelligenz gesteuert wird. Wir entschieden uns für Martin Luther als Beispiel und modellierten eine Darstellung des deutschen Reformators als Avatar im Metaverse. Ziel war es, einen Avatar zu gestalten, der interagieren und Antworten geben kann, wie Martin Luther sie heute formulieren könnte.

Wir nutzten Technologien, die in unserem Netzwerk verfügbar waren, da anfangs für dieses Projekt keine Finanzierung zur Verfügung stand. Ziel war es, Luther ins 21. Jahrhundert zu versetzen, sodass man ihm Fragen stellen und Antworten von ihm erhalten konnte, wie er sie heute geben könnte. Der Fokus lag zunächst weniger darauf, ein historisch korrektes Abbild von Martin Luther zu schaffen, sondern vielmehr eine Darstellung einer historischen Persönlichkeit zu wählen, die in der Gegenwart erkennbar ist. Ziel war es, die Person Martin Luthers ins Bewusstsein der Öffentlichkeit zu bringen. Dies sollte Diskussionen darüber anregen, wie Martin Luther heute auf aktuelle Themen reagieren würde: Was wäre Martin Luthers Botschaft im 21. Jahrhundert?

Dieses Vorhaben war im Wesentlichen ein Experiment, das wir mit Enthusiasmus, aber auch etwas naiv angingen, indem wir zunächst ein Minimal Viable Product (MVP) – wie der Prototyp im agilen Ansatz genannt wird – umsetzten.

2.1 Designentscheidungen

Das Cranach Digital Archive listet verschiedene Gemälde von Martin Luther als Reformator, geschaffen von Lucas Cranach dem Älteren (Kritischer Katalog der Luther-Bildnisse :: Bildnisgruppe 4, o.D.). Diese Kunstwerke weisen eine bemerkenswerte Ähnlichkeit auf und haben die öffentliche Wahrnehmung von Martin Luther maßgeblich geprägt. Durch Cranachs Gemälde wurde Luther weithin bekannt, weshalb es naheliegend war, eines dieser Gemälde als Grundlage für den Avatar zu verwenden.

Bildnis Lucas Cranachs des Älteren und KI-generiertes Luther-Bild

Für die Erstellung eines fotorealistischen Ganzkörper-Avatars wird eine Person typischerweise in einer speziellen Kabine mit Spiegelreflexkameras fotografiert, aus deren Aufnahmen ein fotorealistischer Avatar generiert wird. Da dies bei historischen Persönlichkeiten nicht möglich ist, stellte sich die Frage, ob dies mithilfe eines Gemäldes realisiert werden könnte. Dazu wurde ein KI-Algorithmus verwendet, der aus einem Selfie ein 3D-Modell eines Kopfes erzeugt. Glücklicherweise erwies sich diese Methode auch bei dem ausgewählten Ölgemälde als effektiv. Der Körper wurde anschließend mithilfe eines Teammitglieds, das in einem Talar gescannt wurde, erstellt. Danach wurden Kopf und Körper zusammengesetzt, um den Avatar zu erstellen.

Im Rahmen der Designphase mussten mehrere Entscheidungen zur Darstellung des Avatars getroffen werden. Eine Überlegung war, ob der Avatar Martin Luther in seinen frühen oder späteren Lebensjahren darstellen sollte, was Fragen nach seinem Alter und seinen physischen Veränderungen im Laufe der Zeit aufwarf. Auch die Wahl seiner Kleidung war von Bedeutung, ob er mit einem historischen Messgewand oder mit einem preußischen Talar aus dem 19. Jahrhundert dargestellt werden sollte, der heute sofort als protestantisch wahrgenommen wird. Die Entscheidung zugunsten des preußischen Talars war eine intuitive Wahl, die, obwohl historisch ungenau, Luther in heutigen Kontexten sofort als Pastor erkennbar machte. Später wurde klar, dass diese Entscheidung auch eine Unterscheidung zum historischen Luther unterstrich.

Ein weiterer Aspekt war die Körpergröße. Wie wir herausfanden, hatte Luther eine durchschnittliche Körpergröße für seine Zeit. Es wurde erwogen, ob die Größe des Avatars die durchschnittliche Körpergröße des 16. Jahrhunderts oder die heutige Größe widerspiegeln sollte, da Menschen in Luthers Zeit generell kleiner waren. Schließlich entschieden wir uns, die heutige Durchschnittsgröße zu verwenden, damit der Avatar im Metaversen in entsprechender Größe modernen Personen erscheint.

Auch bezüglich Sprache und Aussprache des Avatars gab es Überlegungen. Wir entschieden uns für modernes Hochdeutsch, da Luther die moderne deutsche Sprache maßgeblich geprägt hat. Eine Nachahmung seiner historischen sächsischen Aussprache wäre zwar historisch akkurater gewesen, hätte jedoch wahrscheinlich Verwirrung bei zeitgenössischen Nutzern hervorgerufen. Solch eine Aussprache wäre für heutige Nutzer möglicherweise irritierend gewesen. Die Wahl des modernen Hochdeutschs sollte eine klare Kommunikation ermöglichen und die Relevanz für gegenwärtige Nutzer erhöhen.

Diese Fragen wurden – rückblickend betrachtet – von uns oft recht naiv und ad hoc getroffen. Dabei wurde intuitiv die zeitgenössische Relevanz über die historische Genauigkeit gestellt. Unser primäres Ziel war es, einen Avatar zu schaffen, der effektiv mit modernen Nutzern interagieren kann, selbst wenn dies bedeutete, bei bestimmten historischen Details Kompromisse einzugehen.

2.2 Die Premiere: YouTube-Live-Chat mit Martin Luther am Reformationstag 2023

Der KI Martin Luther Avatar wurde am Reformationstag 2023 auf YouTube vorgestellt. Der Avatar predigte von der Kanzel der Lutherkirche in Mülheim an der Ruhr. Zuschauer*innen konnten über den YouTube-Live-Chat ihre Fragen stellen, die dann vom Avatar beantwortet wurden. Die Premiere erhielt große mediale Aufmerksamkeit, darunter Berichte im Deutschlandfunk und WDR Fernsehen sowie in den Vatican News (Reimann 2023a).

Das Interesse und die Neugier des Publikums sowie der Medien basierten auf der Wahrnehmung, dass man Martin Luther nach seinen Ansichten zu aktuellen Themen befragen könne. Dies veranlasste das Publikum dazu, die Fähigkeiten des Avatars auszutesten. Während des Live-Chats versuchten zahlreiche Personen, die Intelligenz des Avatars oder sein Wissen zu prüfen, so wurde beispielsweise gefragt, ob er wisse, wie man ein Auto fremdstartet (Reimann, 2023b).

Zuschauer stellten dem Avatar zudem Fragen zu Luthers Ansichten über Juden. Durch sorgfältiges Prompting und Filtermechanismen in ChatGPT konnten jedoch effektiv anti-judaistische Antworten verhindert werden, sodass eine manuelle Filterung als zusätzliche Vorsichtsmaßnahme letztlich nicht erforderlich war.

2.3 Technisches Setup

Aufgrund der Erfahrungen der Premiere wurde der als MVP angelegte Avatar weiterentwickelt. Eine Umsetzung des dialogfähigen Avatars bringt eine Vielzahl technischen Herausforderungen mit sich. Im Kern basiert die Interaktion des Avatars auf einem mehrstufigen Prozess, der sowohl Sprach- als auch Textverarbeitung umfasst. Der Ablauf beginnt mit der Sprachaufnahme über ein Mikrofon, woraufhin eine Speech-to-Text-Software die gesprochene Sprache in Text umwandelt. Dieser Text wird anschließend an OpenAI’s ChatGPT oder eine andere KI weitergeleitet, wo die eigentliche Verarbeitung und Generierung der Antwort erfolgt. Die Textantwort wird schließlich durch Text-to-Speech-Software wieder in Sprache umgewandelt und ausgegeben.

Ein wesentliches technisches Problem ist jedoch die Latenzzeit. Aufgrund der zentralen Verarbeitung über externe Server bei OpenAI beträgt die Verzögerung zwischen der Eingabe und der Ausgabe etwa 10 bis 14 Sekunden. Diese Verzögerung entsteht durch die Umwandlung der Sprache in Text, die Weiterleitung an die ChatGPT-Server, die Verarbeitung der Anfrage und die anschließende Rückübersetzung der Textantwort in Sprache. Dies beeinträchtigt den Eindruck eines natürlichen Dialogs.Zur Reduzierung der Latenzzeiten wurde experimentell ein lokales Language Model auf einer eigenen Infrastruktur getestet. Diese lokale Lösung reduzierte die Antwortzeiten auf zwei bis drei Sekunden, was eine deutlich natürlichere Interaktion ermöglicht. Jedoch bringt dieser Ansatz zusätzliche technische Anforderungen mit sich, nicht zuletzt den Betrieb und die Wartung einer eigenen Infrastruktur. Daher wird aktuell weiterhin ChatGPT als zentraler KI-Dienst verwendet trotz der Latenzzeiten. Bei Live-Demonstrationen ist daher eine gewisse Wartezeit zwischen Eingabe und Ausgabe einzuplanen, bis die Verarbeitung abgeschlossen ist. Die fortlaufende Optimierung der technischen Infrastruktur bleibt jedoch ein zentraler Bestandteil des Projekts, um die Dialogfähigkeit des Avatars weiter zu verbessern.

Da im Metaverse auch andere Gespräche mit anderen Charakteren stattfinden bzw. bei einer Demo auch Sprache z.B. aus einer Zoom-Sitzung ins Metaverse übertragen wird, die nicht für den Avatar bestimmt ist, würde der Avatar auch diese Sprache „hören“ und darauf antworten. Ohne eine klar Anrede würde der Avatar auch auf jedes Geräusch reagieren und sich in Konversationen einmischen, die nicht für ihn bestimmt sind oder auch auf Raumton oder Rauschen reagieren. Um diesem Problem zu begegnen, haben wir eine Steuerungsmechanik integriert, die den Avatar mithilfe von Farbsignalen steuert. Diese „Knopf“-Logik nutzt vier Farben, um den Status des Avatars zu visualisieren:

  • Grün signalisiert, dass der Avatar bereit ist.

  • Gelb zeigt an, dass der Avatar gerade zuhört.

  • Blau bedeutet, dass ein Datentransfer stattfindet – oder in anthropomorpher Sprache ausgedrückt: Der Avatar „denkt“.

  • Rot schließlich signalisiert, dass die Antwort generiert wurde und ausgegeben wird.

Der Autor dieses Beitrages mit dem KI XR Martin Luther im Gespräch

Der Autor dieses Beitrages mit dem KI XR Martin Luther im Gespräch

Diese visuelle Rückmeldung hilft nicht nur, den technischen Ablauf transparenter zu gestalten, sondern ermöglicht auch eine klare Trennung zwischen Zuhören, Verarbeitung und Antwort, um eine intuitive und kontrollierte Interaktion sicherzustellen.

2.4 Datenschutz

Die Entwicklung und der Betrieb dialogfähiger Avatare im Metaverse erfordern nicht nur technische Anpassungen, sondern auch eine Beachtung datenschutzrechtlicher Vorgaben. Um den Anforderungen der europäischen Datenschutzgrundverordnung (DSGVO) gerecht zu werden, wird das gewählte Metaverse-System in der Telekom-Cloud betrieben, wodurch ein datenschutzkonformer Umgang mit Nutzerdaten sichergestellt werden kann. Auch wenn ChatGPT genutzt wird, bleibt die Nutzerinteraktion auf die Telekom-Cloud beschränkt, so dass keine Nutzerdaten an OpenAI bzw. ChatGPT weitergeleitet werden.

3. Ausblick

3.1 Kontrolle und Verantwortung

Ein zentraler Diskussionspunkt bleibt die Frage der Kontrolle über die KI und die verwendeten Large Language Models. Wer überwacht und reguliert die generierten Inhalte? Wie wird sichergestellt, dass die Technologie verantwortungsvoll und im Einklang mit ethischen und rechtlichen Standards eingesetzt wird? Diese Fragen sind besonders relevant, da die Nutzung dialogfähiger Avatare im Bildungs- und öffentlichen Kontext weitreichende Implikationen mit sich bringt. Die Etablierung klarer Kontrollmechanismen wird daher ein entscheidender Aspekt für die Weiterentwicklung und den Einsatz solcher Technologien sein.

Inzwischen können auch Texte in die KI hochgeladen werden. In einem Fall wurden historische Luther-Texte aufgrund anstößiger Sprache von einem Filter blockiert. Diese Erfahrung verdeutlicht, dass amerikanische Modelle, wie sie bei einigen Large Language Models (LLMs) zum Einsatz kommen, andere Prioritäten bei der Filterung von Inhalten setzen als es in Europa der Fall ist. Solche kulturellen und rechtlichen Unterschiede werfen die Frage auf, wie mit derartigen Einschränkungen umzugehen ist, insbesondere wenn es um historische oder kulturell bedeutsame Texte geht.

Darüber hinaus stellt sich die Frage, wer für das Training und Finetuning solcher Sprachmodelle verantwortlich ist. Dies wirft die Problematik auf, dass die Ausrichtung und Inhalte eines Avatars wie Martin Luther stark von der Perspektive derjenigen geprägt werden, die das Training durchführen.

Ein weiteres kritisches Thema betrifft die inhärenten Vorurteile (Bias) in Large Language Models. Studien haben gezeigt, dass Modelle wie ChatGPT in Bezug auf Gender, Religion oder andere gesellschaftliche Themen voreingenommene Ergebnisse liefern können. Beispielsweise werden Männer oft stärker bevorzugt dargestellt als Frauen, und auch bei religiösen Themen können Biases auftreten. Dies stellt Entwickler und Nutzer vor die Herausforderung, solche Verzerrungen zu erkennen, zu minimieren und verantwortungsvoll damit umzugehen.

Die Frage der Transparenz ist dabei ebenfalls von zentraler Bedeutung. Sollten die Einschränkungen und Biases des Avatars offengelegt werden, könnte dies die Immersion und Authentizität der Interaktionen beeinträchtigen, die essenziell für die Nutzererfahrung sind. Ein ausgewogenes Maß an Transparenz ist erforderlich, um sowohl die Nutzererwartungen zu erfüllen als auch ethischen Standards gerecht zu werden.

Diese Herausforderungen verdeutlichen, dass die Entwicklung dialogfähiger Avatare nicht nur technologische, sondern auch ethische, kulturelle und gesellschaftliche Fragestellungen berührt. Sie bieten Raum für weiterführende Diskussionen, die sowohl technologische Lösungen als auch normative Überlegungen umfassen sollten. Solche Debatten können dazu beitragen, eine verantwortungsvolle und reflektierte Nutzung dieser Technologie zu fördern.

3.2 Anpassung des KI-XR-Avatars für verschiedene Zielgruppen

Eine zukünftige Vision ist die Möglichkeit, den Avatar Martin Luther für verschiedene Zielgruppen „buchbar“ zu machen. So könnte etwa eine Version für die Primarstufe, eine für die Sekundarstufe II oder eine weiter für andere Bildungskontexte angepasst werden. Dies wirft jedoch die Frage auf, ob es sinnvoll ist, mehrere spezialisierte Avatare zu entwickeln oder einen universellen Avatar bereitzustellen, der flexibel auf verschiedene Zielgruppen eingehen kann.

Bibliographie

Hines, K. (2023, June 4). History Of ChatGPT: A Timeline Of The Meteoric Rise Of Generative AI Chatbots. Search Engine Journal. https://www.searchenginejournal.com/history-of-chatgpt-timeline/488370/

Kritischer Katalog der Luther-Bildnisse :: Bildnisgruppe 4. (n.d.). Retrieved November 10, 2024, from https://lucascranach.org/index.php/luther/portrait-4

Reimann, R. P. (2023a). Martin Luther im 21. Jahrhundert: KI-gesteuerter 3D-Real-Life-Avatar beantwortet live Fragen auf YouTube. TheoNet θ. https://theonet.de/2023/10/27/martin-luther-im-21-jahrhundert-ki-gesteuerter-3d-real-life-avatar-beantwortet-live-fragen-auf-youtube/

Reimann, R. P. (2023b). Martin Luther als KI-Avatar: Rückblick auf die YouTube-Premiere am Reformationstag. TheoNet θ. https://theonet.de/2023/11/02/martin-luther-als-ki-avatar-rueckblick-auf-die-youtube-premiere-am-reformationstag/

An dieser Stelle auch ein Dank an die Projektbeteiligten für die hervorragende Zusammenarbeit:

Comments
0
comment
No comments here
Why not start the discussion?