Kerstin Beckert | Künstliche Intelligenz im Journalismus: Wie sinnvoll ist der Einsatz von Bildgeneratoren?

Künstliche Intelligenz im Journalismus: Wie sinnvoll ist der Einsatz von Bildgeneratoren?

Lesedauer 8 Minuten

 

    Wenn die Künstliche Intelligenz zum Maler oder Zeichner wird

    Fünf Gedanken zum Einsatz von KI-Bildgeneratoren

     

    Eine graue Roboter-Eule steht neben einer Staffelei. Darüber steht in Gelb der Text KI-Bildgeneratoren und ihr Einsatz im Beruf.
    Titelbild: Der Text wurde nachträglich eingefügt (generated by Stable Diffusion, created and modified by Kerstin Beckert).

    Nachdem Chat-GPT im November 2022 von Open AI auf den Markt gebracht wurde, trat das Programm wahrlich den Siegeszug durch sämtliche Büros an. Kaum eine Branche, in der seitdem nicht darüber diskutiert wird, wie sich die so genannte Künstliche Intelligenz (KI) im Arbeitsalltag einsetzen ließe – auch im Journalismus.

    Doch nicht nur der Chatbot ist ein Top-Seller. Mit den KI-basierten Programmen von Dall-E, Stable Diffusion oder Midjourney lassen sich Bilder für jedwede Gelegenheit generieren. Kein passendes Foto zur Hand? Null Problem! Mit Hilfe der Algorithmen (AI Image Generatoren) ist die bildliche Darstellung von (fast) jeder Umgebung, Situation oder Person möglich. In bester Qualität. Und ehrlich, es macht Spaß!

    Unmögliches wird plötzlich möglich

    Nicht jeder kann zeichnen, malen, fotografieren oder Computer-Animationen zum Leben erwecken. Trotzdem können nun auch bekennende Nicht-Profis wie ich all das erschaffen, was ohne KI nicht möglich wäre: Ein quietschroter Weihnachtsbaum vor einem Sonnenuntergang, Fantasy-Krieger auf einem Pferd, eine Handwerkerin am Space-Shuttle oder Luftballons im Weltall.

    Ein zweigeteiltes Bild, in der Mitte durch einen grünen Balken getrennt. Rechts ein Heißluftballon vor dem Hintergrund des dunkelblauen Weltalls. Links ein weißes Space-Shuttle, direkt daneben sieht man eine braunhaarige Ingenieurin im Handwerker-Outfit.
    Bild: So stellt sich der Algorithmus eine „Handwerkerin am Space-Shuttle“ bzw. einen „Heißluftballon im Weltall“ vor (generated by Stable Diffusion, created by Kerstin Beckert).

    Der eigenen Fantasie scheinen keine Grenzen gesetzt. Mittlerweile finden sich fast überall Bilder und Zeichnungen, die mit Hilfe von digitalen Bildgeneratoren erstellt wurden – ob in Blogs (wie bei mir gerade), in Newslettern, sogar in Zeitungen, digitalen Medien, im Marketing oder bei Social-Media. Ich bin mit meinem ersten, kreativen „Überschwang“ also nicht allein.

    Von Null auf Künstler

    Die Möglichkeiten scheinen endlos zu sein: Realistische Bilder, Gemälde, 3D-Animationen, Comicstyle, Anime, Fantasy, Surrealismus, Kubismus, Renaissance, Pop Art oder Pokemon. All diese Stilrichtungen sind mittlerweile in Stable Diffusion möglich. Auch die anderen Programme stehen dem in nichts nach. Dall-E wirbt sogar mit einer Adaption von Jan Vermeers „Mädchen mit dem Perlenohrring“, Midjourney gleich zu Anfang mit neuartigen Welten und fantastischen Charakteren.

    Das „Kochrezept“ ist einfach

    Ein guter Ausgangsprompt, mehrere Versuche bis das Setting passt, gewürzt mit recht viel Zeit und Geduld. Schon kann ich auf meinem Bildschirm Johannes Kepler in seinem Arbeitszimmer sehen (bzw. erahnen), oder eine kleine Haselmaus, die aus einem Brombeerstrauch linst.

    Das Gemälde eines älteren Mannes mit weißen Haaren und Kurzbart. Alles in leicht bräunlich gehalten. Der Mann sitzt vor einem Schreibtisch aus Holz und hält einen Bleistift in der rechten Hand, schreibt auf einem Blatt Papier. Neben ihm eine brennende Kerze im Ständer. Das Thema ist eher Mittelalter.

    Bild: So könnte der Arbeitsplatz von Johannes Kepler ausgesehen haben (generated by Stable Diffusion, created by Kerstin Beckert).

    Auch in Audioslide-Shows ist der Einsatz von KI durchaus vorstellbar. Durch diese lässt sich Symbolbildern ein Leben „einhauchen“, das durch gängige Präsentationsprogramme nicht zu generieren ist. Aber wie viel KI möchte ich eigentlich in meinen Arbeitsalltag einbauen? Ist sie so effektiv, wie immer behauptet wird? Spart der Algorithmus wirklich Arbeitszeit? Und wie wirkt sich all das auf das Urheberrecht aus?

    1. Die eigene Arbeitszeit

    Prompten erfordert Geduld und mehrere Versuche. Dies wird vermutlich auch durch Übung oder eine entsprechende Ausbildung nicht viel besser. Zumindest, wenn das Ergebnis einer bestimmten Erwartung gerecht werden soll. Mal ehrlich, wie viel Zeit haben Sie schon vor dem Prompt-Fenster verbracht, wie viele Fehlversuche wieder gelöscht? Oder wie lange darauf gewartet, dass sich das Bild endlich aufbaut (bei mir dauerte der Prozess zwischen 3 und 20 Minuten)?

    Sich auf den Gestaltungswillen der KI zu verlassen, ist nur möglich, wenn „the user“ wild herumprobieren kann, kein bestimmtes Ergebnis benötigt.

    Fazit: KI muss sich nicht unbedingt positiv auf die Produktivität auswirken. Manchmal ist es (meiner Erfahrung nach) schneller, ein Bild aus der Datenbank herauszusuchen.

    2. Training mit Hilfe von fremder Kreativität

    KI wurde mit den Bildern (und natürlich auch Texten) von zahllosen Kreativen trainiert. Nicht immer mit deren Einverständnis. Denn die meisten Urheber wurden nicht einmal gefragt, ob sie dem zustimmen. Das gilt für Text- und Sprach-KIs genauso, wie für Bildgeneratoren. Selbst „alte Meister“ lassen sich mittlerweile durch maschinelle Lernprogramme imitieren. Nun kann jeder einen Pierre-Auguste Renoir oder Andy Warhol besitzen, ohne dafür Geld auszugeben. Bei Dall-E steckt die Verknüpfung von Urheber und KI-Bildern sogar im Namen. Ein Blick auf die Seite von Open AI lässt vermuten, dass der Produktname eine spielerische Kombination aus dem Namen des fleißigen, kleinen Roboters „Wall-E“ und dem des Malers „Salvador Dalí“ ist.

    Sicherlich ist das humoristisch gemeint. Doch es bleibt dabei: Für das Training wurden digitale Werke und damit auch das geistige Eigentum von realen Menschen genutzt. Und sie wurden dafür nicht entlohnt. Was vermutlich auch schwierig wäre, da Open AI und Konsorten wohl selbst nicht mehr nachvollziehen können, mit welchen Urheber-Daten die KI trainiert wurde, und auf welche sie bei der Bildgestaltung letztendlich zurückgreift.

    Fazit: KI schert sich nicht um das Urheberrecht. Ein echtes Problem, das mir Unbehagen bereitet. Und für das ich im Moment noch keinen Lösungsansatz sehe (obwohl mir spontan die Verwertungsgesellschaften einfallen). Deshalb habe ich vor einiger Zeit die Petition „KI aber Fair“ unterschrieben.

    3. Den Stil des Lieblingskünstlers kopieren

    Für Profis ist es relativ einfach, mit Hilfe von geeigneten Prompts jene Stilrichtungen zu imitieren, die Künstler nun einmal auszeichnen. Die richtigen Vorgaben führen zu Ergebnissen, die im Idealfall den Original-Arbeiten der Urheber sehr ähnlich sind. Auch wenn diese bestimmte Motive (bisher) nicht selbst verwendet haben, so hätten sie dies tun können.

    Im Bild ist zu lesen: on the left side of the picture a roboter designed as an owl holding a paintbrush in its wing, on the right side an easel showing a blank sheet of paper. Auf deutsch: Ein als Eule designter Roboter hält einen Pinsel in seinem Flügel und neben ihm steht eine Staffelei mit weißem Papier.

    Bild: Mit diesem Prompt wurde das Titelbild erstellt. Dabei habe ich bewusst darauf verzichtet, den Stil eines bestimmten Künstlers zu imitieren.

    Durch KI können die Bilder von Malern in einen neuen Kontext gesetzt werden. Das gleiche gilt für Comicstrips, die den Zeichnern gänzlich unbekannt sind (Disney!). Auch der Stil von Game-Designern findet sich plötzlich in Newsletter-Bildern wieder. Dies kann zu Verwechslungen und erheblichen finanziellen Einbußen bei den Berechtigten führen.

    Fazit: Identifizierbare Inhalte oder Kunststile möchte ich nicht imitieren.

    4. Weniger Geld für Kreative

    Inzwischen ersetzen Bildgeneratoren teilweise schon die Arbeit von echten Menschen. Dazu gehören Fotografen, Maler, Zeichner, Grafiker, Webdesigner. Diese möchten von ihrem Job leben können. Da geht es ihnen auch nicht anders, als mir. Doch die Realität sieht im Moment leider anders aus. Texte werden geschrieben, Bilder generiert – ohne dass auch nur ein Freiberufler die Rechnung stellen kann.

    „Alte Meister“ wie Salvador Dalí oder Jan Vermeer erleben vielleicht keinen finanziellen Verlust mehr (das müssen potentielle Erben beurteilen), doch zeitgenössische Kreative können so durchaus in eine existenzielle Schieflage geraten. Sollte der Trend über die Erprobungsphase der potentiellen Auftraggeber hinaus anhalten, wird KI unsere Branche vielleicht sogar nachhaltig verändern. Und zwar nicht zu ihrem Besseren, auch wenn so mancher Trendsetter mich jetzt vielleicht als „rückwärtsgewandt“ einstuft.

    Fazit: KI kann bei freiberuflichen Kreativen zu einem Auftragsrückgang und Honorareinbußen führen, zumindest im Augenblick.

    5. Wie also mit KI im kreativen Alltag umgehen?

    Johannes Kepler lebte in einer Zeit, in der es noch keine Bilder von Wissenschaftlern in ihren Büros gab. Also kann ich nicht zu ihm fahren und ihn an seinem Arbeitsplatz fotografieren. Auch gibt es wohl kein Bild in einer Datenbank. Natürlich könnte ich einen Grafiker oder Maler damit beauftragen. Aber das sprengt häufig den finanziellen Rahmen und auch das Zeitfenster, etwa bei einem Artikel für meinen Blog oder eine Tageszeitung.

    Bei hochwertigen Magazinen finden manchmal Fotoshootings statt (ja, auch in der Wissenschaft). Dann ist ein Fotograf sicherlich die bessere Alternative. Bei Bildern aus der Natur lohnt natürlich immer ein Blick in die (eigene oder organisations-interne) Bilddatenbank. Manchmal greife ich bei abstrakten Situationen auch auf ein Präsentationsprogramm zurück.

    Der Umzug Keplers von Weil der Stadt nach Leonberg stellte mich jedoch vor ein echtes Problem. Da wäre ich froh gewesen, statt der gebastelten Folie ein KI-generiertes Bild zu haben. Ging im Sommer 2022 noch nicht (kaum zu glauben, aber wahr). So musste ich improvisieren.

    Eine Skizze mit blauem Hintergrund, rechts steht gelbgrundiert Stuttgart, rechts davon weiße Bäume, darüber steht größer Leonberg und darunter kleiner Weil der Stadt.

    Bild: So habe ich in meiner Audioslide Keplers Umzug von Weil der Stadt nach Leonberg dargestellt. In Ermangelung von echten Bildern mit Hilfe eines gewöhnlichen Präsentationsprogramms (Bild: Kerstin Beckert).

    Nicht unbedingt lustig oder kreativ, aber durchaus nutzbringend. Dennoch wäre mir eine einfache Kutsche auf einem Feldweg, die einen Berg Holzmöbel transportiert, lieber gewesen. Gebe ich zu.

    Fazit: Es geht auch ohne KI, manchmal kann diese jedoch wesentlich anschaulichere Bilder erschaffen. Etwa dann, wenn andere Möglichkeiten an ihre Grenzen stoßen.

    Meine persönliche Bilanz?

    Künftig werde ich gut überlegen, ob für meine Veröffentlichungen wirklich KI-gestützte Bildgeneratoren notwendig sind. Zum Beispiel, wenn sich das Bild auf anderen Wegen beschaffen lässt. Auch achte ich darauf, dass durch sie kein Job ersetzt und kein Kunststil imitiert wird.
    Der sparsame Umgang mit KI hilft auch, ein wenig umweltfreundlicher bzw. nachhaltiger zu arbeiten. Denn schließlich benötigt der Einsatz von Künstlicher Intelligenz viel Wasser und Energie.

    Zusammengefasst versuche ich also, mir folgende Fragen zu beantworten:

    • Ist es möglich, die darzustellende Situation zu fotografieren, eine Zeichnung oder Grafik davon anzufertigen?
    • Wenn ja: Kann ich selbst fotografieren, zeichnen oder in einem angemessenen Zeitrahmen mit Hilfe eines Präsentationsprogramms eine anschauliche Abbildung erstellen?
    • Ist das gewünschte Motiv alternativ in einer Bilddatenbank zu finden?
    • Oder lohnt es sich, einen Profi zu einem angemessenen Honorar zu beauftragen (Kosten- und Zeitfaktor)?
    • Wenn das alles nicht möglich ist, halte ich selbst den Einsatz der Bildgeneratoren für akzeptabel. Auch wenn das Motiv zu abstrakt, surreal, symbolisch oder erklärungsbedürftig ist.
    • Kam eine KI zum Einsatz, achte ich im Sinne der Nachhaltigkeit darauf, das Bild gegebenenfalls mehrfach zu verwenden, etwa als Titelbild einer Rubrik. So muss kein weiteres generiert werden, wieder ein Prompt-Versuch weniger.

    Wie war das bei der Haselmaus?

    KI-generiertes Bild einer puscheligen Haselmaus. Ansicht von vorne mit großen, schwarzen Augen. Man sieht anhand von zwei roten Bromeeren an der Seite und grünen Blättern, dass sie in einem Strauch sitzt.
    Bild: Diese kleine Haselmaus wurde für den Herbstlaub-Text generiert. Einfach zu Übungszwecken. Und als sie mich so anschaute, konnte ich einfach nicht mehr widerstehen (generated by Stable Diffusion, created by Kerstin Beckert).

    Ganz ehrlich: Hier wäre die KI nicht nötig gewesen, da es viele knuffige (und sogar kostenfreie) Bilder von dem kleinen Pummelchen gibt. Dieser Übungsversuch hat mich aber zum Nachdenken gebracht. Und war damit quasi der Auslöser für meinen persönlichen KI-Fahrplan. Hoffentlich kann ich mit diesem meinen eigenen Konsum etwas kanalisieren. Auch wenn das Spiel mit den Bildgeneratoren natürlich viel Spaß macht.

    Ob´s klappt? Wir lesen uns.
     

    PS: Beim Schreiben habe ich mir überlegt, dass zu diesem Thema wohl ein abstraktes, durch eine KI erstelltes Titelbild passt. Das Ergebnis ist am Anfang zu sehen. Die Roboter-Eule passt zu meinem Logo und wird künftig immer dann recycelt, wenn es in meinem Blog um Bildgeneratoren geht. Auch das bedeutet wohl Nachhaltigkeit.

     

    Interessanter Link (zuletzt abgerufen am 27.11.2023):

    https://www.rnd.de/digital/sam-altman-warum-der-chatgpt-erfinder-gehen-musste-und-was-das-fuer-die-ki-branche-bedeutet-XLYVZZROFZCPLDKWFXLIT7T4BM.html

     

     

    (Letztes Update des Beitrags: 27.11.2023)
     

     

     

Enjoy this blog? Please share on: