Mittwoch, 16. November 2022
Selbstporträt des Autors als alter Mann
Weil mir für einen längeren Betrieb von MidJourney derzeit das Geld fehlt, spiele ich ein wenig mit der Gratisversion von Stable Diffusion herum, einem weiteren der vielen KI-Bildgeneratoren im Netz, mit dem derzeit ein Gutteil der Weltbevölkerung wertvolle Arbeitszeit verschwendet.
Man muss die Maschine ein wenig trainieren oder vielmehr sich selber, sie scheint mir ein wenig dümmer als MidJourney zu sein, sie vergisst bei längeren Texteingaben (den "Prompts") schon mal das ein oder andere Detail. So malt sie brav die wohl überlegt aufgeführten Gegenstände, verschlampt aber genau so unbelehrbar wie wahllos in der Liste ebenfalls erwähnte. Nun mag ein erratisches Element eine Illusion wecken von Kunst oder Kreativität, aber niemand würde so reden, handelte es sich um eine Einkaufsliste. Wo ist die Butter? Vergessen, kein Essen, da gibt es kein Pardon.
Gleichzeitig ist Stable Diffusion so gut, wäre man eine Gothic Band in den 80er-Jahren, man könnte an nur einem Nachmittag gleich hunderte von wundervollen Plattencovern produzieren (aber immer noch keine Note). Wie MidJourney hat die Maschine Probleme mit Gesichtern und insbesondere Augen. Die Hintergründe sind mir unklar, zumal dies bei dezidierten Porträts bereits deutlich besser gelingt. Wer aber Bilder im Grenzbereich zwischen Joel-Peter Witkin, Francis Bacon und NINs berühmten Video zum Song "Closer" (Regie: Mark Romanek) sucht, hat schnell einen ganzen Katalog beisammen, für den früher die Illustratoren, Fotografen und Designer von, sagen wir, 23 Envelope, den Hausgestaltern vom Label 4AD, vielleicht zwei Wochen brauchten.
Diese Musikerinnen gibt es nicht. Aber ich würde ihre Platten kaufen.
Schön ist das nicht. Also die Entwicklung. Zum Glück stellt sich nach hundert bis zweihundert erzeugter Bilder ein gewisses hohles Gefühl ein, so als habe man zuviel Zuckerwatte gegessen Die immer wieder auftauchenden Copyright-Vermerke (etwa "Getty Images") erinnern zudem daran, woher die Selbstlernmaschine ihren Korpus hat - da wurde das Netz gecrawlt und nach Kriterien indiziert, die im Dunkel bleiben. Das ein oder andere Mal tauchten auch nach Neu-Generierung die gleichen Bilder auf, was den Verdacht nährt, dass Stable Diffusion doch eine Art Datenbank führt und nicht etwa immer wieder neu und "selbst" kreiert. Am besten gelingt letzteres, wenn die KI Tentakel oder Wurzeln oder ähnlich simple organische Formen malen soll. Ein weiterer Verdacht: Hier sind die Fraktal-Algorithmen der Mandelbrot-Strukturen verbaut, mit denen man in den 80ern die ersten PCs wochenlang beschäftigen konnte. Eine haarige Kurve um die nächste gelegt, endlose Fibonacci-Reihen aus eine Unzahl von Grafikprozessoren. Und ich vermute, auch ähnlich energieverschwenderisch wie das Schürfen nach Bitcoins.
Bitte lasst eure Gedanken nicht unbeaufsichtigt. Sie winden sich in alle Richtungen.