Funky Cat 70s oder die faszinierende Welt der K.I.-basierten Bild-Generatoren

Letztes Update am 21. September 2022

Es gibt mittlerweile die Möglichkeit, mit Hilfe von K.I.-basierten Softwaresystemen Musik zu generieren, zum Beispiel mit Aiva.ai oder Texte mit einer der vielen GPT3-Anwendungen wie copy.ai und seit einiger Zeit auch Bilder. Die bekannteste dieser neuen Plattformen zur generieren von Bildern mit Hilfe von K.I. ist DALL-E 2 von Open AI. Neuerdings ist auch Imagen von Google ein viel besprochenes Produkt. Diese beiden Plattformen sind aber nicht so einfach für jedermann zugänglich, was seine triftigen Gründe hat. So können beide einerseits fotorealistische Bilder generieren und als Ausgangsmaterial ein beliebiges bestehendes Bild benützen. Dass damit viel Schindluder getrieben werden kann, liegt auf der Hand und darum ist es auch gut, dass sie nicht einfach Hinz & Kunz auf die Plattform lassen. Hier haben die weltweit geführten Diskussionen um die digitale Ethik offenbar bereits Früchte getragen. Wären diese Produkte vor fünf Jahren bereits so weit gewesen, hätten die Anbieter diese wohl einfach mal auf den Markt geworfen, um danach dagegen zu kämpfen, dass sie zur Verantwortung gezogen werden für den Unfug, der damit getrieben wird.

Trotzdem besteht natürlich für viele der Wunsch und das Bedürfnis, mit solchen Anwendungen auch im frühen Stadium zu experimentieren. Mit Craiyon und Midjourney gibt es zwei Angebote, die das ermöglichen. Da Craiyon etwas älter und weniger mächtig ist, werde ich mich hier im Folgenden auf Midjourney konzentrieren.

Das Erste, was Du wissen musst, ist, dass Midjourney kein klassisches User-Interface einer App hat. Die einzige Möglichkeit, mit der Software zu arbeiten besteht derzeit darin, über einen Discord-Bot Kommandos zu schicken. Das ist ähnlich, wie wenn Du über ein Terminal mit dem Computer arbeitest. Das bedeutet allerdings auch, dass Du zuerst einen Discord Account einrichten musst, falls Du noch keinen hast. Discord ist eine Art Slack für Gamer. Du kannst Discord gut im Browser bedienen und brauchst keine App zu installieren, um zu testen, ob Du mit Midjourney mehr als nur ein paar Test-Stunden verbringst.

MidJourney Bot Channel in Discord

MidJourney kann für erste Versuche kostenlos genutzt werden. Das ist allerdings recht mühsam, weil man seine Kommandos, Prompts genannt, nur in Discord Channels, welche auch von anderen Nutzern der Kostenlos-Version bevölkert werden, ausführen kann. Erst, wenn Du Dich für eine der kostenpflichtigen Angebote entscheidest, kannst Du Dich in Ruhe direkt mit dem Bot Channel beschäftigen.

Kostenstruktur MidJourney Angebote am 14. August 2022 (Quelle)

Wichtig, auch wenn Du Deine Kommandos direkt mit dem Bot austauschst, werden alle Kreationen von MidJourney öffentlich gemacht, ausser Du kaufst noch die Funktion «Private visibility» dazu und schaltest diese mit dem Kommando ‘/private’ auch ein.

Um ein Bild zu generieren, gibst Du das Kommando ‘/imagine’ ein und danach beschreibst Du mit englischen Begriffen, was das Bild darstellen soll. Daraufhin generiert Dir das System vier Varianten von Bildern. Diese kannst Du entweder als Ausgangsbild für weitere Varianten nutzen, oder wenn Dir eines davon gefällt, es als grösseres Bild rendern lassen.

Ich habe zum Beispiel bei einem meiner ersten Tests als Prompt eingegeben: «funky cat 70s». Worauf mir das System folgende vier Varianten ausgegeben hat:

Die ersten vier Varianten von Midjourney als Ergebnis für den Prompt: «funky cat 70s».

Auf Basis der Katze um Quadrat unten rechts habe ich dann zuerst acht weitere Variationen generieren lassen.

Acht weitere Varianten der funky cat 70s.

Am Ende habe ich mich dann aber trotzdem für die erste Variante entschieden und diese in einem grösseren Format rendern lassen. Ich finde dieses Bild in der Tat sehr gelungen. Congrats Midjourney!

Die vorläufig endgültige Version der funky cat 70s

Midjourney kann im Gegensatz zu DALL-E und Imagen keine fotorealistischen Bilder generieren. Das ist wohl auch der Grund, warum die Entwickler hinter dem Projekt es wagen, die Software allen zugänglich zu machen. Es werden aber auch hier, wie bei den anderen, Begriffe, die sexuelle oder Gewaltdarstellungen generieren sollen, gesperrt.

Falls Dich die Website von Midjourney und der Umstand, dass Du nur via Discord mit der Software arbeiten kannst, nicht abschreckt, kann ich Dir wärmstens empfehlen, damit ein wenig zu experimentieren.

Screenshot der Website von Midjourney vom 14. August 2022

Wir werden solche Funktionen wohl in absehbarer Zeit innerhalb der klassischen Bildbearbeitungsprogramme wie Photoshop sehen und wir werden vor allem sehr bald, viele Bilder, auch fotorealistische auf diese Weise generieren. Ein grosser Vorteil, dieser Bilder liegt derzeit noch darin, dass sie nicht urheberrechtlich geschützt sind, denn für ein Urheberrecht braucht es einen Menschen als Urheber. Leider wird das kaum lange so bleiben.

Update vom 21. August 2022

Seit gestern kann man unter https://beta.dreamstudio.ai/dream die Modelle und das System von stability.ai nutzen.

Kommentare

Deine E-Mail-Adresse wird nicht veröffentlicht.

Verwandte Beiträge

Die Tücken des Machine Learnings

Marcel Waldvogel hat auf dnip.ch einen sehr empfehlenswerten Beitrag über die Herausforderungen des sogenannten Machine Learnings publiziert. Er erläutert auch für Laien sehr verständlich, wie

Weiterlesen »