Darum geht's
Google Gemini mit neuem Bildgenerator 🚀
Ernste Bildbearbeitung statt Comic-Effekten 🖼️
T-Shirt-Farbe ändern, Blickwinkel anpassen, Personen in neue Szenen versetzen 🤯
Photoshop-Ablösung? 😲
Gemini-Wasserzeichen als KI-Hinweis 💡
Wasserzeichen leicht entfernbar: Problem ungelöst 🚫
Allgemeine Warnung vor KI-generierten Inhalten 🗣️
Zukunft: Digitalen Inhalten nicht mehr trauen 🧐
Einfache Handhabung für Laien 💪
Adobe-Abo-Modell in Gefahr? 💰
Links
Vollständiges Transkript
Google hat seine KI-Engine, das LLM Gemini, mit einem neuen Bildgenerator ausgestattet. Das Ding heißt NanoBanana, ein etwas debiler Name, aber es ist durchaus relativ mächtig und cool. Damit wird es endlich auch auf Gemini möglich, Bilder zu bearbeiten. Bisher war das zumindest in Deutschland nicht so richtig machbar.
Anders als die Bildbearbeitung in ChatGPT zielt Gemini nicht darauf ab, dass wir uns geblifizieren oder wie Tim und Struppi-Comics oder Actionfiguren aussehen. Wir kennen diese Sachen, die in den letzten Monaten rauf und runter gingen. Das ist alles ganz nett, aber das ist nicht das, was Googles Gemini jetzt macht oder kann. Vielleicht kann es das auch mit den richtigen Prompts, aber die Neuerung zielt nicht auf solche Geschichten ab, sondern auf ernsthafte Bildbearbeitung.
Man kann die Farbe seines T-Shirts ändern, den Blickwinkel eines Fotos anpassen oder sagen: "Statt in meinem Wohnzimmer zu stehen, lass mich doch einfach fröhlich lachend an einer Strandpromenade auf Mallorca entlanglaufen – in den gleichen Klamotten, die ich gerade anhabe." Solche Geschichten sind eine deutlich ernstere Angelegenheit. Wenn das zu Ende gedacht und noch etwas weiterentwickelt wird, ist es eigentlich etwas, das in vielen Bereichen Photoshop ablösen kann. Man kann auch seinen Gesichtsausdruck ändern oder eine Katze auf dem Arm haben, indem man ein Foto der Katze hinzufügt und die Engine die Bilder kombiniert. Das ist relativ fantastisch. Es ist ein echtes Foto-Manipulationstool, nicht so sehr auf Spaßfunktionen ausgelegt, wie sie bei ChatGPT Hypes ausgelöst haben.
Als Werkzeug ist es natürlich sensationell, aber auch anfällig für Manipulationen, die nicht nur positiv gemeint sind. Google scheint das kommen zu sehen und hat eine tolle Funktion eingebaut: Wenn man ein Bild erstellt, ist in der rechten unteren Ecke immer das Gemini-Logo hypertransparent eingebettet. Das soll anzeigen: Achtung, dieses Bild wurde mit KI bearbeitet und zeigt eine Szene, die sich so wahrscheinlich nie zugetragen hat. Jedenfalls ist es kein reales Foto. Das ist nett gemeint und stört auch nicht weiter.
Der Knackpunkt ist, dass man Gemini auch innerhalb anderer Apps wie der LLM-Arena verwenden kann, wo dieses Wasserzeichen dann nicht auftaucht. Zum anderen kann man es auch relativ leicht wegschneiden. Wenn man ein Hochkant- oder quadratisches Bild für Social Media haben möchte, der Output aber im Format 16:9 oder 4:3 ist, ist es ein No-Brainer, das Bild so zuzuschneiden, dass das Wasserzeichen einfach verschwindet. Die Vorstellung, dass man damit Fälschungen leicht erkennen könnte, ist nicht realistisch. Da wird man sich andere Dinge überlegen müssen. Ich vermute, es ist eher eine technische Schutzbehauptung, nach dem Motto: "Wir haben es so gebaut, dass es drin ist, auch wenn die Leute es nachher wegschneiden können." Die Frage, wie man sich vor KI-erstellten Fälschungen schützt, ist weiterhin offen.
Meine Theorie ist, dass wir ziemlich deutlich in ein Zeitalter laufen, in dem wir keinem digitalen Inhalt mehr trauen können. Wir werden hoffentlich zu einer Welt kommen, in der wir digitale Inhalte grundsätzlich erst einmal anzweifeln. Das wäre eine positive Entwicklung, zumal es auch heute schon genügend Fälschungen gibt. Auch ohne KI kann man viel Bullshit anfertigen, im Bildbereich schon lange und im Videobereich immer mehr. Google hat ja bereits sein neues Veo herausgebracht, das aus Bildern Videos erstellen kann. Das funktioniert natürlich auch mit KI-bearbeiteten Bildern, die eine Szene zeigen, die es nie gegeben hat. Aus diesen kann man dann ein kurzes Video bauen. Das funktioniert noch nicht in Deutschland, aber technisch ist es da und in anderen Ländern bereits veröffentlicht.
Wir sind faktisch schon in einer Welt, in der Fälschung überhaupt kein Problem ist. Wir sehen das auch schon jetzt durch soziale Medien, wie zum Beispiel die sogenannten Pallywood-Filme, die von Palästinensern mit Tausenden von Fälschungen täglich erstellt werden. Glücklicherweise stellen sie sich bei dieser KI-Sache hin und wieder so dumm an, dass es sofort auffällt, aber es zeigt, dass es bereits missbraucht wird.
Wir laufen auf eine Welt zu, in der das völlig normal ist. Wir werden in nicht allzu ferner Zukunft über mehr KI-generierte Bilder sprechen als über reale Fotos, die wir in Feeds wie Instagram, Facebook oder TikTok sehen. Das ist die Welt, auf die wir zulaufen, und Google hat nun einen großen, weiteren Schritt dazu beigetragen.
Wenn man es nicht für bösartige Manipulationen benutzt, ist es trotzdem ein beeindruckendes und cooles Tool. Wäre ich Adobe, würde ich mir Sorgen machen, denn in ein bis zwei Jahren wird man für den Hausgebrauch so etwas wie Photoshop wegschmeißen können. Natürlich hat auch Adobe ein LLM und wird Zauber auf ihre Software anwenden, aber wenn man sich klarmacht, dass Photoshop relativ viel Geld als Abo kostet, ist dieses Geschäftsmodell für den Normalanwender endgültig tot.
Dieses klassische Photoshop-Modell scheint mir ein Auslaufmodell zu werden. Das muss nicht schlecht sein, denn die Mittel, die wir jetzt zumindest am Horizont sehen, sind nicht nur einfacher zu bedienen, sie sind auch erheblich schneller. Man muss nicht viel handwerkliches Können in der Bildbearbeitung haben, um damit etwas Cooles zu zaubern. Das kann im Prinzip jeder. So sehen wir Licht und Schatten. Die Welt wird auf jeden Fall nicht weniger interessant durch diese Neuerung seitens Google.
Aus Anwendersicht ist es praktisch, aber aus Konsumentensicht müssen wir uns auf einiges einstellen. Ich würde dringend empfehlen, keinem Bild, keinem Video, nicht mal einem Soundschnipsel mehr zu trauen – und zwar seit gestern. Das ist die Welt, auf die wir uns ganz klar zubewegen.