Filterbubble
Jan’s Filterbubble Podcast
FB0296 State of AI
0:00
-23:11

FB0296 State of AI

Über die schöne neue Welt

Transkript bei Google AI Studio

Wenig ist in der Welt der Technik, glaube ich, so spannend wie der Themenkomplex KI und was da so alles im Augenblick passiert. Einfach weil es ja alle paar Tage mit neuen Diensten, neuen Features, vielleicht auch nur neuen Ideen, wie man die mehr oder weniger sinnvoll anwenden kann, um die Ecke kommt und da eben so viel passiert. Aber auch, weil da ein echt krasser Wettbewerb besteht.

Ich habe früher mal gedacht, dass Google aufgrund seines über Jahrzehnte ja schon gesammelten Datenschatzes da echt die Nase vorn hat. Ich habe vielleicht ein bisschen unterschätzt, dass es ja auch noch so Buden wie Meta und Facebook gibt, die natürlich auch einen riesigen Datenschatz haben, der noch mal ganz anders geartet ist und deswegen sicherlich auch noch mal, ja, vielleicht einen gewissen Vorteil sogar hat gegenüber dem, was Google hat. Andererseits hat Google auch sowas wie YouTube mit den lustigen YouTube-Kommentaren, die aber eben auch so eine Art soziales Netzwerk sind und, ich sag mal, so ein LLM auch noch mal durch andere Inhalte bereichern.

Wie dem auch sei, also ChatGPT war damals jedenfalls durchaus eine Überraschung für mich. Also dass es von so einer ganz anderen Firma auf einmal kommt, von der zumindest ich zu dem Zeitpunkt noch nichts gehört hatte, obwohl die auch da schon, sag ich mal, mit relativ viel Venture Capital ordentlich gepampert war. Aber das muss auch sein, weil der ganze Kram einfach sauteuer ist. Für Google war das, glaube ich, auch – also die werden die auf dem Schirm gehabt haben, aber für die war es, glaube ich, auch ein Schock, was das dann alles konnte. Und das war dann eben der Moment, wo Google irgendwie alles an verfügbaren Ressourcen auf das Thema KI geschmissen hat, weil sie halt auch gesehen haben, wenn sie es nicht machen, dann sind eigentlich so ihre ganzen Geschäftsmodelle in absehbarer Zeit einigermaßen passé. Vielleicht hätten sie dann am Schluss noch YouTube, was ein bisschen Geld abwirft, aber die ganzen anderen Geschichten, eben das Werbegeschäft, das drohte mit dem Beginn des ganzen KI-Hypes ja dann doch irgendwie in absehbarer Zeit einfach den Bach runterzugehen. Und das ist immer noch so, dass es wahrscheinlich ist, dass sich da viel wandelt. Einfach, weil die Leute, wenn sie KI benutzen, auch gar nicht mehr auf irgendwelche Internetseiten gehen müssen.

Und die Werbung, die da dann ist, die wird natürlich auch nicht mehr abgerufen. Das heißt, Google muss sich da neu aufstellen, weil das im Augenblick das Einzige ist, mit dem sie wirklich Geld verdienen, abgesehen von YouTube und ja, sie nehmen mittlerweile auch Geld über so Abos ein. Auch da spielt natürlich KI eine wichtige Rolle. Da kommen wir später noch mal kurz zu. Aber auf jeden Fall ist das wesentliche Geschäftsmodell von Google nach wie vor, Anzeigen zu verkaufen, und das funktioniert eben, ja, je besser die ganze KI-Geschichte wird, desto weniger wird das mit den Anzeigen werden. Das wird in dieser Form so nicht mehr ewig funktionieren können.

Und aus diesem Grund haben sie da eben echt geguckt, dass sie ja mal wieder ein bisschen Oberwasser kriegen. Und da kann man sagen, das hat anscheinend ganz gut geklappt. Also es ist tatsächlich so, dass Google die letzten Monate mit seinem Gemini schon immer besser geworden ist. Es konnte immer mehr, also es schloss auch immer mehr auf zu den gängigen Konkurrenzprodukten. Auch in den unterschiedlichen Disziplinen, die man so hat, ne, das ist dann also, wie toll kann es coden, wie toll kann es Bilder generieren. Gemini kann inzwischen auch Bilder bearbeiten, das ging vor nicht so langer Zeit z.B. noch gar nicht. Ja, Texte und so weiter. Worin Gemini gefühlt tatsächlich sogar besser ist als die komplette Konkurrenz, das sind so etwas ausführlichere Recherchen. Dafür habe ich das jetzt ein paar Mal benutzt und bin schwer begeistert, finde das richtig geil und auch hilfreich, also wirklich eine coole Sache.

Was Gemini als wichtigsten USP hatte, das war das mit Abstand größte Kontextfenster. Das heißt also, dass der Prompt länger werden konnte als bei anderen. Die Erinnerungsfähigkeit war dementsprechend auch ein bisschen größer. Also Google hat da an dem Punkt ja jetzt schon seit einigen Wochen echt viel mehr geboten als die Konkurrenz. Also da haben sie auf jeden Fall schon, sag ich mal, ordentlich den anderen so gezeigt, wo so der Hammer hängt. Ja, aber auch in anderen Disziplinen, wo die anderen auch schon gut sind, da hat Google eigentlich mittlerweile in der Regel mindestens aufgeschlossen. In manchen Sachen sind sie dann tatsächlich auch noch sogar ein bisschen besser. Also sie waren schon gut und in Teilen sogar besser als alle anderen.

Und dann kam diese lustige jüngste Google I/O und da haben sie einfach noch mal ein bisschen aufgedreht. Da haben sie einen Videoeditor oder ja, Videogenerator – also beides – einen Videogenerator rausgebracht, der echt lippensynchron Videos erstellen kann. Das sieht noch nicht ganz smooth aus, also ist noch nicht so, dass man das jetzt wirklich gar nicht mehr unterscheiden kann von richtig gefilmt, aber da fehlt nicht mehr viel. Man kann sich halt ausmalen, wie das ein, zwei Generationen – da reden wir vielleicht über ein, zwei Jahre – ja, wie das eben in künftigen Versionen dann aussehen wird. Man wird es einfach schon in ganz, ganz baldiger Zeit einfach nicht mehr von einem richtigen Video unterscheiden können. Das wird so passieren.

Was sie auch gezeigt haben, ist eine Art KI-Assistent. Also sie haben gezeigt, dass man wirklich das komplette Handy per Sprache steuert. Inklusive "zeig mal ein Video", "spul dann mal ein bisschen zurück", "ein bisschen vor", "hin und her". Und dass er einem dann auch erklärt – also sie hatten das, da hat so ein Typ ein Fahrrad repariert, da haben sie halt gesagt, okay, welche Schraube ist das eigentlich und wo kriege ich die und was für einen Schraubendreher brauche ich dazu und so. Also solche Sachen halt. Das ist schon vielversprechend. Also kann man sich vorstellen, dass wenn das vernünftig umgesetzt wird und dann einfach in jedem noch so blöden Android-Handy, so wie sie Gemini ja inzwischen auch hast du auch auf jedem Handy, da kann man diese erweiterten Funktionen natürlich genauso auf solche Geräte bringen. Das werden alle benutzen. Das ist wahrscheinlich noch ein bisschen interessanter für die breite Masse als dieser ganz normale olle KI-Assistent, dem ich irgendwas schreiben muss oder man kann es auch einsprechen, aber dem ich da irgendwie klassisch prompte. Wenn ich mich halt tatsächlich mit dem über mein aktuelles Anliegen hier unterhalten kann und das Ding mir dabei sogar hilft. Das wird, glaube ich, das ist so eine Anwendung, wo ich sofort gedacht habe, okay, ja, das ist jetzt wirklich was, wenn das so simpel auch funktioniert, wie es da gezeigt wird, dann ist das was, was in absehbarer Zeit einfach jeder benutzen wird, jeder, jeder.

Und darüber wiederum bringt Google natürlich auch wieder seine anderen Geschichten ins Spiel, weil das ist dann wie eine Werbeanzeige, ne? Also ich hatte ja gesagt, dieses Beispiel, wo kriege ich denn diese alberne Schraube eigentlich her. Da wird Google einem dann schon einen guten Vorschlag machen. Das ist dann, da ist dann ein Google-Vorfilter drin, das ist dann nicht unbedingt das billigste Angebot, sondern es ist das, wo jemand Google irgendwie Geld gibt, dass das dann gesagt wird. Das wird so passieren. Das wird so ein bisschen der Preis an dem ganzen Ding sein. Gut, muss man mal sehen, wie es dann tatsächlich ausgerollt wird, wenn es soweit ist, aber da wird ein bisschen die Reise hingehen, auch vor allen Dingen für Google.

Und nach diesem Muster baut Google eigentlich sein ganzes System so ein bisschen – also im Prinzip baut Google Gemini nach und nach, ja, zu einer Art Engine für sein ganzes Ökosystem um bzw. baut das da überall ein. Weil es auch Sinn macht und weil Google eben dieses krasse Ökosystem hat. Das ist auch was, was Google jetzt nicht von allen Anbietern, die auch was mit KI machen, abhebt. Also Microsoft macht natürlich da durchaus was Ähnliches, wenn auch da noch mal eher so in Richtung Office-Anwendung, eher wahrscheinlich als klassisches Werbegeschäft.

Aber wer z.B. kein solches Ökosystem hat, ist eben OpenAI, also ChatGPT hat nicht so ein natürliches Ökosystem angeflanscht, wo man es einfach so einbauen könnte. Deswegen die eher so die Idee verfolgen, na ja, dann gucken wir halt, dass einfach jeder unser System einbaut, der sonst selber nichts hat. Was auch nicht doof ist, was vielleicht auch mindestens so gut funktionieren kann wie das, was Google macht. Allerdings kann Google ja auch dafür sorgen, dass das eigene System auch offen genug für andere ist. Also werden sie, denke ich, auch tun, das ist jetzt im Augenblick nicht unbedingt ihr primärer Fokus, aber irgendwo wird sich das alles sowieso ein bisschen angleichen. Was dann am Schluss besser ist oder auch nur besser zu benutzen für die breite Masse, das muss man mal sehen. Dazu passiert da, wie gesagt, immer noch viel zu viel.

Aber was Google eben damit macht, ist, dass es seine Dienste für die Zukunft sichert und ja auch irgendwo ein attraktives Gesamtangebot schafft, zu einem erschwinglichen, ordentlichen Preis. Man kann – also sie haben jetzt einen neuen Tarif rausgebracht, der ist 250 € im Monat, dafür kriegt man dann sozusagen das unbegrenzte Paket. Das ist schon ein stolzer Preis. Das ist aber auch nicht der Tarif, den man im Ernst buchen soll. Also es ist eher so ein – gibt bestimmt Leute, die sich den holen werden, aber das ist eigentlich ja eher so eine Demonstration, was man alles machen kann, wenn man wirklich das volle Programm haben will. Der normale Tarif, wie ihn auch jeder andere Anbieter anbietet, kostet auch bei Google seine paar und 20 €, es sind 22 € im Monat bei Google, das sind die sind alle so zwischen 20 und 23, meine ich.

Anders allerdings als bei ChatGPT oder Claude oder ja, was es da sonst noch so gibt, kriegen wir bei Google auch einfach noch mal 2 TB Google Speicher dazu und den ganzen anderen Cloud-Blödsinn, den Google halt so anbietet. Namentlich so Bildbearbeitungssachen, überhaupt kann ich das Ganze eben für Bilderspeicher. Es ist eben die normale Google Cloud, die wir da noch einfach oben drauf kriegen. Und die kostet ja auch so schon einen Zehner im Monat. Das heißt, effektiv kostet die KI-Geschichte – weil irgendeine Cloud brauchen wir, glaube ich, sowieso langsam alle – wenn man sich das auf die Weise schön rechnet, kostet diese ganze KI-Problematik oben drauf dann noch mal ja, 12 € im Monat. Und das ist, wenn man das so rechnet – wie gesagt, ist ein bisschen schön gerechnet, aber wenn man so rechnet – ist es tatsächlich wahnsinnig attraktiv. Und man bekommt dafür eben ja, zumindest eine im Augenblick führende KI-Engine, die sicherlich auch immer sehr gut bleiben wird, ob es jetzt immer die Beste bleibt, ob sie überhaupt gerade die Beste ist, aber ich glaube, es ist ein fairer Preis für das, was man da bekommt.

Was sie auch noch vorgestellt haben – das zeigt, sie gehen da halt immer weiter, also klar müssen sie auch, aber das zeigt eben auch, dass sie da durchaus auch noch ganz andere Ambitionen haben – das sind eben ihre Brillen, das finde ich auch unglaublich spannend. Gezeigt haben sie einmal eine, ja, sozusagen die Konkurrenz zu Apples Zauberbrille, die aber irgendwie keiner so richtig haben will, auch weil sie halt dreieinhalbtausend Euro kostet und es ehrlicherweise keinen richtigen Anwendungszweck zu geben scheint. Zumindest hat den noch keiner so richtig gefunden, außer dass es für verschiedene Dinge ganz cool ist, nur das rechtfertigt jetzt diese Investition nicht. Aber jedenfalls ein Pendant dazu haben sie vorgestellt. Das ist gemeinsam mit Samsung entwickelt worden, das wird dann demnächst auch auf den Markt geworfen.

Viel spannender als dieses große, schwere Ding, das wohl dann doch eher für die eigenen vier Wände gedacht ist, ist aber definitiv die Alltagsbrille, von der sie wohl verschiedene Varianten bringen werden. Eine, die ganz ohne Displays auskommt, eine mit einem Display und eine mit zwei Displays ist so die Rede von. Also zwei Displays hieße dann eins pro Auge und die günstigere Variante ist dann wahrscheinlich mit einem vor einem Auge. Ja, okay. Das muss man sich wahrscheinlich angucken, wenn es soweit ist, aber dass das eine coole Geschichte wird, glaube ich, ist jetzt schon einigermaßen klar.

Die Dinger funktionieren dann so ein bisschen, als würde man Gemini Live benutzen. Gemini Live ist so ein Dienst, da kann man auch jetzt schon die Kamera des Smartphones auf irgendwas richten und er erzählt einem dann da irgendwas zu. Meinetwegen erzählt er einem, wie man irgendwie eine Heizungsanlage bedient oder irgendwas, was man vorher noch nicht angefasst hat. Ja, oder vergleichbare Dinge. Also es hilft einem einfach dabei, relativ schnell etwas komplexere Geschichten, dann einen Überblick zu bekommen oder vielleicht auch Dinge zu finden, keine Ahnung.

Das, was sie da natürlich auch einbauen, ist so eine Art Navigator, also das finde ich auch sehr geil umgesetzt, wie sie es gezeigt haben. Wenn ich ganz normal geradeaus gucke, dann habe ich einfach irgendwo einen kleinen Pfeil, der mir sagt, da muss ich hin oder da muss ich abbiegen und so weiter. Wo sie natürlich auch – und da das ist wieder das, was ich sagte, der riesige Datenschatz, den sie haben – durch dieses ganze Street View Ding haben sie eben auch von jeder Straße einen richtigen Anblick. Das können sie dann einfach abgleichen und dadurch können sie sowas sicherlich auch noch mal präziser machen, als andere das vielleicht könnten, die jetzt nicht zufällig überall mal ihre Autos lang geschickt haben. Wenn ich mit der Brille auf den Boden gucke, dann habe ich nicht nur so einen kleinen Pfeil, der mir die Richtung anzeigt, sondern dann wird eine kleine Minikarte eingeblendet. Was ich irgendwie lustig finde, weil wenn ich mit dem – also aktuell mache ich das natürlich so, ich habe Google Maps auf dem Handy, wenn ich keine Ahnung habe, wo ich hin will oder wo ich bin. Und dann muss ich auch runter gucken auf mein Handy und dann habe ich da die Karte. Und genau das Gleiche haben sie jetzt sozusagen in die Brille eingebaut. Wenn ich da runter gucke, dann habe ich eine Karte und ansonsten wird mir nur so grob die Richtung angezeigt. Aber das ist vom Konzept her auf jeden Fall super geil. Plus, dass dieser Live-Modus, den ich in der Brille haben kann, natürlich auch total gut ist.

Und gleichzeitig ist so eine Brille auch etwas, man hat die ganze Zeit einen Kopfhörer bei sich und kann darüber telefonieren, freihändig. Man kann ja überhaupt mit seinem Handy in irgendeiner Weise interagieren, eine Sprachnachricht absenden und so weiter und so fort. Man kann sich irgendwas anhören, obwohl man für die Außenwelt gar keine Kopfhörer trägt und keiner so richtig unbedingt mitbekommt, dass man gerade irgendwas auf den Ohren hat. Das ist – also es ist sowieso eine gute Geschichte, so eine Brille, aber wenn man da dann noch diese smarten Funktionen einbaut, dann wird es tatsächlich echt interessant und dann wird das ja, könnte das eine Alltagsbrille werden, die auch echt interessant für ein breites Publikum werden kann.

Die Ray-Ban Meta, die ja da so ein bisschen das Konkurrenzprodukt ist, die aber keinerlei Displays hat, die funktioniert nur über Mikrofon und Kopfhörer sozusagen. Die ist ein Riesenerfolg, die wird gekauft ohne Ende. Das heißt, Leute haben Bock auf sowas. Und die hat sogar eine Kamera. Ich weiß nicht, also da könnte man ja sogar noch mal drüber reden, ob das unbedingt sein muss oder ob man nicht auch da irgendwie mit so Radartechnik arbeiten könnte, weil es Thema dann schon hier und da ist, dass Leute Leuten das nicht so geheuer ist, wenn ihnen jemand mit einer Kamera im Gesicht gegenüber sitzt. Was auch nachvollziehbar ist. Gut, aber davon war jetzt nicht die Rede. Ich gehe davon aus, die werden ganz normal da erstmal eine Kamera drin haben und dann muss man einfach mal sehen, wo da die Reise hingeht. Wichtig ist natürlich auch, was die Dinger dann letztendlich kosten. Und ganz wichtig ist, glaube ich, auch, was die akkutechnisch auf die Waage bringen, weil es echt nichts bringt, wenn die dann irgendwie – also so eine Google Live-Funktion, so toll die auch ist, aber wenn ich vorher weiß, ja, die kann ich jetzt eine halbe Stunde nutzen, dann muss ich diese Brille aber auch erstmal wieder laden. Dann ist das alles irgendwie nichts wert. Vor allen Dingen nicht, wenn man Brillenträger ist und das einfach die Brille ist, die man tatsächlich benutzt. Man möchte die nicht ständig absetzen, um sie zu laden. Wenn das aber wenn einen das dazu zwingt, dann wird das dazu führen, dass man sie ganz oft eben ausgeschaltet hat. Und das wiederum ja, konterkariert natürlich den ganzen eigentlich sehr coolen Zweck.

Ja, das ist, was Google im Augenblick so – die haben natürlich noch sehr viel mehr gezeigt, aber das ist so ein bisschen, wo in die Richtung, wo Google so hindenkt und hinentwickelt. Die Konkurrenz schläft aber auch nicht. Also noch so eine andere Meldung, die mich echt umgehauen hat, ist, dass OpenAI sich einfach mal Johnny Ive gekauft hat. Also das ist natürlich jetzt eine unheimlich verkürzte, völlig unseriöse Aussage. Sie haben ein Startup gekauft, das er gegründet hat, aber es ist eigentlich klar, dass sie im Prinzip ihn oder seinen Namen gekauft haben. Das Beeindruckende ist der Betrag, also es sind einfach sechseinhalb Milliarden Dollar. Das ist unfassbar, also wirklich, das ist okay, OpenAI hat, glaube ich, praktisch unbegrenzte Mittel, weil die sich vor Risikokapital kaum retten können. Ja, zugegeben, aber trotzdem, Alter, ey, sechseinhalb Milliarden für im Prinzip eine Person, die der ist ein Genie, würde ich schon sagen. Also, ich sag mal, wenn man mal das iPhone, also optisch quasi erfunden hat und natürlich auch konzeptionell, iPad, iPods, die ersten iMacs, die so ein bisschen hübsch aussahen auch. Also, der hat durchaus da einiges auf dem Kasten, das ist ja gar keine Frage.

Was natürlich spannend ist, er macht ja normalerweise vor allen Dingen Hardware, nicht nur, er macht auch andere Dinge, aber ne, also UI und sowas, das ist natürlich auch ein wichtiges Gebiet für ihn. Das gut, kann glaube ich jeder Bude gut tun, ein bisschen ein bisschen ihr ihr gesamtes, die gesamte User Experience ein bisschen aufzuhübschen. Warum nicht? Das wäre aber jetzt niemanden bei Verstand 6,5 Milliarden wert. Sprich, es sieht eigentlich danach aus, dass die eine Hardware entwickeln. Und das muss einfach spannend sein. Das könnte natürlich auch einfach sowas wie eine Brille sein oder vielleicht ein Smartphone. Letzteres, glaube ich, nicht so, aber wer weiß. Jedenfalls irgendeine Hardware, die dazu dient, KI zu nutzen und zwar möglichst alltagsnah, weil das ist, glaube ich, wo die Reise hingehen muss, weil nur so wird sich der ganze Spaß jemals refinanzieren lassen. Man muss es irgendwie so machen – ein Bekannter von mir hat neulich mal so gesagt, die Reise wird dahin gehen, dass KI-Nutzung so selbstverständlich sein wird wie die Nutzung von Strom und Wasser und Internet. Es ist einfach immer da. Es wird uns in unterschiedlichsten Formen umgeben. Wir werden da gar nicht drüber nachdenken. Es ist einfach immer überall drin. Das wird so sein. Wenn man jetzt aber eine spezielle Hardware dafür entwickelt, dann ja, also bin ich höchst gespannt, wie das dann genau aussieht. Oder ob das auch wieder noch so der siebte Home Assistent, so eine Kiste, die man sich irgendwo hinstellt, die ein Lautsprecher ist, vielleicht noch einen Bildschirm dran hat und die dann mit einem kommunizieren kann. Kann auch sein oder vielleicht ist es echt der Roboter, wer weiß. Wer weiß.

Ja. Ach so, nebenbei baut ChatGPT bzw. OpenAI ja auch noch an seinem Project Stargate. Das sind mal kurz 500 Milliarden Euro – äh Quatsch Dollar – die sie da dann wieder drinne versenken. Und das ja, Ziel von diesem Projekt ist, wenn ich es richtig verstanden habe, einfach nur die unglaubliche Aufblähung der eigenen Rechenkapazitäten, damit eben alles noch krasser werden kann, damit das noch mehr kann und so weiter. 500 Milliarden sind natürlich auch noch mal ein unglaublicher Betrag, wirklich eine unglaubliche Summe. Ja, also wie gesagt, die schlafen auch nicht, die machen auch immer weiter und man kann eigentlich nur sagen, es ist irre. Es ist wirklich irre, was da läuft. Welche Summen da investiert werden und auch welche technischen Fortschritte da auf den verschiedenen Gebieten von den diversen Anbietern gemacht werden. Und spannend bleibt es auch.