Posts Tagged ‘OpenAI’

Magie zwischen Polaroid und KI – mein Kunstprojekt der besonderen Art

28. März 2025

Das jüngste Update von ChatGPT lässt mich sprachlos zurück. Die Fortschritte der Bildgenerierung hauen mich vom Hocker. Im Moment gibt es das neue Feature in Sprachmodell 4o und bisher nur in der Pro-Version. ChatGPT-4o ist das neue Multimodal-Modell von OpenAI. Es kann Text, Bild, Audio und Video verarbeiten – und nun auch Bilder erstellen.

Jetzt kommt es natürlich auf den richtigen Prompt an und die Ergebnisse können sich wirklich sehen lassen. In meinen Seminaren vermittle ich das notwendige Praxiswissen zu Promst, da kommt mir meine Erfahrung als Bildjournalist zu gute. Ich probierte gleich mal ein paar neue Stile aus – hier verwandelte ich ein Foto von mir in den Gibli-Stil.

Beim Herumspielen und Testen des neuen Features kam mir eine Idee: Wie wäre es, wenn ich anloge und digitale Technologie mit meinem Fotos verbinde – so als eine Art Kunstprojekt.

Im Moment arbeite ich viel mit Polaroids. Ich habe meine alte Polaroid SX 70 wieder im Einsatz. Sie stammt aus dem Jahre 1974. Für mich zeichnen sich Polaroid-Fotos durch ihre Einzigartigkeit und Unmittelbarkeit aus. Jedes Bild ist ein Unikat – direkt nach der Aufnahme entwickelt, ohne Nachbearbeitung oder Filter. Die analoge Technik verleiht den Fotos eine besondere Ästhetik mit charakteristischen Farben und Bildfehlern, die den Moment authentisch und unverfälscht festhalten. In einer zunehmend digitalen Welt bieten Polaroids für mich ein haptisches, entschleunigtes Erlebnis der Fotografie.

Ich habe beispielsweise ein Selfie mit einer meiner Polaroid SX 70 gemacht.

Dann habe ich das Papierfoto mit dem Smartphone abfotografiert und ein wenig optimiert, ohne den Charakter zu verändern.

Der nächste Schritt war es, das Foto in die neue Version von ChatGPT hochzuladen und ein Vintage-Bild daraus zu genieren.

Im nächsten Schritt kam per Prompt das Einfärben des braunen Hutes (ein Barbisio von 1940) in einen roten Hut.

Der letzte Schritt war wiederum das Einfärben des Bildes. Aus den durchsichtigen Gläsern wurden gelbe Gläser, wie ich sie in Wirklichkeit trage.

Und weil es so schön war, noch ein Morphing-Film dazu:

Sora ist da – Kreative lernt jetzt schnell um

11. Dezember 2024

OpenAI greift die Kreativbranche mit seinem revolutionären Text-to-Video-Tool „Sora“ an und wird das Medium Film auf den Kopf stellen. Derzeit sind die Filme, die die KI erzeugt, noch kurz, aber der Anfang ist gemacht. Sora ist Teil des Plus-Kontos und ohne zusätzliche Kosten nutzbar. Nutzer können bis zu 50 Videos in 480p-Auflösung oder eine geringere Anzahl in 720p pro Monat erstellen. Noch stellt dies keine Gefahr für Kino und Fernsehen dar – noch nicht.

Ein weiteres Manko: Die KI hat die Physik der Animationen noch nicht vollständig im Griff. Doch es dürfte nur eine Frage der Zeit sein, bis auch diese technischen Herausforderungen gelöst sind. Wir stehen am Anfang einer Revolution für Kreative im Bereich Film – so meine feste Überzeugung. Filmemacher werden sich schnell anpassen müssen. Auch die Ausbildung im Bereich Film sollte sich ändern, und Filmhochschulen werden ihre Lehrpläne anpassen müssen, um dieser Entwicklung gerecht zu werden.

Laut OpenAI: „Sora baut auf den Erkenntnissen von DALL·E und GPT-Modellen auf und wurde entwickelt, um Menschen erweiterte Werkzeuge für das Geschichtenerzählen und kreative Ausdrucksformen zu geben.“ Aktuell ist das Tool jedoch nicht in der EU verfügbar. Die Gründe sind nicht bekannt. Es könnte sein, dass OpenAI zunächst Erfahrungen auf dem US-Markt sammeln möchte, oder dass der strenge Digital Data Act der EU eine Rolle spielt.

Tech-Experte Marques Brownlee hat sich auf seinem YouTube-Kanal mit Sora auseinandergesetzt und sowohl Potenziale als auch Probleme beleuchtet. Die Ergebnisse, die die KI liefert, sind beeindruckend. Es scheint nur eine Frage der Zeit zu sein, bis ganze Filme mit solchen Tools erstellt werden können. Das erinnert an die Zeit, als Pixar mit computergenerierten Animationen revolutionierte, während klassische Disney-Zeichner diese Technologie zunächst belächelten. Doch Toy Story fegte eine ganze Branche hinweg. Eine ähnliche Umwälzung könnte durch Sora und andere KI-Tools bevorstehen – davon bin ich überzeugt.

KI plündert Drehbücher
Die Situation verschärft sich zusätzlich, seit bekannt wurde, dass KI-Systeme mit Drehbüchern trainiert wurden. Diese Information wurde kürzlich durch einen Artikel im Atlantic veröffentlicht. Genau davor hatten die US-Drehbuchautoren bei ihrem Streik 2023 gewarnt. Trotz gegenteiliger Zusicherungen ist der Fall nun eingetreten: Mehr als 139.000 Drehbücher für Filme und Serien wurden als Trainingsmaterial verwendet.

Unter den genutzten Werken waren beispielsweise 700 Folgen von Die Simpsons und Futurama, 150 Folgen von Seinfeld, 45 Folgen von Twin Peaks sowie die kompletten Serien The Wire, Die Sopranos und Breaking Bad. Dabei lag der Fokus wohl vor allem auf den Dialogen, die künftig von Unternehmen wie Apple, Anthropic, Meta, Nvidia, Salesforce oder Bloomberg genutzt werden könnten.

Diese Praxis erinnert an den Umgang mit Bildarchiven, die bereits für KI-Modelle geplündert wurden. Angesichts dessen, dass viele Serien und Filme ohnehin nicht besonders innovativ oder kreativ sind, könnte die KI in Zukunft sogar selbst Drehbücher schreiben. Standardisierte Geschichten wie „Held liebt Heldin“ haben oft wenig mit echter Kreativität zu tun. Drehbuchautoren, die vor allem für Mainstream-Produktionen tätig sind, dürften sich auf drastische Veränderungen einstellen müssen.

Buchtipp: Mit 3D zum Erfolg von Sebastian Dosch

5. Mai 2024

Ich kenne Sebastian Dosch schon einige Jahre. Mit Dosch Design in Marktheidenfeld ist er einer der führenden Anbieter von 3D-Dienstleistungen, Texturen, Modellen und was das Herz so begehrt. Und er ist ein netter Typ. Nun hat er im Eigenverlag ein kostenloses Buch herausgegeben Mit 3D zum Erfolg, was ich heute empfehlen will. Das Buch lässt sich hier bestellen.

Heute ist 3D ein Modewort geworden und die Allgemeinheit denkt bei 3D an die 3D-Brille, um Spiele zu zocken oder Filme im Kino oder im Fernseher zu konsumieren. Das läuft aber alles unter dem Stickwort Stereoskopie. Hinter 3D steckt viel mehr, denn ob in Konstruktion, Architektur, Industriedesign, Visualisierung, GameDesign oder Special Effects – überall kommt 3D zum Einsatz. Und hier setzt das Buch Mit 3D zum Erfolg an. Es gibt für den interessierten Laien, aber auch für den Unternehmensentscheider einen kompetenten und verständlichen überblick über den Stand und Einsatzmöglichkeiten von 3D. Es ist gut und vor allem verständlich geschrieben und gibt einen Einblick in eine faszinierende Branche voller Möglichkeiten. Natürlich ist die Lernkurve von 3D-Software höher als bei Büroapplikationen, aber zum einen wird die Software intuitiver und leichter, zum anderem öffnet sich neue Wege, wenn man sich ein wenig eingearbeitet hat. Ich bin gespannt, was passiert, wenn sich dieser Markt mehr für KI öffnet, Man munkelt, dass OpenAI schon an Produkte für diesen Markt arbeitet, um 3D in breitere Schichten der Gesellschaft vordringen zu lassen.

Aber zurück zum Buch Mit 3D zum Erfolg. Es zeigt kurz und knapp verschiedene Einsatzmöglichkeiten in verschiedenen Märkten. Entscheidet können sich einfach ein Bild von der Leistungsfähigkeit von 3D machen, ohne dass sie komplizierte Fachartikel konsumieren müssen. Für mich war dieses Buch eine tolle Zusammenfassung und ein Wiedereinstieg in dieses wichtigste Thema – und das Buch ist kostenlos. Also warum nicht mal testen?

Sora – Text-to-Video Modell von OpenAI- ich werde (wieder) Filmemacher

17. Februar 2024

Als ich Sora zum ersten Mal gesehen habe, begann ich zu träumen. Wie toll ist Sora? Was wäre mit Sora alles möglich? Nein, nicht dass Sie mich missverstehen. Ich bin glücklich verheiratet und Sora ist kein weibliches Wesen. Sora ist das neue Text-to-Video Modell von OpenAI, also eine KI-Anwendung mit der per Eingabe/Promt bewegte Bilder entstehen.

Als ich die ersten Videos von OpenAI gesehen hatte, setzte bei mir eine Zeitreise in das Jahr 1982/83 ein. Damals sah ich als Jugendlicher im Kino den Disney-Spielfilm Tron. Hier werden Menschen in den Speicher eines Computers versetzt und kämpfen als Bits und Bytes als Videospiele gegeneinander. Die visuelle Darstellung von Tron haute mich aus den Socken. Ich ging aus dem Kino und wollte so etwa mit meinem Heimcomputer machen, mit dem VC20 und dann dem Commodore C64. Also einen Film auf VHS drehen und vom C64 kommen die Effekte. Das Ganze ist krachend gescheitert, aber die Idee war gut.

Vielleicht greife ich ein neues Projekt des Filmemachens mit Sora neu an. Sora erstellt realistische Videosequenzen aus einfachen Texteingaben. Es sollen 60 Sekunden Clips möglich sein. Noch steht Sora nicht zur allgemeinen Nutzung bereit, aber ich stehe bereit und warte auf die Freischaltung for the rest of us. Ich kann ja inzwischen an einem Drehbuch-Script arbeiten und auf das Go durch OpenAI warten.

Allgemein kann ich mir vorstellen, dass Sora und Co wie Googles Gemini die Welt es Filmemachens verändern werden. Die Stock-Agenturen, die jetzt Filmclips verkaufen, werden ins Straucheln geraten.

Natürlich sind wir erst in der Frühphase von Sora. Das aktuelle Modell hat Schwächen. Es kann Schwierigkeiten haben, die Physik einer komplexen Szene genau zu simulieren, und kann bestimmte Fälle von Ursache und Wirkung nicht verstehen. Zum Beispiel könnte eine Person einen Bissen aus einem Keks nehmen, aber danach hat das Cookie möglicherweise keine Bissmarkierung. Ich bin gespannt auf die nähere KI-Zukunft und freu mich darauf.