User Experience ist der neue Burggraben

Wie heben sich OpenAI, Claude & Co von der Konkurrenz ab, wenn nicht durch ihre LLMs? Durch ihre Apps.

User Experience ist der neue Burggraben

Puh, was für eine Woche. DeepSeek hat die Medienlandschaft übernommen, auch wenn das schon letztes Jahr hätte passieren sollen. Aber gut, dann drehen eben jetzt erst alle durch.

Ich möchte gar nicht weiter darauf herumreiten, was das alles für Nvidia oder die Big Tech CapEx bedeutet, sondern mich darauf konzentrieren, wie sich die UX-Designstrategie vo der Chatbots verändern muss, wenn die darunterliegenden AI-Modelle zur „Commodity“ werden.

Den Anstoß dafür gab mir Casey Newtons Artikel am vergangenen Donnerstag:

The current era of tech product development feels radically different from the mobile boom of the early 2010s, when consumer applications often competed on design — and sometimes, very little besides design. The value proposition of the social network Path was that Facebook should have a nicer, smoother, more native mobile client. The location-based social network Gowalla tried to defeat its rival Foursquare by just … looking really cool. For a time, anyone could build and release their own Twitter client; the result was a design playground that contributed several mobile innovations that proliferated across the industry.

The AI era, understandably, has much less time for design. Its leaders think of their project less as a mission to build standard consumer apps and more as an all-out scientific race to build a superhuman machine god. Why devote teams to building out the user interface when there remains so much basic research to do on how large language models work, and how they can be improved?

DeepSeek’s success offers an answer to this question: build a more appealing user interface and you can attract millions of new users. Many of them will be using chatbots for the first time, and may become loyal users of the product. More users means that AI developers can learn faster, building a flywheel that could give them an advantage in what is already a hyper-competitive race.

Im letzten Absatz bezieht er sich auf DeepSeeks Entscheidung, den „Denkprozess“ (Chain of Thought) seines Reasoning-Modells, im App-Interface anzuzeigen. OpenAI hat das bisher vermieden.

Das ist eine interessante Neuerung und hilft, die AI besser zu verstehen. Ich glaube jedoch, dass uns das in ein paar Wochen nicht einmal mehr auffallen wird. Alle anderen werden auf den Zug aufspringen, und dann wird sich das kleine Dropdown-Menü am Anfang jeder Antwort zu einem blinden Fleck entwickeln.

Daher stellt sich mir die zentrale Frage: Wie lässt sich die UX langfristig gestalten, um sich von der Konkurrenz abzuheben und einen Burggraben zu schaffen, den die Modelle selbst nicht bieten?

Multimodale Antworten

Die Aufbereitung von Informationen für visuelle und auditive Lerner ist meiner Meinung nach essenziell. Über zwei Jahre nach dem ChatGPT-Durchbruch sind AI-Chatbots noch überwiegend textbasiert. Es gibt jedoch einen Grund, warum Podcasts und Videoinhalte seit Jahren an Aufmerksamkeit gewinnen, während rein textbasierte Netzwerke allgemein an Bedeutung verlieren: Die große Mehrheit möchte nicht lesen.

AI-Apps müssen sich deshalb früher oder später in diese Richtung entwickeln. Perplexity hat mit seinen Aktiencharts und gesprochenen Nachrichtenartikeln vorgelegt, und mit der ElevenLabs Reader-App ist es bereits relativ einfach, URLs in Podcasts zu verwandeln. Aber der Ottonormalverbraucher wird damit weiterhin nicht erreicht.

Natürlich ist das auch eine Kostenfrage. Die Erstellung von Audio- und insbesondere Videoinhalten ist derzeit noch viel teurer als die reine Textausgabe. Wenn es jedoch eines Tages möglich wäre, die Antwort wahlweise als Kurzvideo zu erhalten, könnten sich dadurch ganz neue Anwendungsfälle ergeben wie individuelle How-tos und Erklärvideos.

(Smartphone)-Gesten

Gesten werden von allen LLM-Anbietern ebenfalls unterschätzt, obwohl längst bewiesen ist, dass sie maßgeblich zum Erfolg vieler Apps der 2010er Jahre beigetragen haben. Man denke nur an den Swipe bei Dating-Apps oder Pull-to-Refresh bei Social Media-Plattformen. Die Einzigen, die hier im AI-Bereich bislang versucht haben, neue Maßstäbe zu setzen, waren The Browser Company mit Pinch-to-Summarize und dem Long-Press bei ihrem „Ask Arc“-Feature.

Mal sehen, ob sich die AI-Unternehmen dieses Jahr wieder mehr auf die Funktionen ihrer Kernprodukte konzentrieren, anstatt Chatbot Arena-Benchmarks hinterherzujagen und halb fertige Zukunftsvisionen vorzustellen, um ihre Bewertungen zu steigern.