🟥🟦🟩GPT-o3 = Proto-AGI?
100% automatisierte Wissenschaft, Gen-Robotik-Massenfertigung, KI-Hebel pro Mitarbeiter uvm.
Die letzten Tage war der KI-Space wieder mit Warp-Speed unterwegs. Hier wir immer meine Perspektive was davon in 3-5 Jahren relevant bleibt:
Legende für die folgende Beschriftung:
🟥Schlüsselwissen,
🟦Anleitungen / Strategien und
🟩Werkzeugen
Allgemein
🟥🟦🟩Die Kombination aus spürbar besserem Reasoning als GPT-o1 (mein bisheriges Go-To bei Reasoning-Modellen) und dem wirklich intuitiv eingebauten Tooling machen GPT-o3 aktuell zu einem wirklich guten Tool. (Abseits dessen, dass deine eigene IP bei starker Benutzung als Spam-Quelle eingesetzt wird, ein wilder Nebenschauplatz des ganzen) - Ist es AGI, wie aktuell wieder von den Dächern geschrien wird? Ich denke nicht. Kommt es, mit ein wenig Feintuning an eine Proto-AGI, soweit, dass die meisten Nutzer nicht mehr schlau genug sind, dieses Werkzeug richtig einzusetzen? Möglich. Tatsächlich möglich. (Wie Tyler Cowen es so schön formuliert, von dem ich mir dieses Argument als “User-Benchmark” ausleihe: “A simple way to put it is that you are not smart enough to notice directly how much better o5 will be than o3. For various complex computational tasks, not observed by humans, the more advanced model of course will be more effective. But when it comes to working with humans, those extra smarts largely will be wasted.”
Ich teste daher aktuell den Begriff “Proto-AGI”, der definitional wahrscheinliche Vorläufer, als Bezeichnung. Ich folge dabei Ethan Mollick in seiner Argumentation: “Does that mean that o3 and Gemini 2.5 are AGI? Given the definitional problems, I really don’t know, but I do think they can be credibly seen as a form of “Jagged AGI” - superhuman in enough areas to result in real changes to how we work and live, but also unreliable enough that human expertise is often needed to figure out where AI works and where it doesn’t. Of course, models are likely to become smarter, and a good enough Jagged AGI may still beat humans at every task, including in ones the AI is weak in.”
Warum Proto-AGI? Weil ich es für möglich halte, dass wenn
Probleme wie Massencrawling (KI-Anfragen machen die eigene IP-Adresse zur Spamquelle) etc. gelöst sind
100x - 10.000x+ mehr Tools zur Verfügung stehen (Vll sogar direkt über eine eigene Plattform dabei? Think GPT-Plugins all again) und
Reasoning selbst dem Reasoning, dass die meisten vor ihrem inneren Auge haben, aber schwer artikulieren können, gerecht wird
Wir aus der Basis GPT-o3 die erste AGI bekommen können. In visuell als Beispiel:
Jap, wild times.
🟦Wer sich fragt, warum der KI-Boom gerade so gigantisch ist, die Kurzantwort ist die Wette darauf, das KI bald einen signifikanten Prozentsatz der Weltökonomie automatisiert
🟦Die Mongolen wurden weder von Kaiserdynastien noch der chinesischen Mauer in ihrer Ostexpansion wirklich aufgehalten. Von Schießpulver schon. Diesen Vorschlag eines militärischen Innovationszentrums finde ich daher sehr folgerichtig aktuell.
🟦Multiple Keywords durch längere Kontext- / Verständnisoptionen und damit (potentiell) besseres RAG ist eine der interessanteren Nebenentwicklungen von Reasoning-KIs
🟥🟩Gute Einordnung, warum MCP sich aktuell beginnt als KI-API-Standard durchzusetzen
🟥Es ist schwer einzuordnen wie gravierend das erste komplett KI-generierte, Peer-Reviewte Paper wirklich ist, möglich, dass es ein zivilisatorischer Meilenstein ist, den wir aktuell nicht einordnen können
🟦Nach wie vor eine der krassesten Entwicklungen im KI-Space, absolut mind-blowing, die Preisentwicklung pro Mtok von LLMs aller relevanter Größen:
🟩KI baut jetzt auch bessere Memes als Menschen
🟥🟦Die vielleicht wichtigste Grafik um die Auswirkungen von KI auf die Wirtschaft - und wann diese voll eintrifft - abzuschätzen (Originalpaper):
Was sagt diese Grafik? Grob, sobald KI
8h+ arbeiten kann (das Äquivalent eines vollen, menschlichen Arbeitstags)
Via Tooling + Reasoning + ? reliabel einsetzbar ist, heißt
50%+ success Rate hat
Kann prinzipiell jeder Wirtschaftsabschnitt, der davon betroffen ist, per Mausklick automatisiert werden (Mausklick = Serverkosten, usw. usw., klar, aber machbar ist’s dann) - mit GPT-o3 etc. bekommt man im Kleinen davon bereits einen Vorgeschmack den jeder austesten kann wie ich finde
Du möchtest mehr KI-News wie diese wöchentlich bequem in dein Mail-Postfach? Dann ⬇️⬇️⬇️
Für Endanwender
🟦🟩Man kann extended Thinking (Reasoning Token-Basiert) in immer mehr Tools triggern (Via API von Tools wie z.B. Cursor auch schon hinlänglich bekannt) - Hier am Beispiel Claude
🟥Möglich, dass 90%+ aller Bildschirmaufgaben bis Ende des Jahrzehnts von KIs übernommen werden (KIs dann “volle Arbeitstage” arbeiten) - diesmal auf Basis von Extrapolation, keiner Annahmen und Wetten (Siehe METR-Grafik oben, hier extrapoliert und erweitert und daher hoffentlich noch greifbarer):
🟦🟩(anderes, spezifischeres Beispiel, welches ins gleiche Horn trötet):
🟥🟦Wenn wir nicht aufpassen, werden effektiv 100% (bis auf ein paar wenige Tausend Menschen) der Weltbevölkerung nicht via politischem Diktat sondern faktischer Exzellenz als Kontrollmechanismus beherrscht, schön in diesem Meme zusammengefasst (Wie das für Unternehmen schiefgehen kann, zeigt ein “Doppel-Bug” Bei Cursor eindrucksvoll):
🟩Ich sage seit einem Jahr Mitte 2025 ist KI-Video effektiv gelöst, = Hollywoodmovies per Knopfdruck für 80% Amateure möglich. Vielleicht sind wir sogar schneller.
🟥🟦Exzellentes Beispiel dafür, das man KI nicht pauschal für alles einsetzen muss, nicht einmal soll. Co-Evolution finde ich ist ein hervorragendes Prinzip dem man beim Einsatz folgen kann.
🟦🟩Während die meisten noch bei MCP-KI-APIs sind, geht unstructured APIs noch einen Schritt weiter
🟦Gute Mikro-Orientierung:
When you have an LLM doing part of the work, you want its task to be as narrow and unambiguous as possible. Broad instructions like “write a summary of the latest AI developments” often result in generic or unusable output. In contrast, narrower prompts like “list three key recent breakthroughs in battery technology and explain their relevance to electric vehicle adoption” yield precise answers and clearer points of failure, making them easier to improve iteratively.
und
Treat the LLM as the foreman, not the worker. That is, use the model to structure the task, but don’t ask it to do everything. Once the model has identified what tasks need to be carried out, you can decide whether a given task is deterministic (in which case you may need to farm it out to traditional software code) or requires more judgement (in which case an LLM might be able to handle it.)
🟦🟩KI rettet buchstäblich Leben
🟦🟩Das Web verändert sich buchstäblich in Echtzeit und vollständig aktuell:
🟥🟦🟩Nicht nur das Web, mit der begonnenen Massenfertigung intelligenter, humanoider Roboter hat offiziell die Veränderung unserer Umgebung begonnen
🟦🟩Cute Übersicht über EU-nutzbare KI-Tools
Für Entscheider
Sie sind auf der Suche nach professioneller, exzellenter KI-Betreuung? Melden Sie sich bei mir. Gemeinsam finden wir heraus, wie auch Sie mit KI 60% - 80% an Zeit und Geld sparen können.
🟦Der vielleicht erste Fall von “Vibe-Governing” war ggf. Trumps Zollvorstoß
🟥🟦🟩Extrem (!) wichtiges Beispiel / Case dafür, dass interne Benchmarks der absolute Schlüssel sein können - “Vibe-KIs” sind immer schwerer zu messen:
🟥🟦Shopify-Playbook / hilfreiche Orientierung wie man Unternehmen im KI-Zeitalter führt
🟦Wie HR mit der “Hiring Crisis” durch KI umgehen kann / was noch funktioniert
🟦Einfachster Lackmustest um herauszufinden ob jemand weiß wovon er redet (im KI-Space):
“You ask increasingly detailed questions and people have trouble making things up and things just fuzz into obvious BS, and fake founders basically have the same problem. They’re able to relay a conceptual theory of what they’re doing… But as they get into the details, it just fuzzes out. Whereas the true people that you want to back can do it. What you find is they’ve spent 5 or 10 or 20 years obsessing over the details of whatever it is they’re about to do. And they’re so deep in the details and they know so much more about it than you ever will.”
🟥🟦Ich denke dieses Argument zum Umgang mit Copyright und AI wird ultimativ gewinnen, einfach weil KI bereits heute zu tief in der Gesellschaft verwurzelt ist
🟥🟦Eine sehr brauchbare Dimension um zu verstehen, was KI im eigenen Unternehmen bewirken kann, ist die des Hebels von Mitarbeitern mit KI - mit am besten dargestellt in Grafiken wie dieser:
Das war’s für heute, bis nächstes Mal 🤖
Ben