Robert Glaser (Page 2)

Same Loop, Different Name?

ThoughtWorks’ agentic engineering retreat findings and the elastic loop

How Does Truffle Taste? The Elastic Loop in Agentic Engineering

Agentic engineering fails when loops don’t close. A talk about tight feedback, loose delegation, and what your organization’s mirror actually reflects.

Personal AI is Already Here (And You’re Probably Not Ready)

Three weeks with OpenClaw on a Raspberry Pi. And a glimpse at what’s coming for software architecture.

Der Assistent ist tot: Zweitausend Agenten bauen einen Browser

Zweitausend Agenten bauen parallel einen Webbrowser – Tausende Commits pro Stunde. SQL schlägt Bash bei strukturierten Agenten-Abfragen mit 100 vs. 53 Prozent Genauigkeit. Plus: Selbst Karpathy fühlt sich im Agentic Engineering abgehängt.

90% von allem ist Schrott – und das war schon immer so

Ein forschender Agent liest 1500 Papers und repliziert unveröffentlichte Alzheimer-Forschung. 90% von allem war schon immer Schrott – KI macht ihn nur sichtbar. Plus: Distributional Convergence erklärt, warum Modelle ohne Führung im Generischen landen.

Agentic Pelican on a Bicycle: Claude Opus 4.5

Last week, I declared a clear winner: Gemini 3 Pro. Just one week later, Opus 4.5 shows comparable improvements when iterating on its zero-shotted pelican on a bicycle. I like how Opus 4.5 added improvements that make sense. Where 4.1 added a plate with a selection of

Agentic Pelican on a Bicycle: Gemini 3 Pro

Looks like we have clear winner when it comes to agentically iterating on Pelican on a Bicycle (Simon’s OG benchmark). Let Gemini 3 speak for itself: For each iteration, I converted the SVG to a JPG using the chrome CLI and inspected the result using take_screenshot to simulate

Agentic Pelican on a Bicycle

The agentic loop—generate, assess, improve—seems like a natural fit for iterating on pelicans on bicycles.

Wenn der Agent das Labor betritt

Ein Agent mit XR-Brille begleitet Genexperimente im Wet-Lab physisch. Kleine Teams mit Agenten rütteln an der Firma als Konzept. Plus: Einzelpersonen mit KI erreichen Qualität von Zweierteams ohne.

Claude Skills, anywhere: making them first-class in Codex CLI

Make Claude Skills work in other agents like Codex by adding the missing piece: a small enumerator script.

Fire Your Fetch Tool — Let your Agent Use a Browser

“Fetching a URL” sounds trivial, but inside an agent it can get messy. Part of the confusion comes from documentation that blurs what each web tool actually does. Remember when our dear agents didn’t even bring anything with them? With Codex, the situation is still less clear than with

Karpathy statt Tatort: Kein Entwarnungssignal

Karpathy liefert keinen Abgesang auf Agenten, sondern einen Realitätscheck: wir stehen am hochproduktiven Anfang. JPMorgan erkauft sich kostenlos flächendeckende AI-Transformation mit internen LLMs. Plus: Warum Deutschlands KI-Compute-Pipeline nicht mal für die Minimalstrategie reicht.

The End of Shouting: Prompts as Programs in GPT-5

Why does a prompt that works brilliantly with Claude suddenly break on GPT-5? And since when do we have to write prompts like rule-based programs? How do we enforce “creativity” when Marketing pushes for it? The answer is a fundamental paradigm shift: GPT-5 with reasoning (GPT-5 Thinking) follows instructions with

This Week in Data & AI

Die GPU im Keller: Was passiert, wenn High-End lokal wird? (KW 41, 3.–12.10.2025)

Wenn das der Betriebsrat hört: Frontier-Intelligenz von vor 12 Monaten auf der GPU im Keller. Tool-Budget: 500–1.000 $ pro Engineer für Tools sind günstig – teuer wird es ohne Enablement. Plus: „Vibe Coding“ macht Demos, „Vibe Engineering“ liefert Wert.

KI-Projekte scheitern auf dem Weg zur Kantine (KW 40, 27.9.–2.10.2025)

Die PoC-Hölle: 85 % Accuracy trotz mieser Daten, und dann im Organigramm verreckt. Starke Modelle, schwache Daten, glänzender PoC – und Schluss bei Prozessen, Freigaben und Vertrauen. Und Sora 2 biegt in eine Welt ab, in der Wirklichkeit nur noch ein Parameter ist.

Die leidigen Use-Case-Schubladen

Schubladen liefern Unternehmen perfekte Vorwände, sich für zahllose Use Cases nicht mit Generativer KI zu beschäftigen.

This Week in Data & AI

KI fließt und wir brauchen Ventile (KW 39, 20.–26.09.2025)

KI ist kein fester Block, den man irgendwo hinstellt. Und das „Restaurantproblem” für KI besteht weiterhin: wer nicht zu bestellen weiß, bestellt zur Sicherheit nur Pizza. Ambient Agents rütteln daran.

This Week in Data & AI

Der kleine Freund in der Box hat jetzt einen Arbeitsvertrag (KW 38, 15.–19.9.2025)

Steve Jobs' Vision vom "little friend inside that box" wird 40 Jahre später Realität: KI-Agenten, die lesen statt schreiben, föderierte Wissensarchitekturen mit MCP, und warum spezialisierte Mini-Modelle die echten Arbeitstiere sind. Plus: Synthetische Medizindaten und IBMs Dokumenten-Pipeline.

This Week in Data & AI

Agentik braucht Struktur, nicht mehr Prompt-Zauber (KW 37, 8.–14.9.2025)

Agentische Softwareentwicklung wird konkret – und mit ihr die Frage, wie wir Nicht‑Determinismus produktiv einhegen, ohne ihn totzuadministrieren.

Latest

Same Loop, Different Name?

How Does Truffle Taste? The Elastic Loop in Agentic Engineering

Personal AI is Already Here (And You’re Probably Not Ready)

Der Assistent ist tot: Zweitausend Agenten bauen einen Browser

90% von allem ist Schrott – und das war schon immer so

Agentic Pelican on a Bicycle: Claude Opus 4.5

Agentic Pelican on a Bicycle: Gemini 3 Pro

Agentic Pelican on a Bicycle

Wenn der Agent das Labor betritt

Claude Skills, anywhere: making them first-class in Codex CLI

Fire Your Fetch Tool — Let your Agent Use a Browser

Karpathy statt Tatort: Kein Entwarnungssignal

The End of Shouting: Prompts as Programs in GPT-5

Die GPU im Keller: Was passiert, wenn High-End lokal wird? (KW 41, 3.–12.10.2025)

KI-Projekte scheitern auf dem Weg zur Kantine (KW 40, 27.9.–2.10.2025)

Die leidigen Use-Case-Schubladen

KI fließt und wir brauchen Ventile (KW 39, 20.–26.09.2025)

Der kleine Freund in der Box hat jetzt einen Arbeitsvertrag (KW 38, 15.–19.9.2025)

Agentik braucht Struktur, nicht mehr Prompt-Zauber (KW 37, 8.–14.9.2025)