Same Loop, Different Name?
ThoughtWorks’ agentic engineering retreat findings and the elastic loop
ThoughtWorks’ agentic engineering retreat findings and the elastic loop
Agentic engineering fails when loops don’t close. A talk about tight feedback, loose delegation, and what your organization’s mirror actually reflects.
Three weeks with OpenClaw on a Raspberry Pi. And a glimpse at what’s coming for software architecture.
Zweitausend Agenten bauen parallel einen Webbrowser – Tausende Commits pro Stunde. SQL schlägt Bash bei strukturierten Agenten-Abfragen mit 100 vs. 53 Prozent Genauigkeit. Plus: Selbst Karpathy fühlt sich im Agentic Engineering abgehängt.
Ein forschender Agent liest 1500 Papers und repliziert unveröffentlichte Alzheimer-Forschung. 90% von allem war schon immer Schrott – KI macht ihn nur sichtbar. Plus: Distributional Convergence erklärt, warum Modelle ohne Führung im Generischen landen.
Last week, I declared a clear winner: Gemini 3 Pro. Just one week later, Opus 4.5 shows comparable improvements when iterating on its zero-shotted pelican on a bicycle. I like how Opus 4.5 added improvements that make sense. Where 4.1 added a plate with a selection of
Looks like we have clear winner when it comes to agentically iterating on Pelican on a Bicycle (Simon’s OG benchmark). Let Gemini 3 speak for itself: For each iteration, I converted the SVG to a JPG using the chrome CLI and inspected the result using take_screenshot to simulate
The agentic loop—generate, assess, improve—seems like a natural fit for iterating on pelicans on bicycles.
Ein Agent mit XR-Brille begleitet Genexperimente im Wet-Lab physisch. Kleine Teams mit Agenten rütteln an der Firma als Konzept. Plus: Einzelpersonen mit KI erreichen Qualität von Zweierteams ohne.
Make Claude Skills work in other agents like Codex by adding the missing piece: a small enumerator script.
“Fetching a URL” sounds trivial, but inside an agent it can get messy. Part of the confusion comes from documentation that blurs what each web tool actually does. Remember when our dear agents didn’t even bring anything with them? With Codex, the situation is still less clear than with
Karpathy liefert keinen Abgesang auf Agenten, sondern einen Realitätscheck: wir stehen am hochproduktiven Anfang. JPMorgan erkauft sich kostenlos flächendeckende AI-Transformation mit internen LLMs. Plus: Warum Deutschlands KI-Compute-Pipeline nicht mal für die Minimalstrategie reicht.
Why does a prompt that works brilliantly with Claude suddenly break on GPT-5? And since when do we have to write prompts like rule-based programs? How do we enforce “creativity” when Marketing pushes for it? The answer is a fundamental paradigm shift: GPT-5 with reasoning (GPT-5 Thinking) follows instructions with
This Week in Data & AI
Wenn das der Betriebsrat hört: Frontier-Intelligenz von vor 12 Monaten auf der GPU im Keller. Tool-Budget: 500–1.000 $ pro Engineer für Tools sind günstig – teuer wird es ohne Enablement. Plus: „Vibe Coding“ macht Demos, „Vibe Engineering“ liefert Wert.
Die PoC-Hölle: 85 % Accuracy trotz mieser Daten, und dann im Organigramm verreckt. Starke Modelle, schwache Daten, glänzender PoC – und Schluss bei Prozessen, Freigaben und Vertrauen. Und Sora 2 biegt in eine Welt ab, in der Wirklichkeit nur noch ein Parameter ist.
Schubladen liefern Unternehmen perfekte Vorwände, sich für zahllose Use Cases nicht mit Generativer KI zu beschäftigen.
This Week in Data & AI
KI ist kein fester Block, den man irgendwo hinstellt. Und das „Restaurantproblem” für KI besteht weiterhin: wer nicht zu bestellen weiß, bestellt zur Sicherheit nur Pizza. Ambient Agents rütteln daran.
This Week in Data & AI
Steve Jobs' Vision vom "little friend inside that box" wird 40 Jahre später Realität: KI-Agenten, die lesen statt schreiben, föderierte Wissensarchitekturen mit MCP, und warum spezialisierte Mini-Modelle die echten Arbeitstiere sind. Plus: Synthetische Medizindaten und IBMs Dokumenten-Pipeline.
This Week in Data & AI
Agentische Softwareentwicklung wird konkret – und mit ihr die Frage, wie wir Nicht‑Determinismus produktiv einhegen, ohne ihn totzuadministrieren.