
Varje vecka plockar vi ut ett par nyheter som fångat vår uppmärksamhet - ibland för att de kan förändra branschen, ibland för att de säger något om hur snabbt vägen från idé till färdig produkt håller på att krympa. Den här veckan handlar båda nyheterna om just det: hur AI komprimerar tiden mellan "tänk om" och "det funkar".
1. Han vibekodade en självkörande taxi - och körde Sam Altman
En ung AI-ingenjör och grundare, Georg von Manstein, byggde om en vanlig golfbil till en självkörande campus-taxi - och gav OpenAI:s VD Sam Altman en provtur. Bygget är utrustat med linjära ställdon, motoriserad styrning och en GPU ombord, och är optimerat med teknik från OpenAI och Codex Labs.
Det mest anmärkningsvärda är inte hårdvaran - det är tempot. Projektet tog veckor, inte månader eller år, mycket tack vare att stora delar var "vibekodade" med Codex. I videon diskuterar Sam Altman hur man kartlägger trottoarer, kopplar upp fordonen via Starlink och skalar upp till självkörande shuttles på begäran.
Varför det är intressant för oss
Vi pratar ofta om att den svåraste delen av ett projekt sällan är själva kodandet - det är att komma från idé till något konkret man kan testa, känna på och utvärdera. När en enskild grundare kan ta ett fysiskt fordon från koncept till fungerande prototyp på veckor, är det ett tydligt tecken på vart utvecklingen är på väg. Vibe-coding flyttar tyngdpunkten från att skriva varje rad till att formulera vad som ska byggas och snabbt validera om det funkar.
Det som förändras är inte att vi bygger mindre noggrant - utan att vi kan testa en idé i verkligheten långt tidigare än förr.
Samtidigt är en provtur på ett campus något helt annat än ett fordon i blandad stadstrafik. Men som prototyp och bevis på hur snabbt man kan iterera idag är det imponerande - och precis den sortens tempo vi själva eftersträvar i tidiga faser av appprojekt.
2. Claude Opus 4.8 - modellen som gissar mindre
Anthropic har släppt Claude Opus 4.8. Det är en stegvis uppgradering på de flesta benchmarks, men två saker sticker ut för oss som bygger programvara.
Färre självsäkra felgissningar
Den största nyheten handlar om ärlighet. Ett återkommande problem med AI-modeller är att de ibland drar förhastade slutsatser och självsäkert påstår att de löst en uppgift - trots tunt underlag. Anthropic uppger att Opus 4.8 är ungefär fyra gånger mindre benägen än föregångaren att låta fel i kod den själv skrivit passera oanmärkt, och oftare flaggar osäkerhet istället för att gissa.
I apputveckling är det här en större sak än det kanske låter. En modell som säger "det här är jag osäker på" istället för att leverera en självsäker men felaktig lösning sparar oss timmar av felsökning - och gör AI till en mer pålitlig kollega i kodbasen, inte bara en snabb sådan.
En AI som vågar säga "jag vet inte" är ofta mer värd än en som alltid låter säker.
Dynamic workflows: hundratals agenter parallellt
Den andra nyheten är "dynamic workflows" i Claude Code (i research preview). Den låter modellen planera ett arbete och sedan köra hundratals parallella subagenter i en och samma session, verifiera resultaten och rapportera tillbaka. Anthropic lyfter fram exempel som kodbas-migreringar över hundratusentals rader kod - från start till mergad kod, med den befintliga testsviten som ribba.
- Planerar upp arbetet och delar ut det på många parallella agenter
- Verifierar sina egna utdata innan de rapporteras tillbaka
- Klarar storskaliga uppgifter som migreringar över hela kodbaser
Varför det är intressant för oss
Stora migreringar och refaktoreringar är ofta det som blir liggande i enterprise - för dyrt och för tidskrävande. Kan en AI planera, parallellisera och verifiera den typen av arbete med testsviten som facit, öppnar det för att modernisera äldre system i en helt annan takt. Kombinerat med att modellen gissar mindre blir det inte bara snabbare, utan också tryggare.
Vi ses nästa vecka
Två nyheter, samma röda tråd: avståndet mellan idé och fungerande produkt krymper - oavsett om det handlar om en självkörande golfbil eller en migrering av hundratusentals rader kod. Har ni sett något vi borde ha med nästa vecka? Hör av er, vi är alltid nyfikna.


