
Techspaningar v.23 - Stanford-studenten som vibekodade en självkörande taxi, och Claude Opus 4.8 som vågar säga "jag vet inte"

Varje vecka plockar vi ut ett par nyheter som fångat vår uppmärksamhet - ibland för att de kan förändra branschen, ibland för att de säger något om hur snabbt vägen från idé till färdig produkt håller på att krympa. Den här veckan handlar båda nyheterna om just det: hur AI komprimerar tiden mellan "tänk om" och "det funkar".
1. Han vibekodade en självkörande taxi - och körde Sam Altman
En ung AI-ingenjör och grundare, Georg von Manstein, byggde om en vanlig golfbil till en självkörande campus-taxi - och gav OpenAI:s VD Sam Altman en provtur. Bygget är utrustat med linjära ställdon, motoriserad styrning och en GPU ombord, och är optimerat med teknik från OpenAI och Codex Labs.
Det mest anmärkningsvärda är inte hårdvaran - det är tempot. Projektet tog veckor, inte månader eller år, mycket tack vare att stora delar var "vibekodade" med Codex. I videon diskuterar Sam Altman hur man kartlägger trottoarer, kopplar upp fordonen via Starlink och skalar upp till självkörande shuttles på begäran.
Vi pratar ofta om att den svåraste delen av ett projekt sällan är själva kodandet - det är att komma från idé till något konkret man kan testa, känna på och utvärdera. När en enskild grundare kan ta ett fysiskt fordon från koncept till fungerande prototyp på veckor, är det ett tydligt tecken på vart utvecklingen är på väg. Vibe-coding flyttar tyngdpunkten från att skriva varje rad till att formulera vad som ska byggas och snabbt validera om det funkar.
Det som förändras är inte att vi bygger mindre noggrant - utan att vi kan testa en idé i verkligheten långt tidigare än förr.
Samtidigt är en provtur på ett campus något helt annat än ett fordon i blandad stadstrafik. Men som prototyp och bevis på hur snabbt man kan iterera idag är det imponerande - och precis den sortens tempo vi själva eftersträvar i tidiga faser av appprojekt.
2. Claude Opus 4.8 - modellen som gissar mindre
Anthropic har släppt Claude Opus 4.8. Det är en stegvis uppgradering på de flesta benchmarks, men två saker sticker ut för oss som bygger programvara.
Färre självsäkra felgissningar
Den största nyheten handlar om ärlighet. Ett återkommande problem med AI-modeller är att de ibland drar förhastade slutsatser och självsäkert påstår att de löst en uppgift - trots tunt underlag. Anthropic uppger att Opus 4.8 är ungefär fyra gånger mindre benägen än föregångaren att låta fel i kod den själv skrivit passera oanmärkt, och oftare flaggar osäkerhet istället för att gissa.
I apputveckling är det här en större sak än det kanske låter. En modell som säger "det här är jag osäker på" istället för att leverera en självsäker men felaktig lösning sparar oss timmar av felsökning - och gör AI till en mer pålitlig kollega i kodbasen, inte bara en snabb sådan.
En AI som vågar säga "jag vet inte" är ofta mer värd än en som alltid låter säker.
Dynamic workflows: hundratals agenter parallellt
Den andra nyheten är "dynamic workflows" i Claude Code (i research preview). Den låter modellen planera ett arbete och sedan köra hundratals parallella subagenter i en och samma session, verifiera resultaten och rapportera tillbaka. Anthropic lyfter fram exempel som kodbas-migreringar över hundratusentals rader kod - från start till mergad kod, med den befintliga testsviten som ribba.
- Planerar upp arbetet och delar ut det på många parallella agenter
- Verifierar sina egna utdata innan de rapporteras tillbaka
- Klarar storskaliga uppgifter som migreringar över hela kodbaser
Stora migreringar och refaktoreringar är ofta det som blir liggande i enterprise - för dyrt och för tidskrävande. Kan en AI planera, parallellisera och verifiera den typen av arbete med testsviten som facit, öppnar det för att modernisera äldre system i en helt annan takt. Kombinerat med att modellen gissar mindre blir det inte bara snabbare, utan också tryggare.
Vi ses nästa vecka
Två nyheter, samma röda tråd: avståndet mellan idé och fungerande produkt krymper - oavsett om det handlar om en självkörande golfbil eller en migrering av hundratusentals rader kod. Har ni sett något vi borde ha med nästa vecka? Hör av er, vi är alltid nyfikna.

Techspaningar v.25 - SpaceX börsdebuterar och skapar världens första triljonär, och Anthropic tvingas dra tillbaka Fable 5 och Mythos 5
SpaceX gjorde sin entré på Nasdaq och rusade 19% på debuten - värderingen passerade två biljoner dollar, ungefär 4 400 anställda blev miljonärer och Elon Musk blev officiellt världens första dollar-triljonär. Samma vecka tvingades Anthropic abrupt stänga av Fable 5 och Mythos 5 efter ett exportkontrolldirektiv från USA:s regering. Välkommen till veckans techspaningar.
Läs mer
Techspaningar v.24 - Gabi, robotmunken som svor klosterlöften i Seoul, och Anthropic som vill att världen ska kunna "pausa" AI
I ett buddhisttempel i Seoul tog en humanoid robot vid namn Gabi emot klosterlöften - däribland att spara energi och behandla andra robotar fredligt. Samtidigt föreslår Anthropic att världen borde ha möjligheten att tillfälligt pausa AI-utvecklingen, vilket utlöste en högljudd debatt. Välkommen till veckans techspaningar.
Läs mer
Techspaningar v.22 - Take Twos VD om varför AI inte kan skapa nästa GTA, och AI-frisören som klipper på millimetern
Take Twos VD Strauss Zelnick menar att AI till sin natur är bakåtblickande - och därför aldrig kommer skapa nästa kulturella succé. Samtidigt sprids virala videos från Kina på automatiserade frisörkapslar som klipper dig med AI och millimeterprecision. Välkommen till veckans techspaningar.
Läs merVill ni diskutera detta?
Kontakta oss för en förutsättningslös diskussion om hur vi kan hjälpa er med er digitala satsning.
Kontakta oss