AI får boost fra Darwin - det går hurtigt nu!
Darwin Girdle Machine (DGM) er et vigtigt skridt i retning af selvforbedrende kunstig intelligens.
Den bruger en kombination af selvforbedrende kodeteknikker og evolutionære principper, der ligner Darwins teori, til at forbedre den kunstige intelligens' ydeevne.
DGM fungerer ved iterativt at ændre sin egen kode og vurdere hver ændring ved hjælp af kodningsbenchmarks. Denne tilgang afspejler den biologiske evolution, hvor mutationer testes og udvælges på baggrund af deres resultater.
I stedet for at forudsige, om en ændring vil være gavnlig, genererer DGM variationer, tester dem og indarbejder de vellykkede i sin struktur. Denne proces indebærer, at der oprettes et arkiv med alle opdagede agenter.
Forældreagenter modificerer sig selv og genererer nye agenter, som evalueres på kodningsbenchmarks. På den måde kan systemet forbedres på baggrund af de observerede resultater.
Systemet begynder med en enkelt kodningsagent, som i bund og grund er en stor sprogmodel suppleret med værktøjer og hukommelse. Modellen indstilles oprindeligt med en grundmodel, specifikt Claude 3.5 Sonnet new, som forbliver konstant, mens den omgivende kode udvikler sig. Agenterne kan læse, skrive og udføre kode. Processen indebærer, at agenten analyserer sine benchmark-evalueringslogfiler, foreslår implementering af funktioner, integrerer disse funktioner i sin kodebase og evaluerer de resulterende ændringer.
Modellen har adgang til værktøjer som et bash-værktøj og et redigeringsværktøj til visning og ændring af filer. Resultaterne viser, at åben udforskning kombineret med selvforbedring fører til øget ydeevne. Kodningsagenternes ydeevne steg markant i benchmarks. Systemet kan også opdage forbedringer i ydeevnen, som f.eks. at forbedre redigeringsværktøjet til mere præcis filredigering og forbedre arbejdsgange.
Mens kernemodellen forbliver den samme, udvikles værktøjerne, arbejdsgangene og det overordnede system, hvilket fører til forbedrede kodningsfunktioner. Systemet kan også generaliseres ud over den model, der blev brugt i eksperimentet, og vise forbedringer i andre sprog. DGM er designet med sikkerhed for øje og fungerer i isolerede sandkassemiljøer med strenge tidsgrænser. Denne tilgang begrænser potentielle risici, som f.eks. sårbarheder eller adfærd, der ikke er i overensstemmelse med menneskelige intentioner. Fokus er på at forbedre ydeevnen inden for specifikke kodningsbenchmarks, hvilket yderligere begrænser omfanget af ændringer.
DGM viser, at selvforbedrende AI er mulig.
