Choses à Savoir TECH - Un mémo d'Anthropic inquiète le monde de la tech ?

Chez Anthropic, le développement logiciel a changé de nature en moins de deux ans. Là où un ingénieur ouvrait autrefois son éditeur de code, il décrit désormais son objectif à Claude. L’IA écrit, teste, corrige, puis soumet ses propositions. En dix-huit mois, la part de code produit par Claude est passée de quelques pourcents à plus de 80 %. Chaque ingénieur supervise aujourd’hui huit fois plus de code qu’il n’en écrivait lui-même en 2024. Le changement ne concerne pas seulement la vitesse. Claude corrige aussi ses propres erreurs et se montre parfois meilleur que les chercheurs humains sur certaines décisions expérimentales. Avant février 2025, l’assistant servait surtout à suggérer des fragments que l’ingénieur copiait dans son environnement de travail. En mai 2026, il réussissait 76 % des tâches les plus ouvertes, contre 26 % six mois plus tôt. Un exemple résume cette bascule. Quand des dizaines de milliers de tâches d’entraînement sont tombées en panne simultanément, quelques lignes de consigne ont été transmises à Claude. Deux heures plus tard, un ingénieur validait le correctif. Seul, un humain aurait mis deux à trois jours. Depuis début 2026, chaque modification apportée au code d’Anthropic est relue automatiquement. Cette relecture, appliquée rétrospectivement, a montré qu’un tiers des bugs ayant provoqué d’anciens incidents auraient pu être détectés avant leur mise en production. En avril, Anthropic a aussi publié les résultats d’un projet de recherche mené presque entièrement par des agents Claude (des IA capables d’enchaîner plusieurs actions sans intervention humaine constante). Sur un problème ouvert de sécurité de l’IA, deux chercheurs humains avaient comblé 23 % de l’écart en une semaine. Les agents, eux, ont atteint 97 % en 800 heures cumulées de calcul. Les gains sont tout aussi spectaculaires sur l’optimisation de code. Claude Opus 4 multipliait par trois la vitesse d’un code de départ. Mythos Preview, plus récemment, l’a multipliée par 52, là où un chercheur humain plafonnait autour de quatre. Mais cette accélération pose un problème d’organisation : Claude produit plus vite que les humains ne relisent. Et la relecture humaine devient le nouveau goulet d’étranglement. Avec Project Glasswing, Mythos Preview a détecté plus de dix mille vulnérabilités critiques en quelques semaines, dont un bug vieux de 27 ans dans OpenBSD. Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

Plus d'épisodes