Google renforce la sécurité de son IA suite aux révélations du rapport Gemini

À la suite de la publication du rapport Gemini mettant en lumière des vulnérabilités potentielles, Google a annoncé un renforcement significatif des protocoles de sécurité de son intelligence artificielle. L’entreprise prévoit un audit approfondi de ses systèmes et une collaboration accrue avec les experts en cybersécurité pour garantir la fiabilité de ses solutions d’IA. Ces mesures interviennent dans un contexte où les régulateurs, notamment la FSA, scrutent de plus près les risques liés aux technologies émergentes.
Google gère les rapports de sécurité différemment.
Google ne publie un rapport qu’après qu’un modèle n’est plus étiqueté «expérimental», et il déplace certaines conclusions de «capacité dangereuse» dans un audit distinct qui n’est pas publié en même temps. En conséquence, le journal public ne couvre pas toutes les menaces que Google a testées.
Plusieurs analystes ont déclaré que le nouveau document Gemini 2.5 Pro est un cas brutal de divulgation limitée. Ils ont également remarqué que le rapport ne fait jamais référence au cadre de sécurité frontière de Google, ou FSF, une politique annoncée l’année dernière pour repérer les futurs pouvoirs d’IA qui pourraient causer des «préjudices grave».
«Ce rapport est très clairsemé, contient un minimum d’informations et est arrivé des semaines après le rendez-vous du modèle», a déclaré Peter Wildeford, co-fondateur de l’Institut pour la politique et la stratégie de l’IA. "Il est impossible de confirmer si Google tient ses propres promesses, et donc impossible de juger de la sécurité et de la sécurité de ses modèles."
Thomas Woodside, co-fondateur du projet Secure IA, a déclaré qu’il était heureux que tout article soit apparu, mais il doutait du plan de Google de publier des suivi stables. Il a souligné que la dernière fois que l’entreprise a partagé les résultats des tests de capabilité dangereux, c’était en juin 2024, et que le document a couvert un modèle annoncé en février de la même année.
La confiance a glissé davantage lorsque les observateurs n’ont vu aucun papier de sécurité pour Gemini 2.5 Flash, un modèle plus mince et plus rapide que Google a révélé la semaine dernière. Un porte-parole de l’entreprise a déclaré qu’un papier flash «arrive bientôt».
"J’espère que c’est une vraie promesse de commencer à donner des mises à jour plus fréquentes", a déclaré Woodside. «Ces mises à jour devraient inclure des résultats pour des modèles qui n’ont pas encore atteint le public, car ces modèles peuvent également présenter de graves risques.»
Google ne manque plus de transparence
La note de sécurité de Meta pour ses nouveaux modèles Llama 4 ne fonctionne que quelques pages, tandis qu’Openai a choisi de ne publier aucun rapport pour sa série GPT - 4.1.
La pénurie de détails survient à un moment tendu. Il y a deux ans, Google a déclaré au gouvernement américain qu’il afficherait des documents de sécurité pour chaque modèle d’IA «significatif» dans la portée. » L’entreprise a fait des promesses similaires aux responsables d’autres pays, affirmant qu’elle offrirait une «transparence publique» sur ses produits d’IA.
Kevin Bankston, conseiller principal sur la gouvernance de l’IA au Center for Democracy and Technology, a qualifié les sorties de Leading Labs de «course vers le bas» sur la sécurité.
"Combiné avec des rapports selon lesquels des laboratoires rivaux comme OpenAI ont réduit le temps de test de sécurité avant la sortie de mois à jours, cette maigre documentation pour le top modèle de Google raconte une histoire troublante d’une course vers le bas sur la sécurité et la transparence de l’IA alors que les entreprises se précipitent sur le marché", a-t-il ajouté.
Google dit qu’une grande partie de son travail de sécurité se produit à huis clos. La société déclare que chaque modèle subit des tests stricts, notamment «équipe rouge adversaire», avant tout lancement public.
Cryptopolitan Academy: fatiguée des balançoires du marché? Découvrez comment DeFi peut vous aider à créer un revenu passif stable. Inscrivez-vous maintenant