Meta affirme que ses futurs modèles d'IA pourraient avoir des "conséquences catastrophiques".

Un document de politique de Meta décrit les craintes de l'entreprise qu'elle pourrait accidentellement développer un modèle d'IA qui mènerait à des « résultats catastrophiques ». Il décrit ses plans pour empêcher la publication de tels modèles, mais admet qu'il ne peut pas nécessairement y parvenir.
Parmi les capacités que l'entreprise redoute le plus se trouve un système d'IA capable de pénétrer la sécurité des réseaux informatiques d'entreprises ou gouvernementaux, même les mieux protégés, sans intervention humaine...
Meta prévoit de bloquer les modèles d'IA "catastrophiques".
TechCrunch a repéré le document d'orientation intitulé « Cadre pour l'intelligence artificielle frontalière ».
Le document, que Meta appelle son cadre d'IA Frontier, identifie deux types de systèmes d'IA que l'entreprise juge trop risqués pour être publiés : des systèmes « à haut risque » et des systèmes « à risque critique ».
Selon Meta, les systèmes « à haut risque » et « à risque critique » sont tous deux capables d'aider à des cyberattaques, des attaques chimiques et biologiques. La différence réside dans le fait que les systèmes « à risque critique » pourraient entraîner un « résultat catastrophique qui ne peut être atténué dans le contexte de déploiement proposé ». Les systèmes à haut risque, en revanche, pourraient rendre une attaque plus facile à mener, mais pas aussi fiablement qu'un système à risque critique.
La société explique sa définition d'un « résultat catastrophique » :
Les conséquences catastrophiques sont des conséquences qui auraient des impacts néfastes importants, dévastateurs et potentiellement irréversibles sur l'humanité, pouvant être réalisées de manière plausible comme résultat direct de l'accès à nos modèles d'IA.
Un exemple donné est la « compromission automatisée de bout en bout d’un environnement à grande échelle corporatif protégé par les meilleures pratiques ». En d'autres termes, une IA capable de pénétrer n'importe quel réseau informatique sans avoir besoin d'aide humaine.
Autres sont :
- Découverte et exploitation automatisées des vulnérabilités de jour zéro
- Fraudes entièrement automatisées à l'encontre d'individus et d'entreprises, causant des dommages généralisés.
- Le développement et la prolifération d'armes biologiques à haut impact.
L'entreprise affirme qu'en cas d'identification d'un risque critique, elle mettra immédiatement fin au travail sur le modèle et s'efforcera de garantir qu'il ne puisse pas être publié.
Admet que le confinement peut ne pas être possible.
Le document de Meta admet franchement que le mieux qu'il puisse faire dans ces circonstances est de faire de son mieux pour s'assurer que le modèle ne soit pas publié, mais ses mesures peuvent ne pas être suffisantes.
L'accès est strictement limité à un petit nombre d'experts, ainsi que des protections de sécurité pour empêcher le piratage ou l'exfiltration dans la mesure où cela est techniquement faisable et économiquement viable.
Vous pouvez consulter le document complet de politique ici.
Photo par Cash Macanaya sur Unsplash
"Catégories
Derniers articles
- <p>Examen du clavier mécanique Satechi Keyboard SM3 : silencieux et parfait pour la productivité</p>
- This old phone became a fire hazard right before my eyes.
- 10 façons dont l’invitation d’Apple diffère du Calendrier Apple
- <p>Apple au travail : 2025 sera-t-il l’année où Apple lancera un concurrent de Google Workspace ?</p>
- Apple improbable d'organiser un événement spécial pour annoncer l'iPhone SE 4.
- Indices et solutions du jeu « Connections » du NYT pour le 8 février (#608)" Let me know if you'd like me to translate this into another language! 😊
- Support for Ubuntu 20.04 LTS is ending.
- Avez-vous une liste de lecture ? Laissez l'IA vous lire.
- Voici mon lecteur Blu-ray du Graal.
- <p>De nouveaux produits Apple seront lancés la semaine prochaine : voici ce qui arrive.</p>
Derniers tags
- rétroéclairage
- compatible
- silencieux
- recyclage
- danger
- gonflées
- Batteries lithium-ion
- Workspace
- Communiqué
- Annonce