Passer au contenu principal

🔐 Partie 3 : Les données à ne JAMAIS mettre dans une IA

🚨 La liste noire absolue

1. Informations personnelles identifiables (PII)

  • Numéros de sécurité sociale
  • Numéros de carte de crédit
  • Adresses complètes
  • Numéros de passeport
  • Données biométriques

Pourquoi : Ces données peuvent être stockées, apprises et potentiellement exposées. C'est comme crier votre code PIN dans la rue.

2. Secrets commerciaux et propriété intellectuelle

  • Code source propriétaire complet
  • Formules secrètes
  • Stratégies commerciales confidentielles
  • Données clients non anonymisées

Pourquoi : Vous ne connaissez pas le modèle de stockage et d'apprentissage. Votre secret peut devenir moins secret.

3. Données médicales non anonymisées

  • Dossiers patients complets
  • Résultats d'examens avec identifiants
  • Historiques médicaux détaillés

Pourquoi : RGPD, HIPAA, et autres acronymes sérieux. Plus l'éthique de base.

4. Informations d'authentification

  • Mots de passe (évidemment !)
  • Tokens API
  • Clés de chiffrement
  • Informations de connexion

Pourquoi : Sérieusement ? On doit expliquer pourquoi ?

5. Documents sous NDA ou confidentialité contractuelle

  • Contrats non publics
  • Projets clients confidentiels
  • Informations sous embargo

Pourquoi : Parce que "confidentiel" signifie... confidentiel. Pas "confidentiel sauf pour l'IA".

💡 La règle d'or de la confidentialité

Posez-vous la question : "Serais-je à l'aise si cette information apparaissait sur un panneau publicitaire géant ?"

  • Non → N'insérez pas
  • Oui → Vous pouvez probablement insérer
  • Vous hésitez → N'insérez pas