Secrétisation données CCI

La CCI fournit à l'OEB des données relatives à la production de déchets par types et par activités sur la base des déclarations des entreprises.

Ces déclarations contenant le numéro de Siret des entreprises, elles nécessitent d'être anonymisées selon les règles du secret statistique avant exploitation et diffusion.

Le traitement décrit ici vise la secrétisation de ces données aux différents niveaux d'exploitation prévus.

Sources de données

Enquête évaluation des déchets non dangereux issus d'activités économique (DNDAE) - Chambre de commerce et de l'industrie (CCI) de Bretagne

Règles de secrétisation

Les données seront anonymisées selon les principes suivants pour chaque sous-catégorie de chaque niveau d'exploitation :

  • Moins de 3 entreprises déclarantes

  • Une entreprise représentant plus de 85% du tonnage total de la catégorie

  • La possibilité de retrouver une donnée anonymisée via un autre niveau d'exploitation (secrétisation indirecte)

Niveaux d'exploitations prévus

  1. Nature du déchet + Territoire concerné

  2. Nature du déchet + Territoire concerné + Activité productrice du déchet

  3. Nature du déchet + Territoire concerné + Type de déchet

  4. Nature du déchet + Territoire concerné + Type de déchet + Activité productrice du déchet

  5. Nature du déchet + Territoire concerné + Activité + Sous-activité productrice du déchet

  6. Nature du déchet + Territoire concerné + Type de déchet + Type de sous-déchet

  7. Nature du déchet + Territoire concerné + Activité + Sous-activité productrice du déchet Type de déchet + Type de sous-déchet

  8. Les 7 niveaux précédents sans le distinguo sur la nature du déchet (trié / non trié)

Traitement de la donnée

  • Etape 1 :

  • Application des règles de secrétisations sur les données agrégées sur le niveau 1

  • Etape 2 :

  • Application des règles de secrétisations sur les données agrégées aux niveaux 2 et 3 pour les données non anonymisées à l'étape 1

  • Etape 3 :

  • Application des règles de secrétisations sur les données agrégées au niveau 4 pour les données non anonymisées aux niveaux 2 et 3 lors de l'étape 2

  • Application des règles de secrétisations sur les données agrégées au niveau 5 pour les données non anonymisées au niveau 2 lors de l'étape 2

  • Application des règles de secrétisations sur les données agrégées au niveau 6 pour les données non anonymisées au niveau 3 lors de l'étape 2

  • Etape 4 :

  • Application des règles de secrétisations sur les données agrégées au niveau 7 pour les données non anonymisées aux niveaux 4, 5 et 6 lors de l'étape 3

  • Etape 5 :
  • Les étapes 1 à 4 sont rejouées dans une deuxième phase sans le distinguo sur la nature du déchet (trié / non trié)
  • Un post traitement est ensuite appliqué pour réappliquer les règles de secrétisations indirectes entre la phase 1 et la phase 2

Précisions sur la secrétisation indirecte des données

Pour limiter au maximum le nombre de catégories masquées par la secrétisation indirecte un système de note est utilisé :

  • A chaque fois qu'une sous-catégorie est anonymisée, la catégorie supérieure se voit attribuer un point

  • Cette notation est répétée pour toutes les sous-catégories du niveau d'exploitation traité

  • Les sous-catégories ayant le nombe maximum de points à la fin des tests de notations sont secrétisées

Ce système garanti le respect du secret statistique tout en conservant le maximum d'exhaustivité des données.