Anonymisation semi- automatique de corpus d’interactions: éléments pour une méthode interactive

                                                        

Articles de colloque

Contributors: 
Publication status: 
2012, septembre
Proceedings title: 
Actes de JOCAIR'2012
Publisher: 
Journées Communication et Apprentissage Instrumentés en Réseau (JOCAIR)
Place: 
Université de Picardie Jules-Verne, Amiens, France
Page range: 
131-154
Abstract: 
Pour faciliter le partage de données de recherche, et donc la comparaison, il est indispensable que les chercheurs puissent disposer de méthodes et d’outils permettant d’anonymiser les grands volumes d’interactions de leurs corpus. Nous rappelons le cadre légal et les enjeux de l’anonymisation avant de montrer les difficultés de son automatisation. La méthode proposée ici laisse au chercheur-utilisateur visé, le contrôle du processus de transformation de son corpus. C’est une méthode interactive, systématique et applicable à des corpus écrits en toutes langues. Elle est basée sur un cycle de marquage et de fouille détaillé dans cet article et appliqué à deux corpus de forums très différents. Les résultats de ces premières applications sont présentés et discutés pour envisager de nouvelles améliorations à cette méthode et une mise en œuvre comme outil de la plateforme Calico.
Exercice annuel: 
2012-2013