Séminaire Corpus nativement numériques : enjeux et méthodes
Publié le 18 décembre 2018
Séminaire organisé par Christine Barats (UPEC, Céditec), Maîtresse de conférences HDR en sciences de l'information et de la communication.
Date(s)
le 25 janvier 2019
Lieu(x)
Université Paris-Est Créteil Campus du Mail des Mèches
Bâtiment des sciences économiques
Salle Keynes (2ème étage)
rue Poëte et Sellier, 94000 Créteil
Métro : Créteil Université (ligne 8) Plan d'accès
Présentation
Cette séance se propose d’interroger la notion de corpus, au regard des spécificités des corpus nativement numériques. L’hétérogénéité des données, leur volume, la notion de flux, de même que la nécessaire prise en compte du dispositif renouvellent les critères de sélection, d’archivage et de traitement de corpus nativement numériques. L’accent portera sur les conditions de collecte et d’analyse, que la collecte soit ou non supervisée par le chercheur.
Nous examinerons différents types de corpus (hybrides, échantillonnés, représentatifs…) ainsi que les choix et arbitrages auxquels sont soumis les chercheur.e.s et les difficultés qu’elles/ils peuvent rencontrer.
Il s’agira de questionner l’intérêt et les limites du recours aux corpus et également de mieux appréhender leurs modalités de traitement et les outils d’analyse. Des exemples illustreront les interventions.
Programme
Archives du web, entre capture et insaisissable
Valérie Schafer - C2DH Université du Luxembourg
Capturer des écrans : désirs, disparitions, débordements
Gustavo Gomez Mejia - Prim, Université de Tours
Contraintes et bricolages d'une enquête sur Twitter
Fred Pailler, Centre Atlantique de Philosophie, Université de Bretagne-Loire.
Pétitionnement en ligne et corpus ad hoc : croiser des données hétérogènes
Christine Barats - Céditec, Université Paris-Est Créteil & Université Paris Descartes.