♦
PrésentationA l'interface entre sciences humaines et sociales, informatique et statistique, le traitement numérique de données textuelles vise des applications multiples: tests d'hypothèses à partir de productions écrites ou orales, analyses exploratoires de corpus web, journalistiques, politiques ou littéraires, visualisation d'opinions, extraction d'informations, etc.
Il s'organisera en deux temps : le vendredi 24 novembre dans les locaux de l'Université Paris-Est-Marne-la-Vallée, seront présentés des travaux portant sur les thématiques présentées ci-dessous. Le samedi 25 novembre, à l'UPEC une session de formation aux outils des partenaires et des participants sera organisée en salle informatique.
♦
Thèmes à aborderLes thématiques attendues sont les suivantes :
• Corpus: corpus numériques, réseaux sociaux, corpus littéraires, controverses, corpus multimodaux, multicanaux, SMS, unilingues ou bilingues.
• Outils pour la reconnaissance d'auteur, la caractérisation de genres de discours, l'alignement, l'étiquetage, la visualisation, la gestion de dictionnaires, l'interopérabilité, l'extraction de toponymes, faciliter les parcours d'utilisation, etc.
• Méthodes: analyse multi-fractales, méthodes statistiques, apprentissage supervisé, linguistique qualitative, etc.
Outre qu'elles permettront de faire le point sur les derniers développements et de susciter l'échange entre différentes disciplines, ces thématiques répondront aux interrogations suivantes :
• Quels sont les besoins, en partant des corpus, des différents domaines ?
• Que peuvent apporter les outils d'exploration, de visualisation, d'annotation aux recherches en cours ?
• Quels sont les apports et limites des outils et méthodes, en TAL, textométrie, lexicométrie data visualisation ?
♦
Propositions de communicationLes contributions doivent être envoyées avant le 25 septembre 2017 à l'adresse suivante:
workshop.eclavit@gmail.comElles pourront prendre plusieurs formes :
• Poster (avec présentation en séance plénière de trois minutes)
• Session de formation à des outils de traitement ou de visualisation de corpus.
Les réponses du comité scientifique seront communiquées le 15 octobre 2017.
> Télécharger l'appel à communication - Français> Download call for paper - English