SHS Web of Conferences (Jan 2015)

L’hétérogénéité des données provenant du web ; des étapes pour la constitution du corpus complexe

  • Pérez Lagos Camila

DOI
https://doi.org/10.1051/shsconf/20152001018
Journal volume & issue
Vol. 20
p. 01018

Abstract

Read online

Le corpus issu d’Internet fait émerger de nouvelles problématiques pour les sciences de l’information et de la communication ainsi que pour l’analyse du discours. Au moment de traiter des données multiformes nous risquons de les adapter aux outils déjà existants en contournant les aspects qu’il n’est pas possible de saisir tels que la volatilité des contenus et la multiplicité des signes. Sur une seule page web nous pouvons être confrontés à des photographies, des vidéos, des hyperliens, etc. qui sont constamment actualisés en fonction des contenus. Dans le cadre de cet article nous nous proposons de formuler des réflexions autour de la notion de corpus compris comme une construction de données complexes due à une hétérogénéité de deux types: énonciative et technique. Cet aspect est traité en rapport avec une première analyse de corpus de six sites web de salles de théâtre provenant du Chili, de France et d’Espagne. Une telle démarche nous a permis de dégager les premières conclusions autour des données provenant d’Internet: la diffusion des contenus émanant des sites web et répandus également sur les réseaux sociaux provoque l’amplification du rôle du destinataire, qui devient producteur des contenus ainsi que diffuseur et critique de spectacles de théâtre à l’affiche.