Cygne Noir (Dec 2019)

Données brutes ou hypersymboles? Signification et données numériques, entre processus discursif et procédure machinique

  • Lucile Crémier,
  • Maude Bonenfant ,
  • Laura Iseut Lafrance St-Martin

Journal volume & issue
no. 7

Abstract

Read online

L’analyse de grands ensembles de données numériques (le plus souvent appelés « Big Data » ou « données massives ») constitue aujourd’hui une méthode de recherche de plus en plus populaire, consensuelle et couramment utilisée en sciences sociales. Avec l’automatisation de la collecte de données, la mathématisation de l’analyse et l’objectivation numérique, cette méthode gagne en efficacité et la valeur de vérité des résultats obtenus se renforce. Cet article établit, en premier lieu, une revue de littérature critique concernant la collecte et l’analyse des données massives et résume les débats éthiques actuels qu’occasionnent de tels outils informatiques de recherche. En second lieu, nous présentons un modèle sémiotique de la production et de la circulation des données numériques afin de problématiser l’idée selon laquelle les données donneraient à voir « le monde lui-même » (une présentation directe du monde surpassant tous les autres modes de représentation), plutôt que d’être un moyen de se figurer le monde (un mode de représentation parmi d’autres). Suivant l’approche sémiotique et la philosophie pragmaticiste de Charles Sanders Peirce, nous définissons alors la numérisation comme un processus sémiotique d’hypersymbolisation. Nous mettons ainsi en lumière l’apparente naturalisation du sens, l’illusion d’iconicité et la rhétorique sur lesquelles repose la valeur de vérité des données dans le contexte économique et politique de leur usage à des fins d’application lucrative. Nous décrivons ainsi quelques implications épistémologiques et éthiques découlant de nos modes de représentation et d’usage des données, ainsi que de la valeur d’autorité qui leur est attribuée. Ceci nous permet d’entrevoir plusieurs pistes pour l’étude critique de l’analyse des données massives dans une perspective sémiotique.

Keywords