Au moment où le Web s’est popularisé, tous les chiffres ont explosé : des datacenters sont apparus massivement, tous les systèmes de stockage étaient à repenser, et il a fallu réinventer les réseaux qui supportent aujourd’hui Internet. Dans les datacenters – ces mégastructures qui abritent des milliers d’ordinateurs desservant le Web – se trouvait un trésor insoupçonné : l’information cachée dans les données. Par Thomas Solignac, Co-fondateur de Golem.ai et intervenant à SUP’Internet

 

La donnée et l’information

Depuis quelques années, Google prédit les vagues de grippe jusqu’à dix jours à l’avance, avec une surprenante fiabilité. Pour en être capable, Il applique des algorithmes de prédiction sur l’ensemble de ses données à disposition. On imagine aisément que beaucoup d’entre nous faisons une recherche de nos symptômes sur Internet lorsque nous tombons malade. Conséquence de cette habitude, on obtient une corrélation entre les requêtes faites à Google, et les épidémies de grippe. Cette démarche, c’est l’esprit de la Big Data : l’information ne se réduit pas à la somme des données dont elle est constituée. Lorsqu’elle est traitée, la donnée dévoile une quantité d’informations insoupçonnée.

 

Des applications dans tous les domaines

La santé est le premier secteur auquel on pense : on peut imaginer comment le rassemblement des données sur les patients amènerait un regard nouveau sur l’apparition et le développement de nombreuses pathologies. Dans la finance, les investissements en bourse sont faits par des systèmes informatiques qui effectuent des milliers de transaction par seconde. Ces systèmes analysent même l’actualité des entreprises dans lesquelles elles investissent. Enfin, dans la publicité, la Big Data est devenu un outil féroce de marketing ; il est tout autant possible de cibler très précisément la publicité grâce au profil des client, que de déterminer des comportements globaux d’achat.

 

Les maîtres de la donnée

La donnée devient alors un objet avec une valeur financière ; on ne se contente plus de la stocker lorsque c’est nécessaire, mais on essaye d’en accumuler le plus possible pour une éventuelle exploitation ultérieure. Suite logique de cette progression : la donnée se marchande. Si l’entreprise qui récolte la donnée en est souvent la première exploitante, ce n’est plus la seule. Les bases de données s’achètent et se vendent d’une entreprise à une autre. Récemment, le top 5 des entreprises les mieux valorisées s’est vu totalement bouleversé. En 2011, la seule entreprise du domaine des nouvelles technologies (IT) présente dans cette liste était Apple, en 4è place. En 2016 cette liste ne contient que des entreprises d’IT : Apple ($582 Mds), Alphabet ($556 Mds), Microsoft ($452 Mds), Amazon ($364 Mds), Facebook ($359 Mds). Qu’ont ces entreprises en commun ? Elles possèdent vos données, et ont la capacité à les maîtriser pour en dégager une signification concrète et leur donner une valeur financière.

 

De nouveaux métiers

L’univers des nouvelles technologies est déjà connu pour créer des nouveaux métiers, mais le monde du traitement des données bouleverse même d’autres secteurs. Data Science, Data Analyse, Data Visualisation, autant de métiers dont on ne parlait pas il y a quelques années mais qui remplissent désormais les sites de recrutement et les échanges sur LinkedIn. Ces nouveaux métiers permettent de comprendre, traiter et visualiser la donnée.

 

Confidentialité des données : une préoccupation grandissante

Dans plusieurs domaines, en particulier la santé, la question de la confidentialité est un frein à la Big Data. Pour certains utilisateurs, il s’agit d’une opposition simple et ferme au recueil de données. Pour beaucoup, c’est l’inquiétude d’une violation de la vie privée, avec le risque que les données puissent faire l’objet d’une utilisation malveillante. Ce problème s’est déjà posé, lorsque les données d’utilisation des Vélib’ à Paris ont été dévoilées. Même en anonymisant les données, il est possible de retrouver une personne, et ainsi de connaître tous ses déplacements. Si l’impact ici paraît mineur, il s’agit d’une alerte pour beaucoup. On comprend la peur que peut provoquer l’idée d’une mise en commun des données de santé des patients, malgré tous les progrès que cela pourrait amener dans le domaine. Si la donnée est la limite, alors l’enjeu pour l’avenir est de proposer de nouveaux systèmes de sécurisation de l’information, qui permettront aux utilisateurs de partager librement et sereinement leurs données.