Le web est en pleine transformation. Collecter massivement des données sur le net est aujourd’hui chose possible. Même si peu d’acteurs se sont attaqué à ces nouvelles problématiques (hors moteurs de recherche historiques), quelques-uns se distinguent cependant.
Les besoins sont de plus en plus variés
Connaître les habitudes des utilisateurs de tel type de produit, de site marchand ou de jeux multi-joueurs, enrichir et affiner son fichier de prospection, surveiller les forums de discussions sur lesquels on parle de certains produits, tisser les liens d’influence entre les sites qui vous référencent, consolider les informations diverses sur les étudiants d’une université, détecter des fuites de données sur le net, segmenter plus finement son environnement marketing, suivre les prix des concurrents, l’évolution de leurs catalogues produits et de leurs bannières publicitaires, connaître les compétences présentes dans une entreprise à racheter, etc… etc !
Une phase de collecte massive de données est alors nécessaire pour répondre à ces besoins métiers, et les 4V du Big Data s’appliquent aussi à la phase de collecte de données.
Aleph-networks permet aujourd’hui, grâce à la technologie GrayMatter, de collecter tout type de données publiques présentes sur le net, structurées ou non-structurées, de les traiter, les analyser et d’en tirer de l’information structurée compatible avec n’importe quel Système d’Information. Les possibilités d’exploitation professionnelle des données du web et des réseaux sociaux s’en trouvent alors décuplées.
L’offre actuelle en terme de collecte
Aujourd’hui, collecter des données signifie encore trop souvent :
- collecter des données internes (faible création de valeur)
- collecter des données externes pour de la veille (faible volume)
- collecter des données externes, open data, pour en extraire de l’information ciblée (webmining) (faible vitesse)
et pas assez souvent :
- collecter des données internes et externes provenant de tout le web public, de manière massive, pour alimenter une vraie démarche Big Data (4V), pour plus d’informations différenciantes et stratégiques, pour maximiser le ROI de votre projet Big Data.
La technologie GrayMatter se positionne sur ce dernier point et offre ainsi un nouveau champ d’exploitation immense qui, de fait, pose des questions légales et éthiques.
Nouvelles questions légales et éthiques
Des technologies qui posent de nouvelles questions légales et éthiques :
- Toutes les données publiques sont-elles collectables ou seulement les “open data” ?
- Existe-t-il des limites légales aux possibilités techniques ?
- Comment couvrir les risques légaux dans mon entreprise ?
- Comment mettre en place un outil d’aide à la décision éthique permettant de faciliter la prise de décision lors de l’intégration et de l’utilisation de données publiques web ?
- …
Le premier constat est l’extrême légèreté de l’environnement légal. Cependant, récemment (09/2014) le Conseil d’Etat a publié 50 préconisations qui laissent présager de l’évolution de la législation en France.
Les 50 propositions du Conseil d’Etat
Parmi ses 50 propositions concernant le droit numérique et les droits fondamentaux, le Conseil d’Etat propose quelques pistes légales concernant :
- l’usage fait des données,
- le principe de liberté d’entreprendre,
- le principe de neutralité du net,
- la catégorisation des acteurs du Big Data,
- la procédure amiable en cas de conflit.
Ces propositions n’ont pas valeur de loi, mais laissent supposer l’orientation de la future législation.
Cette ébauche, même prometteuse, ne permet pas par contre de répondre systématiquement à la question : “Qu’ai-je le droit de faire ?”
Un modèle éthique s’impose alors, comme aide à la prise de décision et à la construction du cadre d’intervention du projet Big data.
Il s’intègre dans le cadre légal, et fait appel à la responsabilité morale du décideur.
Notre modèle éthique
Si les préconisations du CE nous permettent de voir se dessiner les tendances de l’avenir légal de la collecte et de l’utilisation des données publiques, cela n’est cependant pas suffisant pour pouvoir agir dès maintenant en entreprise.
Afin de permettre l’action et l’amorce de projets Big Data nécessitant de la collecte massive de données web publiques, nous proposons un outil d’aide à la décision éthique qui est tout à fait applicable et conforme aux nouvelles directions proposées par le CE.
Si nous partons, pour notre réflexion, des possibilités techniques de collecte de données offertes par la Technologie GrayMatter, nous nous trouvons confrontés à la possibilité de collecter des données privées, publiques, personnelles, professionnelles et patrimoniales.
Comment définir et distinguer précisément ces typologies de données ?
C’est justement sur ces distinctions que nous basons notre modèle de décision éthique. Ce modèle nous donne notre cadre d’intervention. Chaque cas est effectivement à étudier individuellement. Pour chacun de nos projets, notre comité d’éthique valide ou invalide les sources de données crawlées et les types de données collectées.
– matrice et modèle de décision éthique complet sur demande –
Conclusions
Approche légaliste
Une approche possible est de consiédérer que le cadre légal n’est pas suffisamment défini pour agir. La posture est donc d’attendre la loi. Nous pouvons résumer cette approche par cette phrase : “Ce qui n’est pas légal est potentiellement illégal.” Dans ce cas, les proposition du CE ne sont pas prises en compte car non légiférées.
Résultat : “En attendant, je ne fais rien.”
Approche éthique
L’approche éthique respecte le cadre légal, mais elle peut permettre d’agir si celui-ci n’est pas défini. Le risque légal est couvert par la “responsabilité morale”.
Dans ce cas aussi, c’est la responsabilité morale qui guide mon action au sein du cadre purement légal, mais encore incomplet.
Résultat : “Je peux agir, en mon âme et conscience.”
Approche mixte
Si le cadre légal n’est pas défini et les cas de jurisprudence inexistants, le rapport du CE est exploitable en tant que tendance de la législation. Je peux alors agir, si l’action que je produits est conforme à la direction proposée par le CE et respecte mon engagement moral. Cette approche prend en compte les propositions du CE, et couvre le risque généré par l’incertitude légale, par la responsabilité morale.
Résultat : “J’agis en maîtrisant les risques.”
Référence :
- Rapport du Conseil d’état : “50 propositions du Conseil d’État pour mettre le numérique au service des droits individuels et de l’intérêt général.”
- Cas de jurisprudence : absent