Définitions

Pour clarifier ce dont on parle, les termes les plus fréquemment utilisés sont définis ci-dessous.

La protection des données est souvent comprise comme le droit de chaque individu à décider lui-même lesquelles de ses données peuvent être accessibles quand et à qui. L'essence d'un tel droit à la protection des données est que l'inégalité de pouvoir entre les organisations et les individus peut être soumise à des conditions. La protection des données vise à lutter contre la tendance de la société numérique et connectée à créer des individus transparents, à éviter la prolifération des mesures de surveillance étatiques (État de surveillance) et à prévenir l'émergence de monopoles de données d'entreprises privées.

La loi suisse sur la protection des données est en vigueur depuis 1992. Elle est actuellement en cours de révision, probablement jusqu’en 2022. Elle a pour but de protéger la personnalité et les droits fondamentaux des personnes au sujet desquelles des données sont traitées.

Le nouveau Règlement européen sur la protection des données (RGPD) est en vigueur depuis 25 mai 2018. Bien que le règlement ait été introduit dans l’Union européenne, il s’applique aussi bien aux entreprises suisses qui possèdent une filiale dans l’UE qu’aux entreprises ayant leur siège en Suisse, mais qui exercent leur activité sur le territoire de l’UE. Le nouveau règlement établit des règles uniformes concernant le traitement des données personnelles par des entreprises privées ou des organismes publics. Par données personnelles, on entend toute information relative à une personne faisant l'objet d'une surveillance complète ou indirectement identifiée. Il peut s’agir d’un prénom, d’une photo, d’une adresse e-mail, d’une adresse IP ou de contenus issus des réseaux sociaux.

La nouvelle protection des données de l’UE vise à renforcer les droits des citoyens et citoyennes de l’UE concernant leurs données personnelles. De plus, le RGPD renforce aussi la responsabilité des entreprises dans le traitement des données à caractère personnel.

Cela concerne par exemple les entreprises qui exploitent un site web lié à Google Analytics, auquel les utilisateurs de la zone UE ont également accès. Afin de respecter le RGPD, les exploitants du site Web doivent désormais informer les lectrices et lecteurs dans la déclaration de protection des données que des données personnelles sont collectées et traitées. L'utilisateur doit donner son consentement exprès au traitement des données à caractère personnel, mais il doit aussi avoir la possibilité de le refuser.

Le terme Big data désigne initialement des volumes de données qui sont, par exemple, trop importants, trop complexes, trop rapides ou trop peu structurés pour être évalués à l'aide de méthodes manuelles et conventionnelles de traitement des données.

Ce terme est souvent utilisé comme un terme générique pour désigner les technologies numériques qui sont à l'origine d'une nouvelle ère de traitement des données et du bouleversement social qui l'accompagne. En tant que mot-clé, ce terme évolue continuellement; il sert donc souvent aussi à décrire l'ensemble des technologies utilisées pour collecter et analyser ces volumes de données.

Le commerce des données est en plein essor. Selon Statista, les solutions big data ont généré des revenus d'environ 33,5 milliards de dollars en 2017. Et cette tendance est fortement en hausse.

Il n’existe pas (encore) de définition unanimement admise pour la notion de «Data Science». La science des données traite de la manière dont de très grandes quantités de données sont collectées, traitées, éditées et analysées. La science des données peut être divisée en quatre domaines fondamentaux:

 

  1. Data engineering
    L'ingénierie des données désigne l'ensemble des méthodes et processus nécessaires au stockage, à l'accès et à la traçabilité des données. Dans le domaine de l'ingénierie des données, il existe généralement de très grands volumes de données pour lesquels les aspects susmentionnés (stockage, accès, traçabilité) doivent être garantis. L'ingénierie des données peut être mise en œuvre dans la pratique à l'aide de divers outils, par exemple les données liées (ouvertes), l'extraction d'informations ou les «marchés de données».
     
  2. Data analytics et Smart data
    La préparation et le traitement de grands ensembles de données à l'aide d'algorithmes appropriés sont la condition préalable à une analyse rapide et puissante. L’analyse des données fournit des informations précieuses à partir de grandes quantités de données – par exemple sous forme de données intelligentes. Les données intelligentes résultant de l'analyse des données sont des ensembles de données extraites dans le contexte d'une question spécifique. En substance, les données intelligentes consistent à filtrer les données «significatives» d'une base de données vaste et peu claire. Il s’agit d’une procédure automatisée d’extraction des informations, à partir de données non formatées, non numériques, non préparées pour l'analyse et disponibles en très grandes quantités, par exemple des rapports d'entreprise et des sources textuelles sur Internet.
     
  3. Data prediction
    La prédiction de données consiste à prédire des sujets et des situations sur la base de connaissances empiriques. Les réseaux neuronaux artificiels ou d'autres modèles mathématiques de prédiction créent une prévision pour l'avenir sur la base de tous les cas observables précédemment.
     
  4. Apprentissage automatique / algorithmes
    L’apprentissage automatique est un domaine transversal aux trois autres domaines. L'apprentissage automatique désigne le développement d'algorithmes qui apprennent à partir de données (connaissances empiriques) et, ce faisant, reconnaissent des schémas, génèrent des modèles et peuvent prédire des sujets et des situations. Dans l'extraction de flux de données (Data Stream Mining), un flux continu de données est traité et interprété en continu. Un important sous-domaine de l'apprentissage automatique est l'apprentissage profond (Deep Learning), qui repose sur des réseaux neuronaux comportant de nombreuses couches chargées d'extraire des caractéristiques à différents niveaux d'abstraction.

    Dans l'apprentissage automatique, l'apprentissage traditionnel basé sur des hypothèses est remplacé par un «apprentissage guidé par les données». Il s'agit d'un processus exploratoire dans lequel l'apprentissage se fait «directement à partir des données». Sur la base des cas observés, les connaissances empiriques sont continuellement adaptées, complétées et actualisées. Cela inclut, par exemple, les technologies linguistiques multilingues et le web sémantique.


Définitions tirées du rapport:
Bericht: Data Science
Auswahl, Beschreibung, Bewertung und Messung der Schlüsselkompetenzen für das Technologiefeld Data Science
J. Gausemeier, M. Guggemos, A. Kreimeyer 2018 (Hrsg.)

Au lieu d'utiliser le terme «intelligence artificielle», qui recouvre d’infinies attentes, nous considérons que le terme «prise de décision automatisée» (Automated Decision Making, ADM) est plus approprié. En utilisant ce terme, nous voulons mettre l’accent sur la responsabilité, car la responsabilité de l'ADM incombe aussi aux personnes qui sont impliquées dans la commande, le développement et l’autorisation de tels systèmes.

Restez informées

Personnellement, rapidement et directement

Vous voulez savoir pourquoi nous nous engageons. Abonnez-vous à nos newsletters! Si vous avez des demandes personnelles, nos secrétaires régionaux seront heureux d’y répondre.

syndicom près de chez toi

Les secrétariats régionaux te conseillent de manière compétente

S'abonner à la newsletter