Knowledge Graphes, la Révolution qui secoue l’IA – Un Challenge à Relever

Les Knowledge Graphes sont un outil puissant… mais encore faut-il savoir les maîtriser. Quels challenges cette technologie fait émerger ?

Dans notre article précédent, on présentait les Knowledge Graphes. Une technologie capable de tracer un réseau de connaissance mondiale entre les personnes.

C’est un article qui introduit les notions de bases pour les Knowledge Graphes. On vous invite chaleureusement à le lire avant de continuer.

Dans cette deuxième partie, on aimerait vous partager les challenges techniques qu’il faudra relever pour maîtriser pleinement les Knowledge Graphes.

Knowledge Fusion – Faire la synthèse des connaissances

Le premier challenge est de répondre à une question simple.

Comment créer un Knowledge Graphe Mondiale sans avoir avoir de redondance, sans avoir de doublons ?

Je m’explique. Quand vous sonder le web à la recherche d’une personne, disons Jean Dupont, cette personne a sûrement plusieurs réseaux sociaux : Instagram, Linkedin, Facebook, etc.

Comment déterminer que ces comptes appartiennent à la même personne ?

D’autant plus qu’il y a sûrement plusieurs Jean Dupont sur Terre.

Alors comment faire comprendre à un algorithme que les deux compte Jean Dupont sur Facebook sont des personnes différentes mais que ces deux autres comptes sur Instagram appartiennent au même Jean Dupont ?

Plus généralement comment capter l’ensemble des informations sur le Web pour construire une Base de Données sans erreur ?

Ce défi s’appelle la Knowledge Fusion. La fusion des connaissances.

L’idée est de rassembler toute la connaissance d’internet en évitant les redondances mais aussi en évitant de perdre de l’information !

Étant donné que nous sommes seulement au balbutiement de cette technologie peu de solution existe.

Une seule est évoqué pendant l’interview de Mike Tung, les Record Linkage Model, en français « Modèle d’exploration des connexions entre données ».

Vous me l’accorderez, l’expression est plus sympa dans la langue de Shakespeare ! 💥

Photo from ITPro

SSDS & GPU – Le stockage et la Puissance de Calcul

Ici on aborde un problème plus connu… mais amplifié colossalement par la nature même des Knowledge Graphes.

Le problème du stockage des Données.

Effectivement ce problème existe dans la plupart des entreprises… alors imaginez pour une société qui souhaite stocker l’entièreté du Web !

À cela, il faut ajouter la Puissance de Calcul nécessaire pour réaliser ces opérations.

Cette question est omniprésente dans notre monde actuel.

D’ailleurs, pas seulement dans le milieu de l’entreprise.

Ainsi, les cartes Graphiques et SSDS s’arrachent à prix d’or aujourd’hui, car les matériaux nécessaires pour en produire ne sont pas illimités.

Alors entre les mineurs de crypto-monnaies, les joueurs de Cyberpunk 2077 et les entrepreneurs qui souhaite sonder le Web, lesquels gagneront la bataille pour la Puissance de Calcul ? 🥇

Graph Embedding – Explorer efficacement les Knowledge Graphes

À vrai dire, le problème précédent n’est pas une question d’avancée technologique mais plus un problème de coût.

Il ne nécessite pas une innovation technologique mais uniquement un investissement économique.

Non, le vrai challenge c’est qu’une fois avoir stocké le Web, il faut pouvoir l’explorer rapidement.

Au fait, si ton objectif est d'apprendre le Deep Learning - j’ai préparé pour toi le Plan d’action pour Maîtriser les Réseaux de neurones.

7 jours de conseils gratuits d’un ingénieur spécialisé en Intelligence Artificielle pour apprendre à maîtriser les réseaux de neurones à partir de zéro :

  • Planifie ton apprentissage
  • Structure tes projets
  • Développe tes algorithmes d’Intelligence Artificielle

J’ai basé ce programme sur des faits scientifiques, des approches éprouvées par des chercheurs mais également mes propres techniques que j'ai conçues au fil de mes expériences dans le domaine du Deep Learning.

Pour y accéder, clique ici :

RECEVOIR MON PLAN D'ACTION

RECEVOIR MON PLAN D'ACTION

À présent, on peut revenir à ce que je mentionnais précédemment.

Effectivement, le but principal d’un Knowledge Graphe est de délivrer une information claire et précise à son utilisateur.

Mais cette réponse aura beau répondre parfaitement au besoin de l’utilisateur, si elle met 10 ans à être trouvé, elle perd de son utilité.

Alors, il faut trouver un moyen rapide d’explorer le Knowledge Graphe.

Dit autrement, il faut trouver un moyen de structurer efficacement les informations stocké dans le Graphe.

Ce problème existe déjà en Deep Learning.

Notamment pour analyser du texte, on utilise une couche d’Embedding. Cela permet de transcrire les phrases en liste de chiffres.

Il est ainsi beaucoup plus rapide pour un ordinateur d’effectuer des calculs sur une liste de chiffres que sur une liste de mots.

En quelques sortes, on encode la phrase pour que l’ordinateur puisse mieux la comprendre et l’analyser (plus d’informations sur le Preprocessing de texte vous attend dans cet article 😉).

Un des challenges des Knowledge Graphes est donc de trouver une couche d’Embedding efficace pour retranscrire toutes les informations d’un individu : ses activités, ses relations, les choses qu’il aime, …

La liste est interminable, et c’est bien là le challenge !

Il ne suffit pas d’encoder une phrase de 5 ou 20 mots, mais l’ensemble des informations qu’une personne ou qu’une entité possède sur internet.

Knowledge Graphes
Photo by Amos from Stockphotos.com on Unsplash

Le domaine académique – Théoriser les Knowledge Graphes

On arrive au dernier challenge des Knowledge Graphes et c’est selon moi le défi majeur à relever qui permettra de résoudre les problèmes expliquer plus haut.

Ce challenge, c’est l’absence de Théorie sur le sujet.

En fait, vu que les Knowledge Graphes sont un sujet assez récent, ou en tout cas que la possibilité de les créer est inédite, il n’y a que très peu de recherches sur le sujet.

Et ce n’est pas tout, vu que la construction de Knowledge Graphe basé sur le Web n’est pas à la portée de tous, très peu de chercheurs peuvent réellement l’étudié.

D’une part, on a donc un manque de théorie qui complexifie la création de cette technologie et d’autre part un manque d’accès à l’information qui empêche son étude.

En fait, ce challenge est bien connu dans le monde scientifique : trouver des investisseurs pour faire avancée la recherche.

Diffbot, l’entreprise de Mike Tung annonce partager très prochainement un dataset de référence open source pour construire nos propres graphes de connaissances à partir de textes.

Il souhaite aussi investir dans la recherche et vouloir collaborer avec des universités dans cette optique.

Mais la question est toujours la même pour le Secteur Privé : cela va-t-il rapporté de l’argent dans le futur ? 💰

C’est vrai ça, à quoi ressemblera les Knowledge Graphes dans 5 ans ? Vont-ils être bénéfique à la société ? Comment seront-ils utilisés ? On se retrouve dans la dernière partie de cet article pour le savoir !

sources :

Un dernier mot, si tu veux aller plus loin et apprendre le Deep Learning - j’ai préparé pour toi le Plan d’action pour Maîtriser les Réseaux de neurones.

7 jours de conseils gratuits d’un ingénieur spécialisé en Intelligence Artificielle pour apprendre à maîtriser les réseaux de neurones à partir de zéro :

  • Planifie ton apprentissage
  • Structure tes projets
  • Développe tes algorithmes d’Intelligence Artificielle

J’ai basé ce programme sur des faits scientifiques, des approches éprouvées par des chercheurs mais également mes propres techniques que j'ai conçues au fil de mes expériences dans le domaine du Deep Learning.

Pour y accéder, clique ici :

RECEVOIR MON PLAN D'ACTION

RECEVOIR MON PLAN D'ACTION

Tom Keldenich
Tom Keldenich

Ingénieur spécialisé en Intelligence Artificielle et passionné de données !

Fondateur du site Inside Machine Learning

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

This page will not stay online forever

Enter your email to receive for free

The PANE method for Deep Learning

* indicates required

 

You will receive one email per day for 7 days – then you will receive my newsletter.
Your information will never be given to third parties.

You can unsubscribe in 1 click from any of my emails.



Entre ton email pour recevoir gratuitement
la méthode PARÉ pour faire du Deep Learning


Tu recevras un email par jour pendant 7 jours - puis tu recevras ma newsletter.
Tes informations ne seront jamais cédées à des tiers.

Tu peux te désinscrire en 1 clic depuis n'importe lequel de mes emails.