Un site (promotionnel?) qui s’appuie sur Watson d’IBM

Dale Lane est développeur sur la plateforme Cloud Watson d’IBM.

Watson est une des solutions commercialisées par IBM qui permet d’intégrer et d’indexer des données non structurées et par la suite d’effectuer des recherches en langage naturel (ou pas) sur les données non structurées

Une petite vidéo de présentation de Watson sur le Youtube  d’IBM :

Dale Lane est aussi pédagogue et partage, on suppose avec la bénédiction ou le sponsoring de sa maison mère, ses connaissances à travers une plateforme ouverte de test de Watson (via son API) : https://machinelearningforkids.co.uk

Pour les néophytes, introductions au machine learning

Sur on blog Dale Lane présente simplement le machine learning comme étant un apprentissage a réalisé une tache et l’oppose à la programmation qui est une liste d’ordre pour réaliser une tache…

Mais ce n’est pas si simple, car,après tout, donner une recette (une liste de taches à réaliser) à un ordinateur, n’est-ce pas aussi lui apprendre à faire quelque chose ?

Mais que met-on sous le terme d’apprentissage ? Ou plutôt de « Machine Learning »?

Lorsque je donne à une machine une recette (une liste de taches à réaliser) celle-ci est appliquée aux pieds de la lettre et n’a aucune possibilité de prendre en compte ce qui peut varier autrement qu’en écrivant tous les cas possibles

Ainsi, si je veux apprendre un ordinateur à reconnaître le visage de Pascal Vila classiquement  je lui programmerait des instructions du type :

Mais si je me rase, ou retire mes lunettes ou les changes pour des carrées, ou ai beaucoup plus de cheveux blancs, cette recette de vérification ne fonctionne plus.

L’apprentissage de l’ordinateur ou le machine learning tant à résoudre ce problème soit grâce à des statistiques de variantes connues, soit grâce à un réseau de neurones (Cela me rappelle ma maîtrise universitaire,  il y a 18 ans…)

Comment fait on pour apprendre cela à un ordinateur?

L’IA aujourd’hui s’appuie sur deux possibilités :

Dans ces méthodes holistiques d’apprentissage le jeu de données d’apprentissage et le choix du modèle utilisé sont essentiels à l’apprentissage de la machine.

Testons Les exemples

J’ai testé le chat bot et sa chouette : worksheet-chatbots (en python : worksheet-chatbots-python) Et pour le prof (teachersnotes-chatbots)

C’est simpliste mais cela montre bien l’importance du choix des exemples d’apprentissage (featuring). Car n’oublions pas qu’un réseau ne fait que ce qu’on lui a appris. Si le jeu de données d’exemple est parcellaire ou mal fait, le réseau produira des réponses fausses ou incohérentes.

C’est d’ailleurs ce que propose d’étudier cet autre exemple : worksheet-confused (prof : teachersnotes-confused )

Une nouvelle profession naîtra certainement bientôt : celle des « featurer » dont le rôle sera d’identifier les jeux d’exemples d’apprentissage.

Pour aller plus loin

Cet article et le site de Dale Lane est simpliste mais il a le mérite de désacraliser ce qui aujourd’hui est réservé au « Data Scientist » ou autres chercheurs…

Pour aller plus loin et avoir un panorama plus large (et moins centré sur IBM) a lecture de cet ouvrage et de ces exemples en langage R (un héritier du langage S (1980) qui avec le python est l’autre langage de programmation de l’IA actuel) dirigé par François Husson : R pour la statistique et la science des données et plus particulièrement son chapitre 10 sur le machine learning :

En plus tous les codes et jeu de données sont disponibles et le tout pour un  prix modique (25€) aux éditions pur

Partager :

WordPress:

J’aime chargement…

Nouvel utilisateur ?
*Champ requis

Connexion pour les utilisateurs enregistrés
   

%d blogueurs aiment cette page :