ATELIER « BIGDATA ET MACHINE LEARNING : LES BONNES PRATIQUES POUR L'ANALYSE DE DONNÉES »
jeudi 23 juin 2016
Afin de comprendre les apports du Machine Learning et savoir faire le choix des outils dans le cadre d'un projet BigData, Pythagore F.D. organise un atelier « BigData et Machine Learning » le 23 juin 2016.
PARIS - ile de france
Afin de comprendre les apports du Machine Learning et savoir faire le choix des outils dans le cadre d'un projet BigData, Pythagore F.D. organise un atelier « BigData et Machine Learning » le 23 juin 2016.
Cette formation vous apprendra à construire une approche Machine Learning, et faire le choix des outils, solutions et élaborer les critères de constitution des équipes dans un objectif de valorisation des données.
Les concepts abordés sont illustrés par de nombreux cas d'usage.
Cet atelier permet de mettre en œuvre de manière pratique l'ensemble des notions abordées sur des jeux de données fournis en exemple. Les participants qui le souhaitent, peuvent également, apporter leurs propres données.
Le programme de la formation est le suivant :
Introduction Machine Learning
Définitions
Objectifs : valorisation de données par l'automatisation de l'apprentissage
De la donnée à la valeur
Les données
Analyses à base de modèles verticaux. Le BigData.
Notion de préparation, nettoyage des données. Structure, volumes.
Définitions : CAP, ETL, temps réel, réplication, répartition,
Transformation de la donnée
Algorithme MapReduce. Présentation sur cas concrets.
Adaptation des algorithmes aux caractéristiques du calcul distribué.
Besoin de stockage de clé/valeurs.
Présentation des solutions : cassandra, hbase pour le stockage, spark pour le calcul
Exemples pratiques avec Mahout
Présentation des fonctionnalités de Mahout :
Environnement de calcul distribué
Optimisation d'alorithmes de calcul.
Présentation des algorithmes en environnement Scala / Spark
Mise en oeuvre et démonstration sur des exemples caractéristiques de classification/segmentation de données.
Les méthodes statistiques
Notions d'apprentissage supervisé, non supervisé.
Quelques outils/méthodes standards : classification, arbres
Exemples d'utilisation.
Les problèmes et limites.
L'intervention humaine dans les choix de modèles, la préparation des données
Exemples pratiques de scoring par apprentissage machine
Présentation de la plate-forme de calcul.
Principes de construction.
Téléchargement de données d'apprentissage et/ou de test.
Préparation des données.
Construction des scores.
Création de campagnes de modèles.
Exploration des résultats de campagne..
Conclusions
Retours d'expériences
Echanges sur les difficultés rencontrées et bonnes pratiques
Définition de la notion de performance, évaluation.
__________________________________________________
Pythagore F.D., est un centre de compétences dans les domaines
Unix/Linux, TCP/IP (Architecture, Sécurité, Administration de réseaux IP, VoIP, ...) et les applicatifs Apache, Openldap, Squid, Nagios, OCS/GLPI,.
la virtualisation avec xen, kvm, lxc, et le cloud : cloudstack et openstack
le BigData et les technologies NoSQL, avec des produits comme Cassandra, DynamoDB, Riak, HBase, MongoDB et l'ensemble des outils Hadoop
et du côté développement : Java, Scala, développement avec MapReduce, serveurs d'applications JEE, langage C, WebServices, PHP, Perl, Python , ... Les formations sont proposées en inter-entreprises, mais également en intra sur site ou dans nos locaux.
Et nous proposons également une solution de formation à distance innovante : les classes virtuelles.
A la différence des outils d'auto-formation en e-learning, les classes virtuelles permettent l'interactivité entre les participants et le formateur, et la réalisation de travaux pratiques sur une plate-forme accessible à distance.
http://www.pythagore-fd.fr
Le prix de cet atelier est de 640 € ht. Pour vous inscrire ou pour réserver une place, ou pour toute information sur cet atelier, contactez-nous au 01 55 33 52 10, ou par mail pfd@pythagore-fd.fr
site de l'événement
© 2024 Dataevent