Filtrer
Rayons
Support
Éditeurs
Langues
Prix
Stéphane Tufféry
-
Modélisation prédictive et apprentissage statistique avec R
Stéphane Tufféry
- Technip
- 12 Juin 2024
- 9782710811992
Issu de formations devant des publics variés, cet ouvrage présente les principales méthodes de
modélisation statistique et de machine learning, à travers le fil conducteur d'une étude de cas.
Chaque méthode fait l'objet d'un rappel de cours et est accompagnée de références bibliographiques,
puis est mise en oeuvre avec des explications détaillées sur les calculs effectués, les interprétations
des résultats et jusqu'aux astuces de programmation permettant d'optimiser les temps de calcul. À
ce sujet, une annexe est consacrée au traitement des données massives.
La mise en oeuvre s'appuie sur le logiciel libre R, qui est devenu la lingua franca de la statistique
et de la data science. C'est le logiciel le plus répandu dans le monde universitaire, mais il a aussi
conquis le monde de l'entreprise, à tel point que tous les logiciels commerciaux proposent désormais
une interface avec R. -
Big data, machine learning et apprentissage profond
Stéphane Tufféry
- Technip
- Statistiques
- 15 Avril 2019
- 9782710811886
Cet ouvrage montre comment appliquer les méthodes de machine learning aux Big Data, et comment appliquer les méthodes plus spécifiques de deep learning aux problèmes plus complexes relevant de l'intelligence artificielle, tels que la reconnaissance d'image et le traitement du langage naturel.
Ces méthodes sont ensuite mises en oeuvre avec trois des principales bibliothèques d'apprentissage profond : MXNet, PyTorch et Keras-TensorFlow.
-
Data mining et statistique décisionnelle : la science des données
Stéphane Tufféry
- Technip
- Statistiques
- 14 Octobre 2017
- 9782710811800
Le data mining et la data science sont de plus en plus répandus dans les entreprises et les organisations soucieuses d'extraire l'information pertinente de leurs bases de données, qu'elles peuvent utiliser pour expliquer et prévoir les phénomènes qui les concernent (risques, production, consommation, fidélisation...).
Cette cinquième édition, actualisée et augmentée de 90 pages, fait le point sur le data mining, ses méthodes, ses outils et ses applications, qui vont du scoring jusqu'au text mining, objet d'un chapitre complètement remanié. Nombre de ses outils appartiennent à l'analyse des données et à la statistique « classiques » (analyse factorielle, classification automatique, analyse discriminante, régression logistique, modèles linéaires généralisés, régression pénalisée, régression clusterwise...) mais certains sont plus spécifiques au data mining, comme les réseaux de neurones, les algorithmes génétiques, les SVM, les arbres de décision, les forêts aléatoires, le boosting et la détection des règles d'associations. Les avancées les plus récentes du machine learning et les applications les plus actuelles des Big Data sont présentées, qui vont des algorithmes de reconnaissance d'image aux méthodes de plongement de mots en text mining. Les chapitres sur les réseaux de neurones et les SVM sont illustrés par la reconnaissance de l'écriture manuscrite.
Ces outils sont disponibles dans des logiciels de plus en plus puissants et complets, à commencer par le logiciel libre R, que nous comparons en détail aux logiciels SAS et IBM SPSS dans un chapitre spécifique. Ces logiciels sont utilisés pour illustrer par des exemples précis les explications théoriques données.
Les aspects méthodologiques vont de la conduite des projets jusqu'aux facteurs de réussite et aux pièges à éviter, en passant par l'évaluation et la comparaison des modèles, leur intégration dans les processus opérationnels. Un chapitre est consacré à une étude de cas complète de credit scoring, de l'exploration des données jusqu'à l'élaboration de la grille de score.
-
Étude de cas en statistique décisionnelle
Stéphane Tufféry
- Technip
- Statistiques
- 4 Décembre 2019
- 9782710811879
Comprendre les principes théoriques de la statistique est une chose ; savoir les mettre en pratique en est une autre, et le fossé peut être large entre les deux.
C'est pour aider le lecteur à le franchir que l'auteur a écrit un ouvrage de "travaux pratiques" de la statistique décisionnelle, qui fait suite à son ouvrage de cours, Data Mining et statistique décisionnelle, paru dans la même collection.