
Statistiques et analyse de données (data mining) avec r
Gérald Quatrehomme, Philippe Du Jardin
Résumé
Découvrir les bases de l'analyse de données et le data mining avec le logiciel R
Cet ouvrage vise à débuter l'apprentissage de l'analyse de données et du data mining avec le logiciel R : le lecteur y découvrira les différentes techniques permettant d'explorer et d'analyser des données, décrivant des problématiques liées à des champs disciplinaires très variés : médecine, biologie, anthropologie, et les sciences en général, économie, finance, marketing, psychologie, sociologie, démographie et bien d'autres domaines... Ce manuel propose une double approche de l'analyse de données : il s'appuie à la fois sur de nombreux exemples pratiques, facilement reproductibles, et sur des explications relatives aux conditions d'emploi des méthodes et des tests statistiques utilisés avec ces mêmes exemples. L'ouvrage indique en filigrane la démarche à suivre lors de la réalisation de toute étude statistique requérant une analyse de données et ne nécessite aucune connaissance particulière a priori.
Sommaire
Le CHAPITRE 1 définit en introduction la notion de variables qualitatives et quantitatives, ainsi que les data frames.
Le CHAPITRE 2 s’intéresse aux comparaisons des proportions et des moyennes, avec un regard sur les petits échantillons et les échantillons appariés, si fréquents en pratique.
Le CHAPITRE 3 est consacré aux répétitions. La répétition des mesures nous amène à un chapitre fondamental, celui des essais inter-observateurs et intra-observateurs (Kappa, Anova pour mesures répétées, ICC).
Le CHAPITRE 4 traite de la corrélation (matrice de corrélation, coeffi cients de corrélation, corrélation et causalité).
Le CHAPITRE 5 étudie les régressions : la régression linéaire, la régression polynomiale et ses degrés.
Le CHAPITRE 6 aborde de nombreuses méthodes de classifi cation : régression logistique, régressions régularisées, analyse discriminante, arbres décisionnels, machines à vecteurs supports, classifieur naïf de Bayes, méthode des K-means, K-medoid, méthode des plus proches voisins, méthodes hiérarchiques, bagging, boosting, random forest.
Caractéristiques techniques
PAPIER | |
Éditeur(s) | Technip |
Auteur(s) | Gérald Quatrehomme, Philippe Du Jardin |
Parution | 06/03/2025 |
Nb. de pages | 616 |
Format | 17.4 x 23.9 |
Poids | 1034g |
EAN13 | 9782710812005 |
Avantages Eyrolles.com
Nos clients ont également acheté
Consultez aussi
- Les meilleures ventes en Graphisme & Photo
- Les meilleures ventes en Informatique
- Les meilleures ventes en Construction
- Les meilleures ventes en Entreprise & Droit
- Les meilleures ventes en Sciences
- Les meilleures ventes en Littérature
- Les meilleures ventes en Arts & Loisirs
- Les meilleures ventes en Vie pratique
- Les meilleures ventes en Voyage et Tourisme
- Les meilleures ventes en BD et Jeunesse