Apprentissage artificiel et fouille de données
Revue des Nouvelles Technologies de l'Information - RNTI - A-2
Collectif Cépaduès - Collection RNTI
Résumé
L'apprentissage artificiel est une discipline scientifique qui recouvre différents aspects d'études mathématiques, statistiques et algorithmiques. Ses applications sont très importantes, notamment pour le traitement de données scientifiques, pour l'ingénierie, et pour les systèmes d'information.
L'équipe "Apprentissage Artificiel & Applications" (A3) du Laboratoire d'Informatique de Paris-Nord (LIPN) a organisé en avril 2006 la seconde édition des journées thématiques sur l'apprentissage et la fouille de données, centrée autour de l'utilisation des techniques d'apprentissage artificiel pour l'analyse et l'exploration de données afin d'en comprendre le sens, de déceler des relations entre des événements, d'en déduire des modèles de comportement.
Le présent numéro spécial de la revue RNTI est le prolongement de ces journées, qui ont été l'occasion de faire le point sur l'état de l'art des techniques et des applications utilisant l'apprentissage artificiel dans le domaine de la fouille de données, et d'établir un dialogue entre chercheurs et industriels oeuvrant dans ces domaines.
H. Azzag et al. présentent un aperçu général des techniques de fouille visuelle de données, et montrent l'intérêt de ces approches pour aborder des problèmes complexes, comme l'analyse d'audience de sites web.
F. Fogelman Soulié décrit les approches modernes de CRM et montre l'apport des outils de fouille de données pour aborder les nouvelles problématiques posées, dans un contexte où les volumes d'information à traiter croissent de façon exponentielle. Elle présente la suite d'outils développée par KXEN et montre comment mettre en oeuvre le concept "d'usine à modèles".
Certains problèmes de classement sont "difficiles", au sens où le taux d'erreur théorique minimal est élevé. M. Lebbah et al proposent une méthode basée sur l'enchainement d'un modèle de partionnement par carte topologique et d'une machine à vecteurs de support (SVM). Ils montrent, sur plusieurs exemples difficiles dont un problème médical original, que cette technique permet d'améliorer la visualisation des données et d'obtenir de très bons classements.
S. Aubin et al. présentent l'infrastructure logicielle Ogmios pour l'annotation linguistique de documents issus du Web, développée dans le cadre du projet européen ALVIS. Leur article montre comment peut facilement être adaptée au traitement de documents issus du domaine de la biologie.
A. Borgi présente une méthode d'apprentissage supervisé de règles de classification, qui tire parti de façon originale de méthodes de raisonnement approximatif pour affiner l'apprentissage. La méthode est appliquée à un problème de classification d'images.
Le traitement des séquences biologiques nécessite souvent une phase de prétraitement pour construire des attributs plus significatifs que la chaîne de caractères originale. M. Maddouri et F. Mhamdi proposent une méthode de construction de "descripteurs descriminants" et l'appliquent avec succès à plusieurs problèmes réels.
Lorsqu'on doit traiter des données de grande dimension (textes, bioinformatique, ...),il est souvent nécessaire de réduire le nombre de variables. Y. Bennani et al. présentent un panorama des techniques récentes de réduction de dimension : méthodes de sélection de variables pertinentes (supervisée ou non), et méthodes géométriques de réduction de dimension (constructions de traits).
H. Benhadda et J.F. Marcotorchino décrivent les possibilités offertes par l'Analyse Relationnelle, approche développée à partir des années 80 dans les laboratoires d'IBM. Cette méthode est prometteuse pour la fouille de grandes bases de données, en particulier du fait de sa complexité linéaire.
Les techniques à noyaux, popularisées à la fin des années 90 suite au succès du modèle SVM, sont applicables à une grande variété de problèmes. S. Aseervatham et E. Viennet présentent un état de l'art des différents noyaux utilisables pour le traitement des données textuelles.
Le numéro se termine sur un état de l'art des méthodes statistiques d'apprentissage actif élaboré par A. Bondu et V. Lemaire.
Nous remercions les auteurs et saluons le travail précieux des relecteurs qui ont accepté de consacrer du temps à la relecture de l'ensemble des contributions.
Younès Bennani et Emmanuel Viennet.
L'auteur - Collectif Cépaduès
Autres livres de Collectif Cépaduès
Sommaire
- Un aperçu de la fouille visuelle de données
- CRM Analytique - L'apport du Data Mining
- Partitionnement des données pour les problèmes de classement difficiles : Combinaison des cartes topologiques mixtes et SVM
- Une infrastructure pour l'annotation linguistique de documents issus du web : le projet ALVIS
- Un raisonnement approximatif pour l'apprentissage supervisé de règles
- Construction d'attributs pour l'extraction de connaissances à partir de séquences biologiques
- Réduction des dimensions des données en apprentissage artificiel
- L'analyse relationnelle pour la fouille de grandes bases de données
- Méthodes à noyaux appliquées aux textes structurés
- État de l'art sur les méthodes statistiques d'apprentissage actif
Caractéristiques techniques
PAPIER | |
Éditeur(s) | Cépaduès |
Auteur(s) | Collectif Cépaduès |
Collection | RNTI |
Parution | 29/01/2008 |
Nb. de pages | 218 |
Format | 15,5 x 23,5 |
Couverture | Broché |
Poids | 350g |
Intérieur | Noir et Blanc |
EAN13 | 9782854288087 |
ISBN13 | 978-2-85428-808-7 |
Avantages Eyrolles.com
Nos clients ont également acheté
Consultez aussi
- Les meilleures ventes en Graphisme & Photo
- Les meilleures ventes en Informatique
- Les meilleures ventes en Construction
- Les meilleures ventes en Entreprise & Droit
- Les meilleures ventes en Sciences
- Les meilleures ventes en Littérature
- Les meilleures ventes en Arts & Loisirs
- Les meilleures ventes en Vie pratique
- Les meilleures ventes en Voyage et Tourisme
- Les meilleures ventes en BD et Jeunesse
- Informatique Développement d'applications Algorithmique et informatique appliquée Intelligence artificielle
- Sciences Techniques Robotique
- Sciences Techniques Intelligence artificielle I.A. appliquée
- Sciences Techniques Intelligence artificielle Systèmes experts
- Sciences Techniques Intelligence artificielle Réseaux de neurones
- Sciences Techniques Automatique