Comment
Author: Admin | 2025-04-28
Donnent ainsi une bonne idée de la valeur de cette composante de la qualité du modèle.La robustesse et la précision[b 9],[notes 10] sont deux autres facettes de la qualité du modèle. Pour obtenir un modèle performant, la technique consiste à limiter l'hétérogénéité des données, optimiser l’échantillonnage ou combiner les modèles.La pré-segmentation se propose de classifier la population, puis de construire un modèle sur chacune des classes dans lesquelles les données sont plus homogènes et enfin d'en agréger les résultats.Avec l'agrégation de modèles, l'analyste applique le même modèle à des échantillons légèrement différents issus de l'échantillon initial, pour ensuite associer les résultats. Le bagging et le boosting étaient les deux techniques les plus efficaces et les plus populaires en 1999[63]. En marketing par exemple, l'algorithme Uplift utilise la technique du bagging pour produire un modèle d'identification de groupes de personnes pouvant répondre à une offre commerciale après sollicitation.Enfin, la combinaison de modèles conduit l'analyste à appliquer plusieurs modèles sur une même population et à combiner les résultats. Des techniques telles que l'analyse discriminante et les réseaux de neurones par exemple, se marient aisément.La fouille de données n'existerait pas sans outil. L'offre informatique est présente sous la forme de logiciels[64] et aussi sur quelques plateformes spécialisées[65]. De nombreux logiciels sont présents dans la sphère des logiciels commerciaux, mais il en existe aussi dans celle des logiciels libres. Il n'y a pas de logiciels meilleurs que d'autres, tout dépend de ce qu'on veut en faire[66]. Les logiciels commerciaux sont plutôt destinés aux entreprises, ou aux organismes ayant de gros volumes de données à explorer[b 10], tandis que les logiciels libres sont destinés plus particulièrement aux étudiants, à ceux qui veulent expérimenter des techniques nouvelles, et aux PME[b 10]. En 2009[67], les outils les plus utilisés sont, dans l'ordre, SPSS, RapidMiner (en), SAS, Excel,
Add Comment