Résultats crpe bordeaux

Comment

Author: Admin | 2025-04-27

Méthodes de ré-échantillonnage telles que le bootstrap, du jackknife ou de la validation croisée[37].Parfois, une seule technique (arbre de décision, réseaux neuronaux…) n'est pas suffisante pour obtenir un modèle qui donne de bons résultats sur toutes les données[b 2]. Une des solutions, dans ce cas, serait constituée d'un ensemble d'outils, qu'on peut utiliser les uns après les autres et comparer les résultats sur les mêmes données ou bien unifier les forces de chaque méthode soit par l'apprentissage soit par combinaison des résultats[38].Il faut placer les données et les résultats de la fouille en perspective dans leur contexte[b 2], et ne pas se focaliser sur les données, sans cela des erreurs d'interprétation peuvent survenir ainsi que des pertes de temps et d'argent.Éliminer à priori les résultats qui paraissent absurdes[39], en comparaison avec ce qui est attendu, peut être source d'erreurs car ce sont peut-être ces résultats qui donnent la solution à la question posée.Il est impossible d'utiliser et d’interpréter les résultats d'un modèle en dehors du cadre dans lequel il a été construit[b 2]. Interpréter des résultats en fonction d'autres cas similaires mais différents est aussi cause d'erreurs, mais ce n'est pas propre aux raisonnements liés à l'exploration de données. Enfin, extrapoler des résultats, obtenus sur des espaces de faibles dimensions, sur des espaces de dimensions élevées peut aussi conduire à des erreurs.Deux citations de George Box, « Tous les modèles sont faux, mais certains sont utiles » et « Les statisticiens sont comme les artistes, ils tombent amoureux de leurs modèles », illustrent avec humour le fait que quelquefois certains analystes en fouille de données ont besoin de croire en leur modèle et de croire que le modèle qu'ils travaillent est le meilleur. Utiliser un ensemble de modèles et interpréter la distribution des résultats est nettement plus sûr[40].Dans un projet

Add Comment