Datamining1
DownloadTélécharger
Actions
Vote :
ScreenshotAperçu
Informations
Catégorie :Category: nCreator TI-Nspire
Auteur Author: gadder
Type : Classeur 3.0.1
Page(s) : 1
Taille Size: 2.55 Ko KB
Mis en ligne Uploaded: 15/12/2024 - 15:04:02
Uploadeur Uploader: gadder (Profil)
Téléchargements Downloads: 3
Visibilité Visibility: Archive publique
Shortlink : http://ti-pla.net/a4406931
Type : Classeur 3.0.1
Page(s) : 1
Taille Size: 2.55 Ko KB
Mis en ligne Uploaded: 15/12/2024 - 15:04:02
Uploadeur Uploader: gadder (Profil)
Téléchargements Downloads: 3
Visibilité Visibility: Archive publique
Shortlink : http://ti-pla.net/a4406931
Description
Fichier Nspire généré sur TI-Planet.org.
Compatible OS 3.0 et ultérieurs.
<<
Outlier Detection Methods Mode demploi pour construire un intervalle basé sur la médiane et le MAD Identifier la médiane : Calculer la médiane des données (median). Calculer le MAD (Median Absolute Deviation) : MAD = médiane des écarts absolus entre chaque observation et la médiane des données. Ajuster le MAD : Multiplier le MAD par 1.48 pour le rendre comparable à lécart type dans une distribution normale. Choisir un multiplicateur k : Utiliser k = 1.96 pour un intervalle de confiance à 95 %. Calculer les bornes de lintervalle : Borne inférieure : median - k × 1.48 × MAD Borne supérieure : median + k × 1.48 × MAD Identifier les valeurs aberrantes : Toute observation située en dehors de cet intervalle est considérée comme une valeur aberrante. Distance Euclidienne Standardisée Étapes : Calculer la distance : racine carree de la somme des carres des differences standardisees : d = racine carree de somme((xi - moyenne)^2 / variance). Définir le seuil : Si les donnees suivent une distribution normale, utiliser un seuil base sur une loi normale standard. Exemple : pour un seuil a 95 pour cent, considerer 1.96 comme limite. Comparer : Toute observation avec une distance au-dela du seuil est consideree comme atypique. Distance de Mahalanobis Étapes : Calculer la distance : racine carree de ((x - moyenne) transpose * covariance inverse * (x - moyenne)). Choisir la distribution : La distance au carre suit une distribution chi-carree. Le degre de liberte correspond au nombre de dimensions K dans les donnees. Définir le seuil : Exemple : pour un seuil a 95 pour cent, utiliser la valeur critique de la loi chi-carree avec K degres de liberte. Trouver cette valeur dans une table ou une fonction statistique. Comparer : Toute observation avec une distance quadratique au-dela du seuil est consideree comme atypique. Euclidienne : Affectée par l'échelle des variables. Euclidienne Standardisée : Insensible aux changements d'échelle. Mahalanobis : Insensible aux changements linéaires d'échelle. Relation entre distance Euclid et mahalanobis Mention explicite des "composantes principales" : L'énoncé parle de "principal components", un terme spécifique à la PCA. Présence des valeurs propres : Les valeurs propres (2.5 et 0.5) sont fournies, confirmant que les composantes résultent d'une décomposition PCA. Propriété d'orthogonalité : Par construction, les composantes principales obtenues via une PCA sont orthogonales (non corrélées) et standardisées, sauf mention contraire. Conclusion : Puisque PC1 et PC2 sont orthogonales et standardisées, la distance de Mahalanobis et la distance Euclidienne (ou Euclidienne standardisée) sont équivalentes dans ce contexte. Made with nCreator - tiplanet.org
>>
Compatible OS 3.0 et ultérieurs.
<<
Outlier Detection Methods Mode demploi pour construire un intervalle basé sur la médiane et le MAD Identifier la médiane : Calculer la médiane des données (median). Calculer le MAD (Median Absolute Deviation) : MAD = médiane des écarts absolus entre chaque observation et la médiane des données. Ajuster le MAD : Multiplier le MAD par 1.48 pour le rendre comparable à lécart type dans une distribution normale. Choisir un multiplicateur k : Utiliser k = 1.96 pour un intervalle de confiance à 95 %. Calculer les bornes de lintervalle : Borne inférieure : median - k × 1.48 × MAD Borne supérieure : median + k × 1.48 × MAD Identifier les valeurs aberrantes : Toute observation située en dehors de cet intervalle est considérée comme une valeur aberrante. Distance Euclidienne Standardisée Étapes : Calculer la distance : racine carree de la somme des carres des differences standardisees : d = racine carree de somme((xi - moyenne)^2 / variance). Définir le seuil : Si les donnees suivent une distribution normale, utiliser un seuil base sur une loi normale standard. Exemple : pour un seuil a 95 pour cent, considerer 1.96 comme limite. Comparer : Toute observation avec une distance au-dela du seuil est consideree comme atypique. Distance de Mahalanobis Étapes : Calculer la distance : racine carree de ((x - moyenne) transpose * covariance inverse * (x - moyenne)). Choisir la distribution : La distance au carre suit une distribution chi-carree. Le degre de liberte correspond au nombre de dimensions K dans les donnees. Définir le seuil : Exemple : pour un seuil a 95 pour cent, utiliser la valeur critique de la loi chi-carree avec K degres de liberte. Trouver cette valeur dans une table ou une fonction statistique. Comparer : Toute observation avec une distance quadratique au-dela du seuil est consideree comme atypique. Euclidienne : Affectée par l'échelle des variables. Euclidienne Standardisée : Insensible aux changements d'échelle. Mahalanobis : Insensible aux changements linéaires d'échelle. Relation entre distance Euclid et mahalanobis Mention explicite des "composantes principales" : L'énoncé parle de "principal components", un terme spécifique à la PCA. Présence des valeurs propres : Les valeurs propres (2.5 et 0.5) sont fournies, confirmant que les composantes résultent d'une décomposition PCA. Propriété d'orthogonalité : Par construction, les composantes principales obtenues via une PCA sont orthogonales (non corrélées) et standardisées, sauf mention contraire. Conclusion : Puisque PC1 et PC2 sont orthogonales et standardisées, la distance de Mahalanobis et la distance Euclidienne (ou Euclidienne standardisée) sont équivalentes dans ce contexte. Made with nCreator - tiplanet.org
>>