Réduction et transformation de données
DownloadTélécharger
Actions
Vote :
ScreenshotAperçu
Informations
Catégorie :Category: nCreator TI-Nspire
Auteur Author: yayah
Type : Classeur 3.0.1
Page(s) : 1
Taille Size: 7.65 Ko KB
Mis en ligne Uploaded: 19/10/2024 - 23:30:09
Uploadeur Uploader: yayah (Profil)
Téléchargements Downloads: 1
Visibilité Visibility: Archive publique
Shortlink : http://ti-pla.net/a4263660
Type : Classeur 3.0.1
Page(s) : 1
Taille Size: 7.65 Ko KB
Mis en ligne Uploaded: 19/10/2024 - 23:30:09
Uploadeur Uploader: yayah (Profil)
Téléchargements Downloads: 1
Visibilité Visibility: Archive publique
Shortlink : http://ti-pla.net/a4263660
Description
Fichier Nspire généré sur TI-Planet.org.
Compatible OS 3.0 et ultérieurs.
<<
Réduction de données " Échantillonnage de données : les données sont échantillonnées pour créer une autre base de données plus petite. " Sélection dattributs : seul un sous-ensemble des attributs est utilisé dans le processus danalyse. " Réduction de dimensions : les corrélations entre les lignes ou les colonnes sont exploitées pour représenter les données dans une dimension plus petite. Vous disposez dun ensemble de données contenant 10 attributs. a) Expliquez le concept de réduction de dimension dans le contexte de lAnalyse de Composantes Principales (ACP). b) Quel est lobjectif de la standardisation des attributs avant dappliquer lACP ? c) Après avoir effectué lACP, vous obtenez les valeurs propres des composantes principales. Comment pouvez-vous interpréter ces valeurs propres ? d) Quelle est la signification du taux de variance expliquée en ACP ? Comment est-il calculé ? e) Supposons que les trois premières composantes principales expliquent 80% de la variance totale dans lensemble de données. Comment interpréteriez-vous ce résultat ? a) La réduction de dimension dans le contexte de lACP se réfère au processus de réduire le nombre de dimensions dans un ensemble de données tout en conservant la majeure partie des informations importantes. LACP parvient à cela en transformant les attributs dorigine en un nouvel ensemble dattributs non corrélées appelées composantes principales. Ces composantes principales sont ordonnées en fonction de la quantité de variance quelles expliquent dans les données. b) La standardisation des attributs avant dappliquer lACP est importante pour sassurer que toutes les attributs sont sur une échelle similaire. Étant donné que lACP est sensible à léchelle des attributs, la standardisation aide à éviter que les attributs avec des échelles plus grandes dominent lanalyse. En soustrayant la moyenne et en mettant à léchelle pour avoir une variance unitaire, chaque attribut contribue de manière égale pendant le processus de lACP. c) Les valeurs propres obtenues à partir de lACP représentent la quantité de variance expliquée par chaque composante principale. Les valeurs propres plus grandes indiquent que la composante principale correspondante capture plus dinformations ou de variation dans lensemble de données. Les valeurs propres sont généralement triées par ordre décroissant, la première valeur propre représentant la composante qui explique le plus de variance, la deuxième valeur propre représentant la deuxième plus grande variance, et ainsi de suite. d) Le taux de variance expliquée en ACP mesure la proportion de variance expliquée par chaque composante principale par rapport à la variance totale dans lensemble de données. Il aide à évaluer limportance de la contribution de chaque composante à la variance globale. Le taux de variance expliquée dune composante principale est calculé en divisant sa valeur propre par la somme de toutes les valeurs propres. e) Si les trois premières composantes principales expliquent 80% de la variance totale dans lensemble de données, cela signifie que ces trois composantes capturent une partie significative de linformation présente dans les données dorigine. Les autres composantes contribuent moins à la variance globale. Ce résultat suggère que lensemble de données peut être efficacement représenté dans un espace de dimensions réduit sans perdre beaucoup dinformations. . Imaginez une entreprise qui souhaite lancer un nouveau produit ou repositionner un produit existant sur le marché. Elle peut utiliser ? ? pour analyser la façon dont les consommateurs perçoivent les différentes marques ou produits en termes de similarités ou de dissimilarités. En collectant des données à travers des enquêtes ou des questionnaires où les consommateurs évaluent ou comparent divers caractéristiques des produits, ? ? peut être utilisée pour créer une carte perceptuelle. Cette carte représente les dimensions ou les facteurs sous-jacents que les consommateurs utilisent pour évaluer et différencier les produits. Chaque produit est ensuite positionné sur la carte en fonction de sa similarité ou de sa dissimilarité perçue par rapport aux autres. Quelle méthode vue en classe mieux corresponde à la méthode ? ? Multidimensional scaling (MDS) Sélection dattributs " La matrice de corrélation permet dévaluer seulement des pairs dattributs. " On pourrait évaluer des triples ou des corrélations pour des sous-ensembles dattributs plus grands. " Cependant, le nombre de sous-ensembles est exponentiel. " Par conséquent, en pratique, la plupart des méthodes de sélection évaluent les attributs indépendamment les uns des autres. Filtrage " Classe chaque attribut en fonction dune mesure univariée. " Sélectionne les attributs avec les mesures les plus élevées. " La mesure doit refléter le pouvoir discriminant de chaque attribut. SHAP " SHAP (SHapley Additive exPlanations) est une méthode basée sur la théorie des jeux. " Les valeurs de Shapley mesurent
[...]
>>
Compatible OS 3.0 et ultérieurs.
<<
Réduction de données " Échantillonnage de données : les données sont échantillonnées pour créer une autre base de données plus petite. " Sélection dattributs : seul un sous-ensemble des attributs est utilisé dans le processus danalyse. " Réduction de dimensions : les corrélations entre les lignes ou les colonnes sont exploitées pour représenter les données dans une dimension plus petite. Vous disposez dun ensemble de données contenant 10 attributs. a) Expliquez le concept de réduction de dimension dans le contexte de lAnalyse de Composantes Principales (ACP). b) Quel est lobjectif de la standardisation des attributs avant dappliquer lACP ? c) Après avoir effectué lACP, vous obtenez les valeurs propres des composantes principales. Comment pouvez-vous interpréter ces valeurs propres ? d) Quelle est la signification du taux de variance expliquée en ACP ? Comment est-il calculé ? e) Supposons que les trois premières composantes principales expliquent 80% de la variance totale dans lensemble de données. Comment interpréteriez-vous ce résultat ? a) La réduction de dimension dans le contexte de lACP se réfère au processus de réduire le nombre de dimensions dans un ensemble de données tout en conservant la majeure partie des informations importantes. LACP parvient à cela en transformant les attributs dorigine en un nouvel ensemble dattributs non corrélées appelées composantes principales. Ces composantes principales sont ordonnées en fonction de la quantité de variance quelles expliquent dans les données. b) La standardisation des attributs avant dappliquer lACP est importante pour sassurer que toutes les attributs sont sur une échelle similaire. Étant donné que lACP est sensible à léchelle des attributs, la standardisation aide à éviter que les attributs avec des échelles plus grandes dominent lanalyse. En soustrayant la moyenne et en mettant à léchelle pour avoir une variance unitaire, chaque attribut contribue de manière égale pendant le processus de lACP. c) Les valeurs propres obtenues à partir de lACP représentent la quantité de variance expliquée par chaque composante principale. Les valeurs propres plus grandes indiquent que la composante principale correspondante capture plus dinformations ou de variation dans lensemble de données. Les valeurs propres sont généralement triées par ordre décroissant, la première valeur propre représentant la composante qui explique le plus de variance, la deuxième valeur propre représentant la deuxième plus grande variance, et ainsi de suite. d) Le taux de variance expliquée en ACP mesure la proportion de variance expliquée par chaque composante principale par rapport à la variance totale dans lensemble de données. Il aide à évaluer limportance de la contribution de chaque composante à la variance globale. Le taux de variance expliquée dune composante principale est calculé en divisant sa valeur propre par la somme de toutes les valeurs propres. e) Si les trois premières composantes principales expliquent 80% de la variance totale dans lensemble de données, cela signifie que ces trois composantes capturent une partie significative de linformation présente dans les données dorigine. Les autres composantes contribuent moins à la variance globale. Ce résultat suggère que lensemble de données peut être efficacement représenté dans un espace de dimensions réduit sans perdre beaucoup dinformations. . Imaginez une entreprise qui souhaite lancer un nouveau produit ou repositionner un produit existant sur le marché. Elle peut utiliser ? ? pour analyser la façon dont les consommateurs perçoivent les différentes marques ou produits en termes de similarités ou de dissimilarités. En collectant des données à travers des enquêtes ou des questionnaires où les consommateurs évaluent ou comparent divers caractéristiques des produits, ? ? peut être utilisée pour créer une carte perceptuelle. Cette carte représente les dimensions ou les facteurs sous-jacents que les consommateurs utilisent pour évaluer et différencier les produits. Chaque produit est ensuite positionné sur la carte en fonction de sa similarité ou de sa dissimilarité perçue par rapport aux autres. Quelle méthode vue en classe mieux corresponde à la méthode ? ? Multidimensional scaling (MDS) Sélection dattributs " La matrice de corrélation permet dévaluer seulement des pairs dattributs. " On pourrait évaluer des triples ou des corrélations pour des sous-ensembles dattributs plus grands. " Cependant, le nombre de sous-ensembles est exponentiel. " Par conséquent, en pratique, la plupart des méthodes de sélection évaluent les attributs indépendamment les uns des autres. Filtrage " Classe chaque attribut en fonction dune mesure univariée. " Sélectionne les attributs avec les mesures les plus élevées. " La mesure doit refléter le pouvoir discriminant de chaque attribut. SHAP " SHAP (SHapley Additive exPlanations) est une méthode basée sur la théorie des jeux. " Les valeurs de Shapley mesurent
[...]
>>