Exemple sql map reduce
DownloadTélécharger
Actions
Vote :
ScreenshotAperçu
Informations
Catégorie :Category: nCreator TI-Nspire
Auteur Author: yayah
Type : Classeur 3.0.1
Page(s) : 1
Taille Size: 2.64 Ko KB
Mis en ligne Uploaded: 19/12/2024 - 00:26:28
Uploadeur Uploader: yayah (Profil)
Téléchargements Downloads: 4
Visibilité Visibility: Archive publique
Shortlink : http://ti-pla.net/a4421330
Type : Classeur 3.0.1
Page(s) : 1
Taille Size: 2.64 Ko KB
Mis en ligne Uploaded: 19/12/2024 - 00:26:28
Uploadeur Uploader: yayah (Profil)
Téléchargements Downloads: 4
Visibilité Visibility: Archive publique
Shortlink : http://ti-pla.net/a4421330
Description
Fichier Nspire généré sur TI-Planet.org.
Compatible OS 3.0 et ultérieurs.
<<
Voici un résumé des fonctions SQL demandées, avec un exemple pour chacune, suivi d'une explication de l'approche MapReduce . 1. INNER JOIN L' INNER JOIN permet de combiner des lignes de deux tables en fonction d'une condition de correspondance. Seules les lignes qui satisfont la condition sont retournées. Exemple : SELECT employees.name, departments.nameFROM employeesINNER JOIN departmentsON employees.department_id = departments.id; Cela retournera les noms des employés et des départements uniquement pour ceux qui ont un department_id correspondant dans la table departments . 2. INTERSECTION L' INTERSECTION permet de retourner les lignes communes entre deux requêtes SELECT . Cela est équivalent à une combinaison de résultats avec une condition de correspondance stricte. Exemple : SELECT name FROM employeesINTERSECTSELECT name FROM contractors; Cela retournera les noms qui sont présents à la fois dans la table employees et dans la table contractors . 3. UNION L' UNION combine les résultats de deux requêtes SELECT et élimine les doublons. Si vous voulez inclure les doublons, utilisez UNION ALL . Exemple : SELECT name FROM employeesUNIONSELECT name FROM contractors; Cela retournera tous les noms des employés et des contractuels, sans doublons. 4. GROUP BY La clause GROUP BY regroupe les lignes qui ont les mêmes valeurs dans des colonnes spécifiées. Elle est souvent utilisée avec des fonctions d'agrégation (comme SUM , COUNT , AVG , etc.). Exemple : SELECT department_id, COUNT(*)FROM employeesGROUP BY department_id; Cela retournera le nombre d'employés dans chaque département. MapReduce : MapReduce est un modèle de programmation principalement utilisé pour le traitement de grandes quantités de données réparties. Voici un exemple simple de l'implémentation de MapReduce pour une opération de comptage de mots : Étape 1 : Mapper Chaque entrée de données est traitée par une fonction qui découpe les données et les mappe à une clé. Par exemple, pour un texte, le mapper associe chaque mot à la valeur 1. def mapper(text): for word in text.split(): print((word, 1)) Étape 2 : Reducer Le reducer prend les sorties du mapper, les regroupe par clé (dans notre exemple, chaque mot), puis les combine (ici, en additionnant les occurrences des mots). from collections import defaultdictdef reducer(mapped_data): word_count = defaultdict(int) for word, count in mapped_data: word_count[word] += count return word_count Exemple de processus MapReduce : Input : ["hello world", "hello"] Mapper : ("hello", 1), ("world", 1), ("hello", 1) Reducer : {"hello": 2, "world": 1} Cela permet de compter l'occurrence de chaque mot dans un ensemble de données de manière parallèle et distribuée. Made with nCreator - tiplanet.org
>>
Compatible OS 3.0 et ultérieurs.
<<
Voici un résumé des fonctions SQL demandées, avec un exemple pour chacune, suivi d'une explication de l'approche MapReduce . 1. INNER JOIN L' INNER JOIN permet de combiner des lignes de deux tables en fonction d'une condition de correspondance. Seules les lignes qui satisfont la condition sont retournées. Exemple : SELECT employees.name, departments.nameFROM employeesINNER JOIN departmentsON employees.department_id = departments.id; Cela retournera les noms des employés et des départements uniquement pour ceux qui ont un department_id correspondant dans la table departments . 2. INTERSECTION L' INTERSECTION permet de retourner les lignes communes entre deux requêtes SELECT . Cela est équivalent à une combinaison de résultats avec une condition de correspondance stricte. Exemple : SELECT name FROM employeesINTERSECTSELECT name FROM contractors; Cela retournera les noms qui sont présents à la fois dans la table employees et dans la table contractors . 3. UNION L' UNION combine les résultats de deux requêtes SELECT et élimine les doublons. Si vous voulez inclure les doublons, utilisez UNION ALL . Exemple : SELECT name FROM employeesUNIONSELECT name FROM contractors; Cela retournera tous les noms des employés et des contractuels, sans doublons. 4. GROUP BY La clause GROUP BY regroupe les lignes qui ont les mêmes valeurs dans des colonnes spécifiées. Elle est souvent utilisée avec des fonctions d'agrégation (comme SUM , COUNT , AVG , etc.). Exemple : SELECT department_id, COUNT(*)FROM employeesGROUP BY department_id; Cela retournera le nombre d'employés dans chaque département. MapReduce : MapReduce est un modèle de programmation principalement utilisé pour le traitement de grandes quantités de données réparties. Voici un exemple simple de l'implémentation de MapReduce pour une opération de comptage de mots : Étape 1 : Mapper Chaque entrée de données est traitée par une fonction qui découpe les données et les mappe à une clé. Par exemple, pour un texte, le mapper associe chaque mot à la valeur 1. def mapper(text): for word in text.split(): print((word, 1)) Étape 2 : Reducer Le reducer prend les sorties du mapper, les regroupe par clé (dans notre exemple, chaque mot), puis les combine (ici, en additionnant les occurrences des mots). from collections import defaultdictdef reducer(mapped_data): word_count = defaultdict(int) for word, count in mapped_data: word_count[word] += count return word_count Exemple de processus MapReduce : Input : ["hello world", "hello"] Mapper : ("hello", 1), ("world", 1), ("hello", 1) Reducer : {"hello": 2, "world": 1} Cela permet de compter l'occurrence de chaque mot dans un ensemble de données de manière parallèle et distribuée. Made with nCreator - tiplanet.org
>>