SELECT genre, COUNT*, MAXannee FROM Film GROUP BY genre Dans une première étape, MySQL va constituer les groupes.. On peut les représen-ter avec un tableau, comprenant pour chaque ligne
Trang 110.5 AGRÉGATION
L’agrégation de données avec SQL a été expliquée de manière détaillée au moment
de la présentation des algorithmes de prédiction, page 307, et nous n’y revenons que
de manière assez brève La syntaxe SQL fournit donc :
1 le moyen de partitionner une table en groupes selon certains critères ;
2 le moyen d’exprimer des conditions sur ces groupes ;
3 des fonctions d’agrégation
Il existe un groupe par défaut : c’est la table toute entière Sans même définir de groupe, on peut utiliser les fonctions d’agrégation
mysql> SELECT COUNT(*), COUNT(nom), COUNT(annee_naissance)
-> FROM Artiste;
+ -+ -+ -+
| COUNT(*) | COUNT(nom) | COUNT(annee_naissance) |
+ -+ -+ -+
+ -+ -+ -+
On obtient 4 pour le nombre d’années, et 5 pour les autres valeurs En effet l’attribut annee_naissance est NULL pour Jacques Dutronc, et n’est pas pris
en compte par la fonction d’agrégation Pour compter toutes les lignes, on doit utiliser COUNT(*), ou un attribut déclaré comme NOT NULL : c’est le cas pour COUNT(nom) On peut aussi compter le nombre de valeurs distinctes dans un groupe
avec COUNT(DISTINCT expression ).
10.5.1 La clauseGROUP BY
Pour bien analyser ce qui se passe pendant une requête avec GROUP BY, il faut décomposer l’exécution de la requête en deux étapes Prenons l’exemple des films, groupés par genre
SELECT genre, COUNT(*), MAX(annee)
FROM Film
GROUP BY genre
Dans une première étape, MySQL va constituer les groupes On peut les représen-ter avec un tableau, comprenant pour chaque ligne des valeurs du (ou des) attribut(s)
de classement (ici genre), associé(s) à toutes les lignes correspondant à cette valeur
Le groupe associé au genre « Drame » est constitué de deux films : ce tableau n’est donc pas une table relationnelle, dans laquelle chaque cellule ne peut contenir qu’une seule valeur
Pour se ramener à une table relationnelle, on transforme durant la deuxième étape chaque groupe de lignes en une valeur par application d’une fonction d’agrégation
Trang 2414 Chapitre 10 Récapitulatif SQL
genre titre , année, id_realisateur
Western Impitoyable, 1992, 20 Drame Van Gogh, 1990, 29
Kagemusha, 1980, 68 Policier Les pleins pouvoirs, 1997, 20
Les films groupés par genre
La fonction COUNT() compte le nombre de lignes dans chaque groupe, MAX() donne
la valeur maximale d’un attribut parmi l’ensemble des lignes du groupe, etc Nous rappelons la liste des fonctions d’agrégation dans le tableau 10.1
Tableau 10.1 — Les fonctions d’agrégation de MySQL
Fonction Description
COUNT (expression) Compte le nombre de lignes.
AVG(expression) Calcule la moyenne deexpression.
MIN(expression) Calcule la valeur minimale deexpression.
MAX (expression) Calcule la valeur maximale deexpression.
SUM(expression) Calcule la somme deexpression.
STD(expression) Calcule l’écart-type deexpression.
mysql> SELECT genre, COUNT(*), MAX(annee)
-> FROM Film
-> GROUP BY genre;
+ -+ -+ -+
| genre | COUNT(*) | MAX(annee) |
+ -+ -+ -+
+ -+ -+ -+
Dans la norme SQL ANSI, l’utilisation de fonctions d’agrégation pour les
attri-buts qui n’apparaissent pas dans le GROUP BY est obligatoire Une requête comme :
SELECT genre, titre, COUNT(*), MAX(annee)
FROM Film
GROUP BY genre
devrait être rejetée parce que le groupe associé à ’Drame’ contient deux titres différents, et qu’il n’y a pas de raison d’afficher l’un plutôt que l’autre MySQL est plus conciliant, et affiche une des valeurs trouvées :
mysql> SELECT genre, titre, COUNT(*), MAX(annee)
-> FROM Film
-> GROUP BY genre;
Trang 3| genre | titre | COUNT(*) | MAX(annee) |
+ -+ -+ -+ -+
| Policier | Les pleins pouvoirs | 1 | 1997 |
+ -+ -+ -+ -+
On a donc associé « Van Gogh » à « Drame », en oubliant ’Kagemusha’ Outre que cela ne présente pas beaucoup de signification, cette requête serait refusée par tout autre SGBD relationnel
10.5.2 La clauseHAVING
Finalement, on peut faire porter des conditions sur les groupes – ou plus précisément sur le résultat de fonctions d’agrégation appliquées à des groupes – avec la clause HAVING La clause WHERE ne peut exprimer des conditions que sur les lignes prises une à une Par exemple, on peut sélectionner les genres pour lesquels on connaît au moins deux films
mysql> SELECT genre, MAX(annee)
-> FROM Film
-> GROUP BY genre
-> HAVING COUNT(*) >= 2;
+ -+ -+
| genre | MAX(annee) |
+ -+ -+
| Drame | 1990 |
+ -+ -+
La condition porte ici sur une propriété de l’ensemble des lignes du groupe, pas de chaque ligne prise individuellement La clause HAVING est donc toujours exprimée sur le résultat de fonctions d’agrégation
Pour conclure, voici une requête sélectionnant les metteurs en scène pour lesquels
on ne connaît pas plus de deux films, avec le nombre de films, et un tri sur le nom du metteur en scène
mysql> SELECT nom AS nom_realisateur, COUNT(f.titre) AS nbFilms
-> FROM Film f, Artiste a
-> WHERE a.id= f.id_realisateur
-> GROUP BY nom
-> HAVING COUNT(*) <= 2
-> ORDER BY nom;
+ -+ -+
| nom_realisateur | nbFilms |
+ -+ -+
+ -+ -+
Trang 4416 Chapitre 10 Récapitulatif SQL
10.6 MISES À JOUR
Les commandes de mise à jour (insertion, destruction, modification) sont considéra-blement plus simples que les requêtes
10.6.1 Insertion
L’insertion s’effectue avec la commande INSERT, avec trois variantes Dans la pre-mière, on indique la liste des valeurs à insérer, sans donner explicitement le nom des attributs MySQL suppose alors qu’il y a autant de valeurs que d’attributs, et que l’ordre des valeurs correspond à celui des attributs dans la table On peut indiquer NULL pour les valeurs inconnues
INSERT INTO Film
VALUES (’Vertigo’, 1958, NULL, ’Suspense’);
Si on veut insérer dans une partie seulement des attributs, il faut donner la liste explicitement
INSERT INTO Film (titre, annee)
VALUES (’Vertigo’, 1958);
Il est d’ailleurs préférable de toujours donner la liste des attributs La description d’une table peut changer, par ajout d’attribut, et l’ordre INSERT qui fonctionnait un jour ne fonctionnera plus le lendemain
Enfin, avec la troisième forme de INSERT, il est possible d’insérer dans une table
le résultat d’une requête Dans ce cas la partie VALUES est remplacée par la requête elle-même
Par exemple on peut créer une table ExtraitFilm avec le titre du film, l’année, et
le nom du metteur en scène, puis copier les informations de la base dans cette table avec les commandes combinées INSERT SELECT
mysql> CREATE TABLE ExtraitFilm (titre VARCHAR(50) NOT NULL,
Query OK, 0 rows affected (0.00 sec)
mysql> INSERT INTO ExtraitFilm
-> SELECT titre, annee, nom
-> FROM Film, Artiste
-> WHERE id_realisateur=id;
Query OK, 4 rows affected (0.01 sec)
Records: 4 Duplicates: 0 Warnings: 0
Trang 5mysql> SELECT * FROM ExtraitFilm;
+ -+ -+
| titre | annee | nom_realisateur |
+ -+ -+ -+
| Les pleins pouvoirs | 1997 | Eastwood |
+ -+ -+ -+
10.6.2 Destruction
La destruction s’effectue avec la clause DELETE dont la syntaxe est :
DELETE FROM table
WHERE condition
table étant bien entendu le nom de la table, et condition est toute condition, ou
liste de conditions, valide pour une clause WHERE En d’autres termes, si l’on effectue, avant la destruction, la requête
SELECT * FROM table
WHERE condition
on obtient l’ensemble des lignes qui seront détruites par DELETE Procéder de cette manière est un des moyens de s’assurer que l’on va bien détruire ce que l’on souhaite
10.6.3 Modification
La modification s’effectue avec la clause UPDATE La syntaxe est proche de celle du DELETE :
UPDATE table SET A1=v1, A2=v2, A n =v n
WHERE condition
Comme précédemment, table dénote la table, les A i sont les attributs, les v iles
nouvelles valeurs et condition est toute condition valide pour la clause WHERE.