# TP - Tri fusion

## 1. Contexte

Nous avons vu en première deux algorithmes de tris : le __tri par insertion__ et le __tri par sélection__.

Cette année, nous allons étudier un algorithme beaucoup plus efficace et très utilisé inventé par _John Von Neumann_ en 1945: le __tri fusion__ (ou ___merge sort___).

Cet algorithme nous permettra d'illustrer la méthode __diviser pour régner__ que nous avions déjà vue lors des précédentes séances.

## 2. Principe

Le principe de "diviser pour régner" consiste :

- Diviser : découper un problème initial en sous-problèmes;
- Régner : résoudre les sous-problèmes (récursivement ou directement s'ils sont assez petits);
- Combiner : calculer une solution au problème initial à partir des solutions des sous-problèmes.

Appliquer au problème du tri d'un tableau $t$ de $n$ éléments : 

![](https://upload.wikimedia.org/wikipedia/commons/4/4a/Trois_étapes_illustré_avec_l%27algorithme_du_tri_fusion.svg)

- Diviser : découper le tableau $t$ en sous-tableaux;
- Régner : trier les sous-tableaux (récursivement ou directement s'ils sont assez petits);
- Combiner : calculer une solution au problème initial à partir des solutions des sous-problèmes.

## 3. Étape de fusion

### 3.1. Principe
Le tri fusion s'appuie sur le fait que fusionner deux tableaux triés en un tableau trié se fait en un temps linéaire 
$\mathcal{O}(n)$.

Pour fusionner ces 2 tableaux triés :

![](https://g.gravizo.com/svg?digraph%20g%20%7B%0Anode%5Bshape%3Drecord%5D%3B%0AA%5Blabel%3D%223%7C27%7C38%7C43%22%5D%3B%0AB%5Blabel%3D%229%7C10%7C82%22%5D%3B%0AC%5Blabel%3D%223%7C9%7C10%7C27%7C38%7C43%7C82%22%5D%3B%0AA%20-%3E%20C%3B%0AB%20-%3E%20C%3B%0A%7D)

Il suffit d'une itération sur les deux listes en même temps donc O(n), ici 5 itérations pour une liste de 7 éléments:

1. On considère 3 et 9, on place 3, et on avance sur la 1ère liste.
2. On considère 27 et 9, on place 9, et on avance sur la 2e liste.
3. On considère 27 et 10, on place 10, ...
4. On considère 27 et 82, on place 27, ...
5. On considère 38 et 82, on place 38, ...
6. On considère 43 et 82, on place 43, et on voit qu'on est arrivé au bout de la première liste On place maintenant tous les éléments restants de la deuxième liste.

❓__À Faire 1__ : Compléter le graphique suivant représentant les différentes étapes de fusions de tableaux :

<img src='https://g.gravizo.com/svg?
digraph g {
node[shape=record];
subgraph cluster_0{
color=white;
rank=same;
t2[label="27"];
t1[label="43"];
t3[label="38"];
t4[label="3"];
t6[label="10"];
t5[label="82"];
t7[label="9"];
};
t8[label="27|43"];
t9[label="...|..."];
t10[label="...|..."];
t11[label="...|...|...|..."];
t12[label="....|...|..."];
t13[label="3|9|10|27|38|43|82"];         
t1 -> t8;
t2 -> t8;
t3 -> t9;
t4 -> t9;
t5 -> t10;
t6 -> t10;
t8 -> t11;
t9 -> t11;
t7 -> t12;
t10 -> t12;
t11 -> t13;
t12 -> t13;
}
'>

Réponse ici

### 3.2. Implémentation

Soit l'algorithme `fusion`, qui renvoie un tableau trié né de la fusion de 2 tableaux triés:
```txt
Algorithme fusion(t1, t2)
    // t1 et t2 sont deux tableaux triés
    
    // Initialisation
    i1 <- 0   // indice du 1er tableau
    i2 <- 0   // indice du 2e tableau
    t <- []   // tableau vide destiné à accueillir les éléments triés

    // Boucle
    TANT QUE l'on a pas atteint la fin d'un des tableaux
        SI t1[i1] <= t2[i2] ALORS
            Insérer t1[i1] à la fin de t
            incrémenter i1
        SINON
            Insérer t2[i2] à la fin de t
            incrémenter i2
        FIN SI
    FIN TANT QUE
    
    // Finalisation
    Insérer les éléments restants du tableau non vide t1 ou t2 à la fin de t
    
    RENVOYER t
```

💻 __À Faire 2__ : Implémenter en Python la fonction `fusion` répondant à la spécification ci-dessus.

In [2]:
# Réponse


## 4. Étape de découpage

### 4.1. Principe

Le tri fusion s'appuie sur le fait que découper successivement un tableau $t$ en sous-tableaux de un élément s'effectue en un temps logarithmique $\mathcal{O}(\log_2(n))$.

Ainsi, l'algorithme complet du tri fusion s'exprime en $\mathcal{O}(n\log_2(n))$, car à chaque étape de découpage du tableau, on effectue la fusion des sous-tableaux.

Pour <span style='color:#c9211e;'><b>découper</b></span> un tableau $t$ de $n$ éléments en $n$ sous-tableaux de 1 éléments, $\log_2(n)$ étapes sont nécessaires.

Pour <span style='color:#2a6099;'><b>combiner</b></span> (fusionner) les sous-tableaux, $n - 1$ comparaisons sont nécessaires dans le pire des cas.

![](https://g.gravizo.com/svg?digraph%20g%20%7B%0Anode%5Bshape%3Drecord%5D%3B%0A%0At1%5Blabel%3D%2243%7C27%7C3%7C38%7C82%7C10%7C9%22%5D%3B%0At2%5Blabel%3D%2243%7C27%7C3%7C38%22%5D%3B%0At3%5Blabel%3D%2282%7C10%7C9%22%5D%3B%0At4%5Blabel%3D%2243%7C27%22%5D%3B%0At5%5Blabel%3D%223%7C38%22%5D%3B%0At6%5Blabel%3D%2282%7C10%22%5D%3B%0At7%5Blabel%3D%229%22%5D%3B%0At8%5Blabel%3D%2243%22%5D%3B%0At9%5Blabel%3D%2227%22%5D%3B%0At10%5Blabel%3D%223%22%5D%3B%0At11%5Blabel%3D%2238%22%5D%3B%0At12%5Blabel%3D%2282%22%5D%3B%0At13%5Blabel%3D%2210%22%5D%3B%0A%0Asubgraph%20cluster_0%20%7B%0Acolor%3Dwhite%3B%0Arank%3Dsame%3B%0At8%3Bt9%3Bt10%3Bt11%3Bt12%3Bt13%3Bt7%3B%0A%7D%0A%0At1%20-%3E%20t2%5Bcolor%3D%22%23c9211e%22%5D%3B%0At1%20-%3E%20t3%5Bcolor%3D%22%23c9211e%22%5D%3B%0At2%20-%3E%20t4%5Bcolor%3D%22%23c9211e%22%5D%3B%0At2%20-%3E%20t5%5Bcolor%3D%22%23c9211e%22%5D%3B%0At3%20-%3E%20t6%5Bcolor%3D%22%23c9211e%22%5D%3B%0At3%20-%3E%20t7%5Bcolor%3D%22%23c9211e%22%5D%3B%0At4%20-%3E%20t8%5Bcolor%3D%22%23c9211e%22%5D%3B%0At4%20-%3E%20t9%5Bcolor%3D%22%23c9211e%22%5D%3B%0At5%20-%3E%20t10%5Bcolor%3D%22%23c9211e%22%5D%3B%0At5%20-%3E%20t11%5Bcolor%3D%22%23c9211e%22%5D%3B%0At6%20-%3E%20t12%5Bcolor%3D%22%23c9211e%22%5D%3B%0At6%20-%3E%20t13%5Bcolor%3D%22%23c9211e%22%5D%3B%0A%0At14%5Blabel%3D%2227%7C43%22%5D%3B%0At15%5Blabel%3D%223%7C38%22%5D%3B%0At16%5Blabel%3D%2210%7C82%22%5D%3B%0At17%5Blabel%3D%229%22%5D%3B%0A%0At8%20-%3E%20t14%5Bcolor%3D%22%232a6099%22%5D%3B%0At9%20-%3E%20t14%5Bcolor%3D%22%232a6099%22%5D%3B%0At10%20-%3E%20t15%5Bcolor%3D%22%232a6099%22%5D%3B%0At11%20-%3E%20t15%5Bcolor%3D%22%232a6099%22%5D%3B%0At12%20-%3E%20t16%5Bcolor%3D%22%232a6099%22%5D%3B%0At13%20-%3E%20t16%5Bcolor%3D%22%232a6099%22%5D%3B%0At7%20-%3E%20t17%5Bcolor%3D%22%232a6099%22%5D%3B%0A%0At18%5Blabel%3D%223%7C27%7C38%7C43%22%5D%3B%0At19%5Blabel%3D%229%7C10%7C82%22%5D%3B%0A%0At14%20-%3E%20t18%5Bcolor%3D%22%232a6099%22%5D%3B%0At15%20-%3E%20t18%5Bcolor%3D%22%232a6099%22%5D%3B%0At16%20-%3E%20t19%5Bcolor%3D%22%232a6099%22%5D%3B%0At17%20-%3E%20t19%5Bcolor%3D%22%232a6099%22%5D%3B%0A%0At20%5Blabel%3D%223%7C9%7C10%7C27%7C38%7C43%7C82%22%5D%3B%0A%0At18%20-%3E%20t20%5Bcolor%3D%22%232a6099%22%5D%3B%0At19%20-%3E%20t20%5Bcolor%3D%22%232a6099%22%5D%3B%0A%7D)

### 4.2. Implémentation

Soit l'algorithme `tri_fusion`, qui effectue le découpage successif d'un tableau quelconque et a pour effet de bord de trier le tableau.

```txt
Algorithme tri_fusion(t)
    // t est un tableau quelconque
    n <- Longueur de t

    // Cas terminal
    SI n = 1 ALORS
        RENVOYER t
    FIN SI

    // Recursion sur les deux demi-tableaux sinon
    t1 <- tri_fusion(t[0:n//2])
    t2 <- tri_fusion(t[n//2:n])

    // Renvoi la fusion des deux tableaux
    RENVOYER fusion(t1, t2)
```

💻 __À Faire 3__ : Implémenter en Python la procédure `tri_fusion` répondant à la spécification ci-dessus.

In [4]:
# Réponse


## 5. Comparatif des tris

Pour rappel, des éléments sur les tri par insertion et par sélection :

- Tri par insertion :
  - Meilleur des cas : tableau trié par ordre croissant. Complexité en nombre de comparaisons : $\mathcal{O}(n)$,
  - Pire des cas : tableau trié par ordre décroissant. Complexité en nombre de comparaisons : $\mathcal{O}(n^2)$.
- Tri par sélection : 
  - Dans tous les cas, Complexité en nombre de comparaisons : $\mathcal{O}(n^2)$.

💻 __À Faire 4__ : 
- Importer le module `tri`,
- Exécuter le code suivant permettant de comparer le tri par sélection et le tri fusion en fonction de la taille du tableau en entrée.

❓Que constatez-vous ? Les graphiques confirment-ils les complexités des 2 algorithmes ?

In [20]:
import timeit
import matplotlib.pyplot as plt
from tri import *
from random import shuffle

# différentes tailles de tableaux
abscisse =  [10, 100, 400, 600, 1000]

ordonnee_selection = [] # liste des temps par tri sélection
ordonnee_fusion = [] # liste des temps par tri fusion

# Création des listes non triées de tailles n
for n in abscisse:
    l = [i for i in range(n)] # création du tableau de taille n : [0... n-1]
    shuffle(l) # Mélange des éléments du tableau

    # Création des tableaux d'ordonnées correspondantes pour chaque graphique
    # Pour  le tri par sélection :
    # Attention le tri sélection est un tri "en place" qui trie le tableau l. 
    # Il faut donc pour chaque mesure prendre une copie du tableau l initial, avec l[:]
    temps=timeit.timeit("tri_selection(l[:])", number=1, globals=globals())
    ordonnee_selection.append(temps)
    
    # Par tri fusion
    temps=timeit.timeit("tri_fusion(l)", number=1, globals=globals())
    ordonnee_fusion.append(temps)


# Graphique pour le tri sélection en rouge
plt.plot(abscisse, ordonnee_selection, "ro-", label="Tri par sélection") # en rouge

# Graphique pour le tri fusion en bleu
plt.plot(abscisse, ordonnee_fusion, "bo-", label="Tri fusion") # en bleu

plt.xlabel("Taille du tableau")
plt.ylabel("Temps en s")
plt.legend()

plt.show()
plt.close()

Réponse ici

💻 __À Faire 5__ : Modifier le code précédent pour comparer le tri par insertion aux 2 tris précédents.

❓Que constatez-vous ? Les graphiques confirment-ils les complexités des algorithmes ?

In [21]:
# Réponse


💻 __À Faire 6__ : Modifier le code précédent pour comparer les algorithmes dans le meilleur et pire des cas du tri par insertion.

❓Que constatez-vous ? Les graphiques confirment-ils les complexités des algorithmes ? Que concluez-vous sur le tri fusion ?

In [22]:
# Réponse
