# TP - Puzzles de Merkle

# 1. Contexte

> En cryptographie, les puzzles de Merkle ou Enigme de Merkle de Ralph Merkle constituent la première construction à clé asymétrique, à l'exception possible d'études top secrètes par le GCHQ. Cette construction a été réalisée en 1974, mais n'a été publiée qu'en 1978. Elle permet à deux parties de se mettre d'accord sur un secret en commun par l'échange de messages, et sans que ces partis n'aient préalablement de secret commun. 

Source : wikipedia

## 2. Principe

Supposons qu'Alice et Bob veulent communiquer en utilisant une clé secrète commune.

Pour établir cette clé, Alice envoie à Bob un message qui consiste en un grand nombre de __puzzles__, chacun assez petit pour que Bob puisse le résoudre par attaque par force brute.

Les puzzles sont de la forme d'un message chiffré avec une clé inconnue, donc la clé est __assez courte__.

Alice envoie tous les messages à Bob. 

Il en sélectionne un au hasard et le résout par force brute.

Le message chiffré contient un identificateur (du choix de Bob) et une clé secrète, dite clé de session.

Bob renvoie l'identificateur à Alice, qui sait alors également quelle est la clé de session.

### Exemple 

Voici un exemple de message (pas encore chiffré) pouvant être généré par Alice :
    
> identiﬁcateur : 135674 – clé : fQ98c~m{)*e9+G!-  
> identiﬁcateur : 426891 – clé : VMQ>Dm2|uyFU8$z\\  
> identiﬁcateur : 734562 – clé : H\\>hq]D/x.K\\-Ov}  
> identiﬁcateur : 924252 – clé : nSV)ayafjvzA9zXz

Ce message est constité d'un indentificateur numérique et d'une clé composé de 16 caractères. 

Ce fichier sera chiffré en utilisant le chiffrement XOR avec une clé différente pour chaque ligne.  

**La clé devra être assez courte pour que le déchiffrement d'une ligne ne soit pas trop long**  

Voici un extrait du fichier obtenu après chiffrement qui sera transmis sur le réseau :

> 47 96 83 70 114 111 49 101 24 90 72 94 135 113 82 136 96 120 65 92 70 136 31 120 106 102 31 60 116 125 76 ... 40  
> 42 89 117 45 21 93 145 104 66 98 143 77 100 135 31 82 90 40 37 107 83 82 139 6 11 52 62 88 30 94 117 ... 139  
> 68 120 21 82 102 27 6 56 50 123 23 77 113 41 106 66 141 123 124 76 104 45 17 91 20 3 32 117 124 98 67 ... 127  
> 4 14 48 89 143 43 129 130 110 23 11 102 121 131 104 102 95 105 21 70 148 128 146 132 40 73 41 4 87 81 93 ... 66 

Bob choisira une ligne au hasard dans ce ﬁchier. Ensuite, il décryptera cette ligne en testant toutes les clés possibles. 

Admettons qu’il choisisse et décrypte la ligne suivante :  
> identiﬁcateur : 924252– clé : nSV)ayafjvzA9zXz  

Bob transmettra en clair 924252 sur le réseau à destination d'Alice.  

Elle saura alors que la clé de session à utiliser sera nSV)ayafjvzA9zXz. Alice et Bob communiquerons alors avec cette clé lors de leurs prochaines échanges.  

Le tiers parti Ève, l'adversaire, a la tâche plus difficile. Elle ne sait pas quel puzzle a été résolu. La meilleure stratégie pour Ève est de __résoudre tous les puzzles__, ce qui est beaucoup plus coûteux pour elle que pour Alice. 

## 3. Travail à faire

### 3.1. Génération du fichier identifiants/clés par Alice.

<div class="alert alert-block alert-warning">
  Exercice 1
    
Creer une fonction `generer_cle` qui :
- prend en paramètre un entier `n` 
- renvoie une clé qui sera une chaîne de caractère de longueur `n` composée de caractères aléatoires dont les codes ASCII sont entre 33 et 126.

Exemples d'utilisation :
    
```python
>>> generer_cle(4)
'g{!t'
>>> generer_cle(4)
'-7sv'
>>> generer_cle(16)
"o~d5Cu%Qa@'#9I2]"
```
</div>

In [None]:
# Réponse


<div class="alert alert-block alert-warning">
  Exercice 2
    
Creer une fonction `generer_ensemble_cles` qui :
- prend en paramètre un entier `n`, le nombre de clés à générer et un entier `p`, la taille des clés
- renvoie un dictionnaire contentant `n` éléments.  
    - Les clés de ce dictionnaire seront des identificateurs, c'est-à-dire des nombres aléatoires qui seront uniques compris entre 0 et 999999 inclus,
    - Les valeurs seront des clés aléatoires de longueurs `p`.

Pour obtenir des identifiants uniques, vous pourrez utiliser la fonction sample de python 
    [Vers la documentation de sample](https://docs.python.org/fr/3/library/random.html#random.sample)    

Exemples d'utilisation :
    
```python
>>> generer_ensemble_cles(10, 4)
{326901: '#*Sa', 753969: 'NB<V', 936158: ",Zd'", 877149: 'W}]\\', 121451: 'Jx4X', 649437: 'SL4;', 974956: '*$n`', 443475: "J'sx", 469322: 'pQ1t', 667971: '&u\'"'}
>>> generer_ensemble_cles(10, 16)
{711436: 't*4s|*]}|b)jh}3T', 913571: 'cK9}%w.e$b27zSNJ', 948133: '7||D7r1Z%+BM7I+(', 27299: ')_{q&0Cu5v|BcL9J', 21899: '*\\TDOvFI85?^f-DH', 684082: 'Jr@[rv~-+W=Ew=OS', 168919: '@B+xR]Y")aK\'H@K#', 375739: '&x3w2,-C)f/p@kZv', 376433: 'A.kFBCz/G?P?9[WB', 424343: '{jM$=qrZJv$RQ{:_'}
```
</div>

In [None]:
# Réponse


<div class="alert alert-block alert-warning">
  Exercice 3
    
Compléter le code ci-dessous de façon à obtenir un fichier similaire à celui de l'exemple.  
On souhaite obtenir un fichier de 100 lignes avec des clés de longueur 16.
    
```python
cles = generer_ensemble_cles(............)

with open("cles.txt", "w", encoding="UTF-8") as fichier:
    for identificateur in cles:
        # \n permet de passer à la ligne.
        texte = "identificateur : {} - Clé : {} \n"
        ligne = texte.format(identificateur, cles[identificateur])
        ........................
```
Etudiez aussi la structure de ce code, il permet de générer un fichier contenant les identificateurs et les clés (une par ligne).
    
</div>

In [None]:
# Réponse


In [None]:
# Une fois la cellule précédente exécutée, ouvrez le fichier "cles.txt" pour vérifier son contenu
with open("cles.txt", "r", encoding="UTF-8") as fichier:
    print(fichier.readlines())

In [None]:
# Cette cellule ne doit pas être modifiée.

# Fonctions de chiffrement de type XOR
# La fonction chiffrer(message, cle) permet de chiffrer un message avec une clé en utilisant le chiffrement XOR. 
# Le retour sera une chaîne de caractère constituée des codes UTF-8 des caractères chiffrés.

# La fonction dechiffrer(message, cle) permet de déchiffrer un message avec une clé en utilisant le chiffrement XOR. 
# En entrée, message est une chaîne de caractère constituée des codes UTF-8 des caractères chiffrés.
# Le retour sera une chaîne de caractère constituée des caractères clairs.

import math

def str_to_utf(chaine):
    """
    Détermine les points de code UT8 d'une chaîne de caractères
    :param chaine: (str) Une chaîne de caractères
    :return: (list) Un tableau où chaque élément correspond au point de code UTF-8 d'un caractère de la chaîne
    :doctests:
        >>> str_to_utf("MESSAGE")
        [77, 69, 83, 83, 65, 71, 69]
        >>> str_to_utf("message")
        [109, 101, 115, 115, 97, 103, 101]
        >>> str_to_utf("")
        []
    """
    return [ord(c) for c in chaine]

def chiffrer(message, cle):
    """
    Chiffre un message par la méthode XOR avec la clé donnée
    :param message: (str) un message clair
    :param cle: (str) une clé de chiffrement
    :return: (str) le chiffré sous forme de points de code UTF-8 séparés par un espace
    :doctests:
        >>> chiffrer('MESSAGE', 'IAMAKEY')
        '4 4 30 18 10 2 28'
        >>> chiffrer('message', 'IAMAKEY')
        '36 36 62 50 42 34 60'
        >>> chiffrer('identificateur : 135674 - clé : fQ98c~m{)*e9+G!-', '(L%F')
        '65 40 64 40 92 37 67 47 75 45 81 35 93 62 5 124 8 125 22 115 30 123 17 102 5 108 70 42 193 108 31 102 78 29 28 126 75 50 72 61 1 102 64 127 3 11 4 107'
    """
    n = len(message)
    m = len(cle)
    
    clair = str_to_utf(message)
    cle_utf = str_to_utf(cle) * math.ceil(n / m)
    
    chiffre = [ str(clair[i] ^ cle_utf[i]) for i in range(n)]
    
    return " ".join(chiffre)

def dechiffrer(message, cle):
    """
    Déchiffre un message par la méthode XOR avec la clé donnée
    :param message: (str) le chiffré sous forme de points de code UTF-8 séparés par un espace
    :param cle: (str) une clé de chiffrement
    :return: (str) le message clair
    :doctests:
        >>> dechiffrer('4 4 30 18 10 2 28', 'IAMAKEY')
        'MESSAGE'
        >>> dechiffrer('36 36 62 50 42 34 60', 'IAMAKEY')
        'message'
        >>> dechiffrer('65 40 64 40 92 37 67 47 75 45 81 35 93 62 5 124 8 125 22 115 30 123 17 102 5 108 70 42 193 108 31 102 78 29 28 126 75 50 72 61 1 102 64 127 3 11 4 107', '(L%F')
        'identificateur : 135674 - clé : fQ98c~m{)*e9+G!-'
    """
    chiffre = message.split(' ')
    n = len(chiffre)
    m = len(cle)
    
    cle_utf = str_to_utf(cle) * math.ceil(n / m)
    
    clair = [ chr(int(chiffre[i]) ^ cle_utf[i]) for i in range(n)]
    
    return "".join(clair)

<div class="alert alert-block alert-warning">
  Exercice 4
    
Compléter le code de la fonction `chiffrer_fichier` dotée de la spécification suivante :
    
```python
def chiffrer_fichier(n):
    """
    Chiffre les lignes du fichier par la méthode XOR avec une clé aléatoire de taille n
    :param n: (int) la taille de la clé
    :return: (None)
    :Effet de bord: Un fichier "cles_chiffre.txt" est créé contenant les n lignes du fichier d'entrée chacunes chiffrées par une clé
    """
    with open("cles.txt", "r", encoding="UTF-8") as fichier_e:
        with open("cles_chiffre.txt", "w", encoding="UTF-8") as fichier_s:
            for ligne in fichier_e.readlines():
                .......................................
```
    
</div>

In [None]:
# Réponse


In [None]:
# Une fois la cellule précédente exécutée, ouvrez le fichier "cles.txt" pour vérifier son contenu
chiffrer_fichier(3)
with open("cles_chiffre.txt", "r", encoding="UTF-8") as fichier:
    print(fichier.readlines())

### 3.2. Décryptage d'une ligne par Bob

Dans cette partie, Bob choisit une ligne au hasard. Il va ensuite la déchiffrer par force brute. On supposera qu'il connaît la taille de la clé utilisée par Alice (3 dans notre exemple).

Une fois qu'il l'aura décryptée, il enverra à Alice l'identificateur pour qu'elle sache quelle clé de chiffrement sera utilisée pour leurs prochains échanges. 

<div class="alert alert-block alert-warning">
  Exercice 5
    
Compléter le code ci-dessous de façon à lire le fichier "cles_chiffre.txt".  
Le tableau `lignes` contiendra chaque lignes du fichier   
La variable `puzzle` contiendra une de ces lignes choisie au hasard.  

```python
with open("cles_chiffre.txt", "r", encoding="UTF-8") as fichier:
    lignes = []
    # Votre code ici.
    i = randint(0, .................)
    puzzle = .................

    print(puzzle)

```
</div>

In [None]:
# Réponse


<div class="alert alert-block alert-warning">
  Exercice 6
    
Compléter le code ci-dessous.

```python
from itertools import product

def decrypter(message, n):
    """
    """
    # liste_cles contient toutes les clés possibles de taille n
    cles = [''.join(x) for x in product([chr(i) for i in range(33, 127)], repeat = n)]
    # print(cles)
    # Votre code ici.
```
La fonction `decrypter` 
- prend en paramètre `message` qui est une chaine de caractère (la ligne à décrypter) et `n` un entier qui représente la taille de la clé utilisée par Alice.
- en sortie la fonction renvoie la ligne décryptée (lisible en clair)

    Exemples d'utilisation : 
    
```python
>>> decrypter('40 37 36 47 53 40 39 40 34 32 53 36 52 51 97 123 97 117 97 108 97 34 45 168 97 123 97 3 51 117 55 113 96', 1)
'identificateur : 4 - clé : Br4v0!'
>>> decrypter('6 15 10 5 27 2 9 2 12 10 27 14 26 25 79 81 79 95 79 70 79 8 3 130 79 81 79 41 29 95 25 91 78', 2)
'identificateur : 4 - clé : Br4v0!'
>>> decrypter('72 70 72 43 85 75 75 44 66 67 89 32 84 80 13 127 1 19 30 112 23 21 25 101 12 2 78 41 200 2 23 101 71 115 20 125 66 92 64 62 8 8 72 124 10 101 12 104', 4)
'identificateur : 135674 - clé : fQ98c~m{)*e9+G!-'
```
*Indice : La fonction "saura" que la clé est bonne si un terme connu est lisible en clair.*
</div>

In [None]:
# Réponse


Testez votre code et voyez le temps nescessaire pour décrypter une ligne.

In [None]:
decrypter(puzzle, 3)

<div class="alert alert-block alert-warning">
  Exercice 7
    
En admettant que le temps de décryptage soit le même pour chaque ligne. Combien de temps faudrait-il à Eve pour décrypter le fichier en entier si il contient 100 lignes ?
</div>

Réponse ici

### 3.3. Tentative de hacking par Eve.

Bob transmet l'identificateur : 312698

Puis le message :
> 63 28 22 26 48 14 13 5 69 61 93 52 108 13 20 39 20 10 111 126 38 28 67 20 64 61 69 40 34 18 113 13 22 89 9 8227 34 26 23 13 68 60 76 77 14 13 30 58 0 28 11 78 99 2 12 12 9 49 378 50 62 107 63 8272 6 23 0 26 47 14 13 5 92 55 92 53 70 44 20 39 28 13 10 84 38 65 105 104 125 61 92 51 108 18 14 47 21 22 6 91 45 27 105 39 93 114 75 43 166 12 30 101 83 8 16 91 45 11 105 49 70 60 71 34 108 13 8290 33 22 12 23 95 111 101 41 7 9 63 76 103 63 14 14 63 26 28 11 73 73 43 6 17 9 56 70 50 62 18 91 40 29 26 12 95 45 28 105 39 93 114 67 34 108 17 23 44 6 11 0 48 73 42 23 66 67 55 9 42 8277 4 21 105 5 24 12 73 73 46 22 66 95 55 71 51 108 12 26 60 5 24 12 73 73 62 22 11 9 63 8240 34 33 17 20 59 7 28 111 126 38 136 131 78 9 54 76 43 172 77 113 25 18 11 0 83 47 79 131 66 69 51 35 1 41 20 18 37 31 28 69 87 44 29 23 7 7 88 35 23 45 20 23 105 37 28 23 86 34 6 13 7 5 114 121 40 164 12 30 58 83 10 4 78 54 29 13 11 76 60 90 105 70

On sait que la taille de la clé de chiffrement du fichier est de 3.

<div class="alert alert-block alert-warning">
  Exercice 8 : BONUS
    
Vous êtes Eve ([Eavedropper](https://en.wikipedia.org/wiki/Eavesdropping)), l'espion mal intentionnée.

Vous avez intercepté le fichier chiffré envoyé par Alice. Il se nomme `[HACKED]cles_chiffre.txt`.    
    
Il contient les identificateurs et les clés. Mais il est chiffré !  
Vous savez aussi que l'identifiant choisit par Bob est 312698.
    
A vous de casser le code et de trouver le message envoyé par Bob !
    
Trouvez aussi la référence cachée dans ce message pour gagner le respect de tous !

</div>

In [None]:
# Lecture du fichier "[HACKED]cles_chiffre.txt"

# Votre code ici.

-----
Licence : CC-BY-NC-SA, Activité adaptée du TP partagé par l'académie de Paris via Capytale.