Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Publicité
Le Chiffre de Beale
22 octobre 2006

Remarques, stratégies et tout ça...

J'ai donc choisi de tenter d'essayer de déchiffrer le premier message de Beale. Quelques remarques préliminaires.

Tout d'abord, Beale a utilisé pour son chiffrement 299 nombres (que l'on appellera signes) différents, qui vont de 1 à 2906. Le nombre de combinaisons possibles est donc de 26^299, ce qui est un nombre plus que gigantesque, qui va au delà de la compréhension humaine... Impossible donc de s'attaquer à ce problème par force brute, c'est à dire en testant toutes les combinaisons.

Il faut donc s'appuyer sur autre chose, et cet autre chose, c'est la grammaire et le vocabulaire de la langue anglaise. En étudiant différentes séquences de lettres, il est possible d'en déceler certaines grâce à des "signes particuliers" : par exemple, un "q" est toujours suivi d'un "u".

Ensuite, il y a aussi le fait que Beale a chiffré son texte en utilisant les premières lettres des mots d'un texte (je vous renvoie à Wikipédia pour voir la méthode). Retrouver ce texte nous arrangerait bien, car il permettrait de déchiffrer le code (évidemment) : mais comment retrouver un tel texte parmi une foule d'autres, sinon par chance ? Cela dit, on ne peut utiliser que des textes de l'époque (1830), et donc pas la peine de chercher chez Proust...

De plus, ça n'avance peut-être à rien certes, mais on sait que le texte qui a servi à coder fait au minimum 2906 mots...

Une autre remarque qui est je pense très intéressante : après avoir relevé les occurences de lettres, je me suis aperçu que le tiers des signes utilisés (un peu moins, en fait 90 sur 299) sont des nombres compris entre 1 et 100, et que ces signes représentent environ 50% des occurences dans le texte ! (plus précisément 226 sur 520) Il est probable que Beale, dans le chiffrement de son message, ait eu les cent premiers mots (ou les cent premières occurences, c'est la même chose) devant les yeux, et ait choisi au hasard (ou bien selon ses besoins) des lettres dans le reste du texte, afin de brouiller les pistes et de répartir un peu mieux les lettres... C'est une des failles majeures du codage, mais une faille humaine : un ordinateur aurait choisi parmi les 2906 lettres disponibles, mais pour un homme la tâche aurait été trop fastidieuse... Ma recherche peut donc se concentrer sur cette centaine de signes, qui fourniront une très bonne matière pour finir de déchiffrer le texte par la suite. Reste à établir le tableau de correspondances... ce qui est extrêmement ardu !
Par contre on ne peut toujours pas utiliser la force brute pour déchiffrer ces signes : le nombre de possibilités est de 26^90, ce qui est toujours trop gros...

Beale par contre ne nous a (bien évidemment) pas facilité la tâche en codant son message, puisqu'il n'y a pas d'espaces dans le texte codé !

Je me propose dans ma recherche d'étudier non pas un signe ou deux, mais d'étudier les triplets de signes que l'on trouve dans le texte : un signe, celui qui est avant, et celui qui est après. Ainsi, on peut repérer quelques signes particuliers dans le placement des lettres.

Voilà pour les quelques petites remarques préliminaires.

Publicité
Publicité
Commentaires
M
Merci pour tes encouragements ! :)<br /> <br /> En fait, chaque lettre du texte est remplacée par un numéro qui correspond à un mot dans un texte au hasard dont la première lettre correspond à la lettre à remplacer...<br /> Exemple : Le chat court après la souris.<br /> 1=L, 2=C, 3=C, 4=A, 5=L et 6=S<br /> Si on veut ensuite coder LACS, on pourra choisir de coder le mot en 1-5-2-6 ou en 1-5-3-6...<br /> <br /> Le problème avec l'analyse statistique des occurences des lettres, c'est que une lettre peut être codée par plusieurs chiffres différents (voir exemple ci-dessus) ; donc un chiffre utilisé plusieurs fois ne veut pas nécessairement dire que ce chiffre est un "e", vu que le "e" peut être codé avec beaucoup d'autres chiffres...
P
bonjour,<br /> je découvre cec blog tout neuf, et le projet qu'il accompagne semble passionnant (même si je ne connais rien à la cryptographie)...<br /> Si je comprends bien, chaque lettre du texte est remplacée par un nombre qui correspond à la première occurence d'un mot pris au hasard dans un texte pris au hasard?<br /> Du coup, la tactique de chercher des ensembles de signes me paraît très bonne pour commencer. A mon humble avis, il faudrait aussi regarder le nombre de fois qu'un signe apparaît, ça pourrait donner une indication sur des lettres, vu que certaines lettres, comme le e, le s ou le a apparaissent beaucoup plus fréquemment que d'autres (statistiquement).<br /> En tout cas, bon courage!!!
Publicité