Ein möglicher Anasatz der Kryptoanalyse ist die Untersuchung der Häufigkeiten von Buchstaben und n-Grammen. Die Haufikeitsanalyse macht sich die Gesetzmäßigkeiten der Sprache Zunutze. Jede Sprache hat Normen und kann auch durch geschickte Chiffrierung nicht vollständig beseitigt werden.
Die Gesamtheit der Häufigkeiten der einzelnen Buchstaben (oder Buchstabengruppen) eines Textes im Verhältnis zum Gesamttext wird Häufigkeitsverteilung genannt. Sie wird meist in pro 100 (Prozent) oder pro 1000 (Promille) angegeben.
Die Häufigkeit der Buchstaben ist für eine Sprache charakteristisch. So ist das 'E' im deutschen mit einer Häufigkeit von 17,4% der meist verwendete Buchstabe. Im englischen dagegen hat das 'E' nur einen Anteil von 12,5%. Ein ausführlicher Artikel über die Häufigkeit von Buchstaben findet sich unter https://de.wikipedia.org/wiki/Buchstabenh%C3%A4ufigkeit.
Quelle: Wikipedia
Die Häufigkeitsverteilung bleibt bei monoalphabetischen Substitutionschiffren auch nach dem Verschlüsseln erhalten, da die Buchstaben ja nur gegeneinander ausgetauscht werden. So lassen sich Rückschlüsse auf die Sprache machen und ein so chiffrierter Text dechiffrieren, indem man den meisthäufigsten Buchstaben im Chiffrat durch den meisthäufigsten Buchstaben der Sprache ('E') ersetzt, den zweithäufigsten ebenso usw. Durch Austausch von Buchstaben durch welche mit ähnlicher Verteilung kann man so Wortteile kombinieren und schlussendlich den Gesamttext entziffern.
Auch bei Dechiffrierung von polyalphabetischen Substitutionschiffren kann die Häufigkeitsverteilung von Nutzen sein, z. B. bei der Bestimmung der Schlüssellänge einer Vigenere Chiffre. Bei dieser Chiffre wird ein kurzes Schlüsselwort zum Chiffrieren ständig wiederholt.
Man kann allerdings nicht nur die Häufigkeit von Einzelbuchstaben zählen , sondern dies auch für Zweipaare (Bigramme) und Dreierpaare (Trigramme) tun. Sind die Leerzeichen in einem Chiffrat erhalten geblieben, kann man auch auf ...
einzelne Wörter: Im englischen gibt es z. B. nur 2 Wörter mit einem Buchstaben: 'I' und 'a'. Die häufigsten dreistelligen Wörter im Deutschen sind 'die', 'der', 'und', 'den', und 'das'
Wortanfänge: Buchstabenfolgen, mit denen Wörter oft beginnen.
Wortenden: Buchstabenfolgen, mit denen Wörter häufig enden.
abprüfen und Erkenntnisse über deren Häufigkeitsverteilung bei der Entschlüsselung eines Textes behilflich sein.