Graf : Frekvenční analýza zastoupení znaků v šifrované zprávě, řazeno abecedně

Download 4.04 Mb.
bet	85/86
Sana	10.04.2017
Hajmi	4.04 Mb.
	#3699

1 ... 78 79 80 81 82 83 84 85 86

Graf : Frekvenční analýza zastoupení znaků v šifrované zprávě, řazeno abecedně

(zdroj: vlastní úprava)
Graf : Frekvenční analýza zastoupení znaků v šifrované zprávě, řazeno sestupně podle zastoupení

(zdroj: vlastní úprava)

Z analýzy textu nám vyplývá, že čtyři nejvíce zastoupené znaky jsou J, N a F. Podle analýzy českého jazyka na vzorku od Karla Čapka víme, že čtyři nejčastější písmena v otevřeném textu jsou E, A a O. Pojďme si tedy zkusit nahradit nejčetnější znak šifrového textu J nejčetnějším znakem z naší analýzy českého jazyka – E (viz Tabulka ). Pokud dále budeme zkoumat šifrovaný text, tak zaznamenáme písmena, která jsou ve větě sama. V češtině by se mohlo jednat nejčastěji o A, nebo O. Obě jsou shodou okolností ve třetici nejčetnějších znaků. Tedy by je měl v šifrovém textu reprezentovat znak N, nebo F. Žádné takové písmeno se nám v textu ale neobjevuje. Vidíme pouze T a A. Pokud se tedy zaměříme na fakt, že A, nebo O, by mohlo být v šifrovém textu reprezentováno písmenem T, nebo A, měli bychom tato dvě písmena vidět ve frekvenční analýze mezi nejčetnějšími znaky šifrového textu. Skutečně, hned čtvrtým nejčastějším znakem v šifrovém textu je znak T. Pojďme tedy prozkoumat situaci, kdy budeme písmeno T považovat za A, nebo O.

Pokud se navíc pečlivěji zadíváme, najdeme výskyt několika slov o dvou znacích, které končí znakem T (tedy buď A, nebo O), podle toho, který z těchto znaků předpokládáme. Pokud by dvojpísmenné slovo mělo končit na A, bude před ním nejspíš znak N, jako předložka „na“. Pokud budeme uvažovat O, bude před ním pravděpodobně D, jako v předložce „do“.

Také vidíme dvoupísmenné slovo, které podle našeho předchozího dosazení pravděpodobně končí na E, a první písmeno by svou četností mělo být na pátém pořadí. Pokud si tuto oblast četností otevřené abecedy prohlédneme, najdeme písmeno S a v jeho okolí I a N. I můžeme ze znalosti češtiny vynechat. Zbývají dvojice „se“ a „ne“. Ne je velmi častou předponou na začátku slov, ale už ne tak častým samostatným slovem. V tomto kontextu je „se“ častější. Pojďme tedy dále předpokládat, že X je náhradou za S.

Pokud budeme analyzovat, která nejčetnější písmena ještě nemáme využita, najdeme písmeno N v šifrové abecedě (na druhém místě) a písmeno I v otevřené abecedě (na čtvrtém místě). Pojďme tedy zkušebně provést náhradu N za I.

Text se nám postupně doplňuje, a i když se některá slova zdají být patrná, stále ještě nelze s určitostí říci, zda se ve svém pátrání vydáváme správným směrem. Jeden fakt byl při našem hledání opomenut. Je to (dokonce druhé nejpočetnější) písmeno šifrové abecedy F. Jeho čestnost je tak vysoká, že si již nemůžeme dovolit jej ignorovat. Ale které písmeno otevřené abecedy doplnit? Máme již obsazena písmena otevřené abecedy až do šesté pozice. To vypadá velmi zvláštně až do okamžiku, kdy si uvědomíme, že jsme si nebyli jisti u dvou písmen s podobnou četností a tak jsme zkoušeli dosadit obě. Jednalo se o písmena A a O. Pojďme tedy zkusit za F dosadit v jedné verzi otevřeného textu písmeno O a v druhé A (vždy opačné k tomu, které jsme již dosadili v minulých pokusech).

Další k záměně se nabízí Y z šifrového textu, které by mohlo být nahrazeno dalším nejpočetnějším a zároveň nedosazeným písmenem T.

Nyní jsme dospěli k zásadnímu objevu. Soustřeďme se na chvíli na začátek poslední věty. Šifrový text Yfyt může být buď slovo „Tota“, nebo „Tato“ v otevřeném textu. Je zřejmé, že první varianta nedává smysl, proto můžeme s konečnou platností prohlásit za platnou druhou variantu. První škrtneme a nadále se budeme věnovat pouze variantě v druhém řádku. Je také velmi důležité si uvědomit, že nám z otevřeného textu tímto krokem zcela zmizelo, početním zastoupením velmi významné, písmeno N. Měli bychom tedy prozkoumat, jakému znaku šifrové abecedy ho lze nově přiřadit.

Nejvýše zastoupené ze zbývajících znaků je A. Zkusme tedy A nahradit písmenem N. Po doplnění tohoto znaku ale pozornému luštiteli neunikne fakt, že druhá věta začíná textem „N teto do_e se do de_i_“. Je velmi pravděpodobné, že máme v dosazení chybu. Přímo se nabízí, aby věta začínala „V této době…“ (nezapomeňme, že text neobsahuje diakritiku).

Pojďme tedy nyní zkusit na chvíli předpokládat, že naše substituce byl špatný krok a změňme náhradu na . Text nyní vypadá daleko lépe.

Dále zkusme trochu více analyzovat text místo dalšího doplňování. Zkopírujeme si již doplněný text na nový řádek a další doplňovaná písmena zapisujme červeně. Páté slovo první věty má aktuálně podobu „sve_o“. Pokud se postupně pokusíme doplnit jednotlivé znaky abecedy za chybějící znak, nalezneme pouze jednu nejpravděpodobnější podobu tohoto slova: „svého“. Pojďme tedy doplnit do textu substituci . Dále deváté slovo poslední věty obsahuje konstrukci „otev_e_eho“. Toto slovo nelze upravit jinak, než do tvaru „otevřeného“. Z toho vyplývá a . Třinácté a čtrnácté slovo jsou také velmi nápadné. Text „o tri _ista do_rava“ snad nelze doplnit jinak než „o tři místa doprava“. Tedy proveďme záměny a . Dále se nabízí slovo „vo_enstvi“, které vhodně nahradí slovo „vojenství“. Tedy . Nyní se již další písmena nabízejí velmi rychle. Třetí slovo druhé věty „V této do_e se do dějin“ znamená záměnu . Dále věta „V teto dobe se do dejin _r_pto_ra_fie nav_d_ _apis_je jmeno“ znamená náhrady , , . Druhá část prvního souvětí má nyní následující podobu: „_tery uziva jednodu_he sustitu_ni si_ry pri vojens_y_h tazeni_h pro _omuni_a_i mezi svymi oddi_y“. Bez výrazného zkoumání můžeme říci, že zde dojde k náhradám , , a . Poslední části substituce odvodíme ze slov „krypto_rafie“ a „s_ocivala _ posunu abecedy te_tu o tri mista“. Odtud poslední záměny , , a .

Download 4.04 Mb.

1 ... 78 79 80 81 82 83 84 85 86

Download 4.04 Mb.