Příloha AK Ukázka frekvenční analýzy




Download 4.04 Mb.
bet83/86
Sana10.04.2017
Hajmi4.04 Mb.
#3699
1   ...   78   79   80   81   82   83   84   85   86

Příloha AK
Ukázka frekvenční analýzy


Nejprve je třeba určit pro daný jazyk četnost jednotlivých znaků. Pokud budeme mluvit o frekvenční analýze českého jazyka, budeme pracovat pouze s abecedou bez rozlišení velkých a malých písmen a bez diakritiky. Usnadníme si tím odečítání výsledků a pro tuto ukázku nám takto zjednodušená sada znaků poslouží nejlépe.

Pro text, ze kterého odvodíme četnost znaku je lépe zvolit text dostatečně dlouhý a nejlépe, pokud se bude shodovat se zkoumaným textem svou podobou – tedy oba texty ze stejné doby, užívající stejné nářečí, stejnou abecední sadu apod. V naší ukázce jsme zvolili pro odečtení četností knihu Karla Čapka, Dášenka čili život štěněte. Takto analyzovaný vzorek obsahoval celkem 29455 znaků, což by mělo být dostatečné množství pro co nejpřesnější určení statistického zastoupení jednotlivých znaků v našem jazyce. Text byl převeden do podoby bez diakritiky – viz abeceda Graf .

V případě, že by si čtenář chtěl podobný vzorek připravit sám, lze stáhnout vybranou knihu např. na stránkách Městské knihovny v Praze (http://www.mlp.cz/cz/), kde v době psaní této práce lze nalézt rozsáhlé množství elektronických knih různých autorů v různých formátech. Takto získaný text je možné převézt do podoby bez diakritiky například na http://textmod.pavucina.com/odstraneni-diakritiky. Pro zjišťování četností v rámci frekvenční analýzy, ale i experimentování v různých jiných oblastech kryptografie, doporučuji program CrypTool 2, který lze stáhnout na stránkách http://www.cryptool.org/en/.
Graf : Frekvenční analýza zastoupení českých znaků v díle Karla Čapka, Dášeňka čili život štěněte, řazeno abecedně


Download 4.04 Mb.
1   ...   78   79   80   81   82   83   84   85   86




Download 4.04 Mb.

Bosh sahifa
Aloqalar

    Bosh sahifa



Příloha AK Ukázka frekvenční analýzy

Download 4.04 Mb.