Bigram

Technology
12 hours ago
8
4
2
Avatar
Author
Albert Flores

Bigram či digram je posloupnost dvou sousedících prvků v řetězci tokenů, typicky písmen, slabik nebo slov. Bigram je n-gram pro n=2. Frekvenční distribuce každého bigramu v řetězci se běžně používá pro jednoduchou statistickou analýzu textu v mnoha aplikacích včetně počítačové lingvistiky, kryptografie, rozpoznávání řeči a podobně.

Využití

Bigramy jsou používány v nejúspěšnějších jazykových modelech pro rozpoznávání řeči. Jsou speciálním typem n-gramu.

Bigramové frekvenční útoky mohou být použity v kryptografii k luštění kryptogramů.

Bigramová frekvence je jedním ze způsobů statistické jazykové identifikace.

5 min read
Share this post:
Like it 8

Leave a Comment

Please, enter your name.
Please, provide a valid email address.
Please, enter your comment.
Enjoy this post? Join Cesko.wiki
Don’t forget to share it
Top