Lemma (lingvistika)

Technology
12 hours ago
8
4
2
Avatar
Author
Albert Flores

V lingvistice lemma (též lema, mn. č. lemmata) označuje * základní podobu (alolex) lexému (tedy slova nebo fráze), která se uvádí jako reprezentativní ve slovnících (slovníkový tvar), nebo * souhrn všech tvarů určité lexikální jednotky (lexému) reprezentovaný jejím základním (heslovým) tvarem (lemmatem v předchozím významu)

V textové analýze se každý konkrétní tvar daného lemmatu označuje jako typ, každá konkrétní realizace slova se nazývá token.

Např. Ve větě Netrpěliví zákazníci stáli v obchodě i před obchodem, ovšem před obchodem jich čekalo jen několik. +more se k lemmatu obchod vyskytují tři tokeny dvou typů (obchodě, obchodem).

Poměrem typů a tokenů lze přibližně odhadnout jazykovou bohatost textu (která je ovšem ovlivněna také délkou a specifikací textu).

Ve funkčním generativním popisu (FGP) se rozlišuje morfologické (syntaktické) m-lema od tektogramatického (sémantického) t-lematu.

V češtině se jako slovníkový tvar zpravidla používá: * pro substantiva nominativ singuláru; * pro adjektiva nominativ singuláru pozitivu mužského rodu - obdobně též pro zájmena a číslovky; * pro slovesa infinitiv aktiva (z hlediska slovesného vidu není lemma jednoznačně definováno); * pro příslovce pozitiv (1. stupeň); * pro předložky nevokalizovaný tvar; * pro ostatní slovní druhy je lemma shodné s jediným tvarem.

V jiných jazycích může být konvence pro výběr lemmatu odlišná. V latině se za verbální lemma považuje první osoba singuláru přítomného času, případně třetí osoba u neosobních sloves jako kupř. +more ningit (sněží).

Nástroj (např. počítačový program), který určitému tvaru slova přiřadí jeho lemma, se nazývá lemmatizátor.

Reference

Externí odkazy

Kategorie:Lexikografie

5 min read
Share this post:
Like it 8

Leave a Comment

Please, enter your name.
Please, provide a valid email address.
Please, enter your comment.
Enjoy this post? Join Cesko.wiki
Don’t forget to share it
Top