FrameNet

Technology
12 hours ago
8
4
2
Avatar
Author
Albert Flores

FrameNet je projekt, který se zabývá sémantickou analýzou a organizací slovních významů ve větách v rámci snahy vybudovat univerzální systém pro znalostní zpracování přirozeného jazyka. Projekt vznikl na americké univerzitě University of California v Berkeley a byl založen v roce 1997 Charlesem J. Fillmorem. Jeho hlavním cílem je popsat významy a vztahy mezi slovy prostřednictvím takzvaných "rámcových sémantických struktur". FrameNet vytváří otevřenou a dostupnou databázi, která obsahuje příklady vět, slovních spojení a významů, jež jsou uspořádány do sémantických rámů. Tyto rámce nezahrnují jen významovou existenci slov, ale také rozmanité větné struktury, vyjádření, slovní tvary a další příklady přirozeného jazyka. Databáze je neustále aktualizována a rozšiřována, a to za účelem pokračujícího zlepšování automatického rozpoznávání sémantického obsahu ve větách. FrameNet využívá klasifikaci různých jazykových jevů do sémantických rámců, které zahrnují základní rámce (např. "Činnost", "Změna stavu", "Příčina", "Vztahy"), specifické oblasti (např. "Sociální život", "Právní termíny", "Potraviny a pití") a též individuální koncepty, jako jsou přídavná jména nebo slovní spojení. Tato struktura umožňuje lepší porozumění významům slov a jejich interakcím ve větách. FrameNet nachází uplatnění především v oblasti počítačové lingvistiky a strojového učení. Zpracování přirozeného jazyka je složitý úkol a FrameNet poskytuje užitečný základ pro vytváření automatických systémů, které se specializují na analýzu textů a porozumění jejich významu. Výsledky projektu lze uplatnit například v automatickém překladu, vyhledávání nebo ve vývoji umělé inteligence. Pro český jazyk je FrameNet dostupný v podobě specializované české verze, která obsahuje výběr českých větných konstrukcí, slov a významů. Tento jazykový korpus je unikátním zdrojem informací pro češtinu a lze jej využít při výzkumu českého jazyka, strojového překladu, rozpoznávání řeči a dalších aplikacích zpracování přirozeného jazyka.

FrameNet je výzkumný a vývojový projekt založený Charlesem J. Fillmorevem roce 1997 na Mezinárodním institutu počítačových věd (International Computer Science Institute -⁠ ICSI) v Berkeley v Kalifornii, který vytvořil elektronický zdroj založený na teorii významu zvané sémantika rámců.

Data, která FrameNet analyzoval, ukazují, že věta "John prodal auto Mary" v podstatě popisuje stejnou základní situaci (sémantický rámec) jako "Mary koupila auto od Johna", jen z jiného úhlu pohledu. Sémantický rámec je pojmová struktura popisující událost, vztah nebo objekt spolu s jeho účastníky. +more Lexikální databáze FrameNet obsahuje více než 1 200 sémantických rámců, 13 000 lexikálních jednotek (spojení slova s významem; víceslovná slova jsou zastoupena několika lexikálními jednotkami) a 202 000 příkladových vět. Teorie rámcové sémantiky a síť FrameNet měla vliv na lingvistiku a zpracování přirozeného jazyka, kdy pomohly k řešení úlohy automatického označování sémantických rolí.

=== Jazyková dostupnost === FrameNet vznikl pro angličtinu, vznikly však další jazykové mutace pro následující jazyky: francouzština, čínština, brazilská portugalština, němčina, španělština, japonština, švédština, korejština. Vznikly i neoficiální FrameNety pro lotyštinu a hebrejštinu. +more ICSI pracuje na FrameNetu, který by rámcově označoval sémantické významy napříč jazyky.

Odkazy

[url=https://framenet.icsi.berkeley.edu/fndrupal/]Stránka FrameNet[/url]

Reference

Kategorie:Vzniklo 1997 Kategorie:Korpusová lingvistika

5 min read
Share this post:
Like it 8

Leave a Comment

Please, enter your name.
Please, provide a valid email address.
Please, enter your comment.
Enjoy this post? Join Cesko.wiki
Don’t forget to share it
Top