Extrakce informací

Technology
12 hours ago
8
4
2
Avatar
Author
Albert Flores

Extrakce informací (anglicky information extraction; IE) je typ vyhledávání informací, jehož cílem je automaticky vypsat strukturované nebo polostrukturované informace z nestrukturovaných strojově čitelných dokumentů.

Typickým příkladem IE je skenování sérii dokumentů napsaných v přirozeném jazyce a se získanými informacemi zaplnění databáze. Aktuální přístup k IE využívá techniky zpracování přirozeného jazyka, ta těží na velmi omezených oblastech. +more Například Message Understanding Conference (MUC) je mítinkově založená konference, která se soustředí na oblasti v minulosti: * MUC-1 (1987), MUC-2 (1989): Zpráva námořní operace. * MUC-3 (1991), MUC-4 (1992): Terorismus v zemích latinské Ameriky. * MUC-5 (1993): Spojení spekulací a mikroelektronické oblasti. * MUC-6 (1995): Novinky ve změnách managementu. * MUC-7 (1998): Záznam vypuštění satelitu.

Typické podúkoly IE jsou:

* Rozpoznávání pojmenovaných entit: rozpoznávání jmen (lidé a organizace), názvy míst, časové vyjádření, a určitý typ číselných výrazů. * Určení koreference: identifikace řetězu jmenných frází, které odkazují na identický objekt.

Reference

5 min read
Share this post:
Like it 8

Leave a Comment

Please, enter your name.
Please, provide a valid email address.
Please, enter your comment.
Enjoy this post? Join Cesko.wiki
Don’t forget to share it
Top