MongoDB

Technology
12 hours ago
8
4
2
Avatar
Author
Albert Flores

MongoDB (z anglického humongous, česky obrovský) je multiplatformní dokumentová databáze. Řadí se mezi NoSQL databáze a místo tradičních relačních databází využívajících tabulky používá dokumenty podobné formátu JSON (MongoDB formát nazývá BSON) a dynamické databázové schéma, které umožňuje vytváření a integraci dat pro aplikace jednodušeji a rychleji. Jedná se o open source software vydaný pod GNU Affero General Public License a Apache licencemi.

MongoDB byla původně vyvinuta softwarovou společností 10gen (nyní MongoDB Inc. +more) v listopadu 2007 jako komponenta plánovaného platforma jako služba produktu. V roce 2009 se z projektu stal opensource. 10gen nabízel komerční podporu a další služby. Od té doby bylo MongoDB implementováno jako backend řešení množstvím velikých stránek a služeb včetně stránek Craiglist, eBay, Foursquare, SourceForge, Viacom a New York Times. MongoDB je nejpopulárnější NoSQL databázový systém.

Licence a podpora

MongoDB je k dispozici zdarma pod licencí Server Side Public License (SSPL), do října 2018 bylo dostupné pod GNU Affero General Public License. Jazykové ovladače jsou dostupné pod Apache Licence. +more Dále MongoDB Inc. nabízí proprietární licence pro MongoDB.

Hlavní funkce

Mezi hlavní funkce patří: Orientace na dokumenty :Místo rozpadu bussiness subjektu do množství relačních struktur, MongoDB může ukládat bussiness subject v minimálním množství dokumentů. Například místo ukládání informace o názvu a autorovi knihy ve dvou relačních strukturách, můžou být název, autor a ostatní informace týkající se knihy v jednom dokumentu s názvem Kniha, který je více intuitivní a často se s ním lépe pracuje. +more Neobsahuje schema :Nepotřebuje a ani nemá definované jednotné schéma. Každý záznam může mít jinou strukturu bez nutnosti/možnosti zahrnout toto do návrhu schématu jak je tomu u relačních databází. Což přináší jednodužší práci při ukládání dat. Na druhou stranu ale databáze nepomáhá validovat a udržovat v datech pořádek - pokud si validaci nenapíšete sami. Ad hoc dotazy :MongoDB podporuje hledání podle pole, rozsahové dotazy a hledání podle regulárních výrazů. Dotazy mohou vracet specifická pole dokumentu a také obsahovat uživatelsky definované JavaScriptové funkce. Indexace :Jakékoliv pole v MongoDB dokumentu může být indexované (Indexy v MongoDB jsou koncepčně stejné jako ty v relačních databázích). Jsou dostupné i sekundární indexy. Replikace :MongoDB poskytuje vysokou dostupnost s pomocí sady replik (replica sets). Sada replik obsahuje dvě nebo více kopií dat. Každý člen sady replik může kdykoliv zastávat funkci primární nebo sekundární repliky. Primární replika implicitně provádí všechny čtecí a zapisovací operace. Sekundární repliky udržují kopii dat primární repliky s využitím vestavěné replikace. Když primární replika selže, sada replik automaticky provede proces výběru náhrady ze sekundárních replik. Sekundární repliky mohou také provádět čtecí operace, ale data jsou nakonec vždy konzistentní. Vyvažování zátěže :MongoDB se škáluje horizontálně pomocí shardingu. Uživatel zvolí shard klíč, který rozhodne, jak bude kolekce dat distribuována. Data se dělí na rozsahy (podle shard klíče) a jsou distribuována mezi více shardů. (Shard existuje master s jedním nebo více slave. ) :MongoDB může běžet na více serverech a vyvažovat zátěž nebo duplikovat data aby systém dále běžel v případě chyby hardwaru. Automatická konfigurace je jednoduchá na nasazení a nové počítače mohou být přidány při běhu databáze. Ukládání souborů :MongoDB může být použit jako souborový systém a tím využít vyvažování zátěže a replikace dat přes více počítačů. :Tato funkce, nazývaná GridFS, je zahrnuta v MongoDB ovladačích a jednoduše dostupná pro vývojové jazyky. MongoDB umožňuje vývojářům využívat funkce pro manipulaci souborů a obsahu. GridFS je například využit v pluginech NGINX a lighttpd. Místo ukládání souborů v jednom dokumentu, GridFS soubor rozdělí na více částí (kusů) a každou část uloží jako nezávislý dokument. :V MongoDB systému s více počítači mohou být soubory vícenásobně distribuovány a kopírovány v rámci více počítačů transparentně a tím vytvořit systém, který dokáže vyvažovat zátěž a zvládnout případné chyby.

Agregace :MapReduce na dávkové zpracování dat a agregující operace. Agregační framework umožňuje uživatelům získat stejný druh výsledků jako na který se používá SQL GROUP BY příkaz. +more Vykonávání JavaScriptu na straně serveru :JavaScript může být použit v dotazech, agregačních funkcích (jako MapReduce) a být přímo odeslán do databáze, aby se provedl. Omezené kolekce :MongoDB podporuje kolekce s omezenou velikostí a nazývá je omezené kolekce (capped collections). Tento typ kolekcí udržuje pořadí vložení a pokud je specifikovaní velikost naplněna, chová se jako kruhová fronta.

Nedostatky, úskalí

Díky svým vlastnostem má ale i určitá omezení, či nedostatky. Například:

* Neexistuje podpora pro relace mezi záznamy (inner/left/rig­ht/outer join). Je třeba si dělat ručně. +more * Špatná podpora pro transakce. * Neobsahuje pevné schema, a s tím související validaci. * Žádná referenční integrita. * Global write lock. * Žádná pokročilá správa cache, používá se disková cache z OS. * Větší spotřeba místa na HDD kvůli nutné duplicitě.

Jazyková podpora

MongoDB oficiálně podporuje velké množství populárních programovacích jazyků a vývojových prostředí. Dále také existuje velké množství neoficiálních a komunitních ovladačů.

Správa

Oficiální MongoDB nástroje

V MongoDB instalaci jsou k dispozici následující příkazy:

mongo :MongoDB nabízí interaktivní shell nazývaný mongo, který umožňuje vývojářům zobrazovat, vkládat, mazat a aktualizovat data v jejich databázi, ale také získat informace o replikaci, nastavit sharding, vypnout servery, vykonat JavaScript a mnohem více.

:Administrativní informace jsou také zpřístupněny přes webové rozhraní. Jedná se o jednoduchou webovou stránku, která poskytuje informace o současném stavu serveru. +more Implicitně je rozhraní dostupné pod portem o 1000 vyšším než databázový port (28017).

mongostat :mongostat je nástroj příkazové řádky, který zobrazí shrnující informace pro běžící MongoDB instanci: kolik vkládání, aktualizací, mazání, dotazů a příkazů bylo provedeno. Dále také informace o tom, kolik procent času byla databáze zamčena a kolik využívá paměti. +more Tento nástroj je podobný UNIXovému/LINUXovému nástroji vmstat.

mongotop :mongotop je nástroj příkazové řádky poskytuje možnost sledování kolik času MongoDB instance strávila čtením a zápisem dat. Tento nástroj je podobný UNIXovému/LINUXovému nástroji top.

mongosniff :mongosniff je nástroj příkazové řádky poskytující nízkoúrovňové sledování aktivit databáze skrze monitorování síťového provozu proudícího do a od MongoDB. mongosniff vyžaduje Libpcap síťovou knihovnu dostupnou pouze na systémech založených na UNIXu. +more Multiplatformní alternativa je Wireshark, který podporuje MongoDB síťový protokol.

mongooplog :mongooplog je jednoduchý nástroj, který spojí operace z replikačního oplogu vzdáleného serveru a aplikuje ho na lokální server.

mongofiles :mongofiles nástroj umožňuje manipulovat soubory v MongoDB instanci v GridFS objektech přes příkazovou řádku. Je převážně užitečný jako rozhraní mezi objekty ukládané na souborový systém a GridFS.

mongoimport, mongoexport :mongoimport je nástroj příkazové řádky pro import obsahu z JSON, CSV nebo TSV formátu vytvořených mongoexport nebo jako exporty nástrojů třetích stran.

mongodump, mongorestore :mongodump je nástroj příkazové řádky pro vytváření binárních exportů obsahu MongoDB databáze. mongorestore může být použit pro obnovení databáze z mongodump.

Příklady NoSQL databází

CouchDB * FoundationDB * ArangoDB

Související články

NoSQL * CAP teorém * ACID * Relační databáze * Velká data

Odkazy

Externí odkazy

Reference

Bibliografie

Kategorie:Multiplatformní software

5 min read
Share this post:
Like it 8

Leave a Comment

Please, enter your name.
Please, provide a valid email address.
Please, enter your comment.
Enjoy this post? Join Cesko.wiki
Don’t forget to share it
Top