GitHub je platforma pro správu verzí a spolupráci na kódu, která využívá systém GIT.
Data compression (komprese dat) je proces, který slouží ke zmenšení velikosti dat s cílem ušetřit místo na disku a zrychlit přenos dat.
Apache Spark je open-source framework pro zpracování velkých dat, který umožňuje rychlé zpracování a analýzu dat v reálném čase.
Gzip je software pro kompresi dat, který byl vyvinut v roce 1992, a jeho hlavním cílem je snížit velikost souborů pro efektivnější přenos po síti nebo úložný prostor.