Přejít na hlavní obsah

Budování škálovatelného datového potrubí pro Momspresso: Posílení personalizace obsahu

·3 min

V neustále se vyvíjejícím digitálním prostředí potřebují obsahové platformy jako Momspresso robustní datovou infrastrukturu pro poskytování personalizovaných zážitků svým uživatelům. Dnes se s vámi rád podělím o poznatky o škálovatelném datovém potrubí, které jsme vybudovali pro Momspresso a které pohání jejich analytické a doporučovací systémy.

Výzva #

Momspresso potřebovalo systém, který by dokázal:

  1. Zachytit uživatelské události v reálném čase
  2. Efektivně zpracovávat a ukládat velké objemy dat
  3. Umožnit rychlou analýzu a vizualizaci chování uživatelů
  4. Podporovat doporučovací engine pro personalizované doručování obsahu

Naše řešení: Komplexní datové potrubí #

Navrhli jsme vícekomponentní datové potrubí, které řeší tyto potřeby:

1. Python Events SDK #

Vyvinuli jsme jednoduchou Python třídu, kterou lze integrovat napříč kódem Momspressa. Toto SDK umožňuje systému odesílat události bez psaní základního kódu, což vývojářům usnadňuje sledování interakcí uživatelů.

2. Webová služba událostí #

Tato služba přijímá události z SDK a po menší validaci je odesílá do Kafky. Slouží jako vstupní bod pro všechna data o interakcích uživatelů.

3. Apache Kafka #

Jako náš systém pro zprostředkování zpráv a pub-sub jsme zvolili Kafku pro její vysokou propustnost a odolnost proti chybám. V současné době běží na jednom stroji a je připravena škálovat, jak Momspresso poroste.

4. Systém zachycení dat #

Tato komponenta naslouchá všem událostem z Kafky a vkládá je do databáze PostgreSQL. Využitím JSON schopností Postgresu jsme vytvořili flexibilní a dotazovatelný dataset.

5. PostgreSQL úložiště událostí #

Naše primární úložiště dat pro všechny události. Implementovali jsme systém měsíční archivace pro efektivní správu úložiště.

6. Grafana pro analýzu v reálném čase #

Připojená k našemu úložišti událostí umožňuje Grafana Momspressu graficky zobrazovat dotazy v reálném čase, sledovat využití funkcí, monitorovat výkon konverzí a detekovat anomálie.

7. Systém datových pohledů #

Tato komponenta spouští sérii heuristik a modelů k definování atributů uživatelů, aktualizujíc samostatnou databázi uživatelských pohledů.

8. PostgreSQL databáze datových pohledů #

Tato databáze ukládá zpracované uživatelské pohledy, umožňující rychlý přístup k odvozeným uživatelským datům.

9. Metabase pro dashboardy #

Pomocí databáze datových pohledů umožňuje Metabase Momspressu vytvářet vlastní dashboardy a reporty pomocí SQL dotazů.

10. Webová služba unikátního uživatelského otisku #

Chytrá služba 1x1 pixelu, která přiřazuje unikátní podpis v cookie pro každého uživatele, umožňující nám sledovat uživatele napříč relacemi.

Síla tohoto potrubí #

Toto datové potrubí posiluje Momspresso několika způsoby:

  1. Poznatky v reálném čase: Momspresso nyní může sledovat chování uživatelů a výkon obsahu v reálném čase.
  2. Personalizace: Strukturovaná uživatelská data umožňují sofistikované algoritmy doporučování obsahu.
  3. Flexibilní analýza: S daty uloženými v dotazovatelných formátech může Momspresso snadno provádět ad-hoc analýzy.
  4. Škálovatelnost: Modulární design umožňuje škálování nebo nahrazení jednotlivých komponent podle potřeby.

Pohled do budoucna #

S tím, jak Momspresso nadále roste, bude toto datové potrubí hrát klíčovou roli v porozumění chování uživatelů a poskytování personalizovaných zážitků. Jsme nadšeni, že uvidíme, jak Momspresso využije tuto infrastrukturu k vylepšení své platformy a efektivnějšímu zapojení své komunity.

Zůstaňte naladěni na náš příští příspěvek, kde se ponoříme do doporučovacího systému postaveného na tomto datovém potrubí!