Dane w czasie rzeczywistym
Real-Time Data to zagadnienie warte uwagi, ponieważ wpisuje się w strategiczne kierunki wielu organizacji. Raporty branżowe (Forrester, Boston Retail Partners) wskazują, że Real-Time Data jest podstawą i jednocześnie warunkiem rozwoju m.in. całego sektora retail. Poniżej wyjaśniamy, co kryje się za tym terminem w teorii i praktyce.
Krótki przegląd definicji
Techopedia.com definiuje dane w czasie rzeczywistym jako:
dane, które są przekazywane użytkownikowi końcowemu tak szybko, jak zostały zebrane.
Według HVR (jednego z producentów rozwiązań do przetwarzania danych w czasie rzeczywistym):
dane w czasie rzeczywistym są natychmiast kopiowane do jednego lub więcej miejsc docelowych, gdzie będą przechowywane i udostępniane natychmiast po ich wygenerowaniu.
Słownik Cambridge Dictionary wskazuje, że dane w czasie rzeczywistym to:
dane, które są przesyłane i/lub udostępniane natychmiast po ich otrzymaniu i/lub wygenerowaniu.
Nie omawiając dalej powyższych definicji, warto zaznaczyć, że każda z nich opiera się na założeniu, że po wygenerowaniu i/lub zapisaniu danych są one natychmiast przetwarzane. Cele i konteksty takiego przetwarzania mogą być różne i, co ważne, nie wykluczają się wzajemnie.
Wdrożenie danych w czasie rzeczywistym w organizacji
Real-Time Data to możliwość dostępu do zawsze aktualnych danych, niezależnie od miejsca i sposobu ich przetwarzania. Wdrożenie opiera się najczęściej na rozwiązaniach określanych jako Real-Time Data Replication, Real-Time Data Processing, Real-Time Data Integration, np. HVR, Oracle GoldenGate. Narzędzia tej klasy umożliwiają replikację danych w czasie rzeczywistym (z 1-2 sekundowym opóźnieniem) pomiędzy różnymi biznesowymi i technologicznymi platformami IT (rysunek poniżej, źródło: hvr-software.com).
Ważną funkcjonalnością jest modyfikacja danych w trakcie replikacji, np. w celu tworzenia raportów, a także testowanie spójności danych pomiędzy środowiskiem źródłowym i docelowym z możliwością automatycznej korekty.
Podsumowując, mechanizmy replikacji danych w czasie rzeczywistym umożliwiają nieograniczony dostęp do zawsze aktualnych danych produkcyjnych, niezależnie od lokalizacji geograficznej, w której są generowane i przetwarzane. Co to oznacza dla biznesu i praktyki IT? Jaki jest potencjał biznesowy i techniczny tej klasy rozwiązań?
Biznesowy kontekst wykorzystania danych w czasie rzeczywistym
Załóżmy, że raportowanie danych w organizacjach odbywa się według dwóch modeli:
użytkownicy pozyskują dane bezpośrednio z systemów źródłowych, w których dane są przetwarzane
użytkownicy pozyskują dane z systemów raportowych zasilanych danymi z systemów źródłowych, w których dane są przetwarzane.
Pierwszy model zapewnia użytkownikom dostęp do zawsze aktualnych danych (o ile spełniony jest warunek danych w czasie rzeczywistym), ale tylko w kontekście poszczególnych systemów, co jest istotnym ograniczeniem w przypadku konieczności analizy danych pochodzących z różnych źródeł. Bardzo istotna jest również wydajność i stabilność działania systemów źródłowych, które w tym modelu często ulegają awariom w wyniku obciążenia procesami raportowania, przerywając ciągłość procesów biznesowych i generując straty biznesowe.
Klasyczne scentralizowane systemy raportowe zasilane są danymi w interwałach czasowych, często dziennych (ten drugi model). Umożliwiają one dostęp do wszystkich lub wybranych danych organizacji, co rozwiązuje ograniczenia pierwszego modelu, ale nie zapewnia dostępu do rzeczywistych danych (ze względu na interwały zasilania).
Zastosowanie replikacji danych w czasie rzeczywistym zapewnia, że po każdej operacji w systemie źródłowym, dane są automatycznie przenoszone do "innej lokalizacji", która posłuży jako podstawa do raportowania, przy jednoczesnym zachowaniu spójności danych z systemem źródłowym. Jeden z możliwych przykładów takiej architektury przedstawia poniższy rysunek (źródło: hvr-software.com).
Takie podejście skraca czas przetwarzania danych, zmniejsza ryzyko ich niedostępności w wyniku "ciężkich" awarii i czasochłonnego przetwarzania (wykonywanego głównie w nocy), a także zapewnia dostęp do zawsze aktualnych danych.
Dla organizacji, dla których dostęp do danych odświeżanych online nie jest kluczowy, korzyścią jest skalowalna i wydajna architektura oraz mechanizmy przetwarzania danych w czasie rzeczywistym, które zapewniają wysoką dostępność i spójność danych oraz optymalizują procesy operacyjne związane z przetwarzaniem danych. Warto mieć na uwadze, że rynek jest bardzo dynamiczny, a dostęp do danych w czasie rzeczywistym już wkrótce może okazać się nie tyle pomocny dla organizacji, które obecnie go nie potrzebują, co absolutnie niezbędny z perspektywy rozwoju biznesu i utrzymania konkurencyjności.
Przetwarzanie danych w czasie rzeczywistym umożliwia śledzenie operacji biznesowych online, a także podejmowanie decyzji i inicjowanie różnego rodzaju procesów biznesowych w oparciu o aktualny "obraz biznesu". To nie tylko wygoda, ale też często źródło przewagi konkurencyjnej. Kilka przykładów:
- Handel detaliczny: śledzenie sprzedaży i zapasów we wszystkich punktach sprzedaży, niezależnie od ich lokalizacji geograficznej, umożliwia dynamiczne zarządzanie kampaniami marketingowymi - marketing w czasie rzeczywistym;
- Bankowość: centralizacja i przetwarzanie online danych klientów i wszystkich operacji związanych z klientami pozwala obniżyć koszty obsługi klienta, podnieść jakość usług, spersonalizować produkty skierowane do klientów w czasie rzeczywistym - sprzedaż w czasie rzeczywistym;
- Finanse: przesyłanie danych online do systemów antyfraudowych zmniejsza poziom oszustw;
- Medycyna: synchronizacja online kalendarzy wizyt lekarskich umożliwia lekarzom efektywne wykorzystanie czasu pracy;
- Logistyka: precyzyjne monitorowanie łańcucha dostaw umożliwia jego optymalizację, szybkie reagowanie na incydenty i ograniczanie strat z nimi związanych;
- Transport: synchronizacja systemów planowania lotów/tras w czasie rzeczywistym.
Poniżej przedstawiono różnorodność środowisk, z których i do których można replikować dane (źródło: hvr-software.com).