Takmer nikto z nás si neuvedomuje, aké veľké množstvo dát o nás koluje cez internet. Mobilní operátori, banky alebo e-shopy – tí všetci sledujú naše správanie a zbierajú o nás dáta, medzi ktorými je i množstvo veľmi dôležitých informácií. Tie nám môžu výrazne uľahčiť život, teda za predpokladu, že sa vie, ako s nimi ďalej narábať.

Vezmime si ako príklad leteckú spoločnosť, s ktorou bežne lietate na dovolenku či jazykové pobyty. V prípade, že si kúpite letenku do oblasti, ktorá je z určitého pohľadu pre vás netypická, táto spoločnosť vás upozorní na niektoré dôležité aspekty súvisiace s cestou, o ktorých možno neviete. Môžu to byť odlišné rozmery batožiny, víza, cudzia mena alebo skoršie dostavenie sa na letisko.

Na podobnom princípe fungujú napríklad aj analýzy v nákupných košíkoch e-shopov. „Sledovanie, ako často ktorý tovar a za akých podmienok ľudia nakupujú, je kľúčové pre obojstrannú spokojnosť a budovanie zákazníckej vernosti,“ objasňuje Dagmar Bínová, Big Data Science Leader z Adastry, ktorá sa už dlhšie obdobie zaoberá pokročilou analytikou. Navyše sa v tomto akademickom roku podieľa na odbornom cykle prednášok spojených s touto témou na Vysokej škole ekonomickej v Prahe.

Časopis Studenta s Dagmarou Bínovou na tému práca s big data pripravil rozhovor.

Dáša, čo vlastne znamenajú big data? Ako by ste ich predstavili úplnému laikovi?

O big data hovoríme jednoducho vtedy, keď máme k dispozícii veľa dát. Slovo „veľa“ je ale relatívne, lebo sa mení v čase. Je preto potrebné doplniť podmienku kontinuálneho vzniku nových dát. Tieto dáta zároveň nie sú typicky štruktúrované (preto nie je možné z nich vytvoriť hocikedy tabuľky a grafy). Pre ďalšie využitie je väčšinou potrebné ich transformovať špecifickým spôsobom. Vznikajú interakciou človeka so strojom (napríklad keď klient vyberá peniaze z bankomatu) alebo interakciou stroja so strojom (telefón sa pravidelne prihlasuje k mobilnej sieti).

Na čo možno tieto dáta používať?

Big data v dnešnej dobe slúžia napríklad k monitoringu: ich vyhodnocovaním možno zistiť, ako napríklad na veľkom predajnom portáli ľudia nakupujú a či na webe všetko funguje. Firmy ich nenechávajú ležať ladom, ich zbieranie, ukladanie a príprava na spracovanie sú však náročné. Kľúčové je pri nich tiež ich prepojenie s inými systémami, predovšetkým s takými, ktoré zabezpečujú komunikáciu s klientom, ich využitie tak môže byť veľmi efektívne a pre spoločnosť veľmi prínosné.

Môžete uviesť konkrétny príklad?

Keďže big data netvoria iba klasické čísla, ale zároveň rôzne logy, transakcie, signálne dáta, dáta zo senzorov, texty, obrázky, hlasy či videá, je ich využiteľnosť možná prakticky v akejkoľvek oblasti. Najväčšie využitie nachádzajú najmä vo finančnej sfére, zdravotníctve a v e-commerce. Nesmieme však zabúdať ani na priemysel, kde je vďaka automatizácii a robotizácii výroby celá hromada dát sledujúca predovšetkým kvalitu výroby. Cenné big data majú tiež telekomunikační operátori, keďže vďaka lokalizáciám mobilných telefónov môžu identifikovať miesta, na ktorých je povedzme nezvyčajne vysoký výskyt zákazníkov – napr. hudobný festival – a následne môžu reagovať napríklad dynamickou rekonfiguráci­ou siete.

Nejde tak trochu o špehovanie zákazníka?

Ak firmy pracujú so svojimi dátami obozretne a dodržujú zákonom stanovené rámce, potom to, naopak, môže poslúžiť dobrej veci a spoločnosti tak môžu zefektívniť množstvo procesov a neraz aj ľuďom uľahčiť život.

Čo ďalšie sa dá pomocou veľkých dát zistiť?

Z veľkých dát môžeme získať množstvo popisov skutočných situácií a udalostí, ktoré sa stali v minulosti. Môžeme zisťovať, čo spôsobilo rôzne výkyvy a zmeny stavu a môžeme ich tak použiť k predikcii stavov, ktoré v budúcnosti môžu nastať. Čo je pre nás najdôležitejšie – môžeme ich zároveň využiť aj k inteligentným návrhom. To sa už v súčasnosti deje, napríklad ak používate navigáciu Google, tak tá vám s ohľadom na okamžitú zmenu situácie na vašej plánovanej trase takmer ihneď odporučí inú cestu. Podobne to takto môže fungovať i s ktoroukoľvek ďalšou chytrou vecou – chladničkou, domom či autom. Big data a IoT (internet vecí) majú teda k sebe veľmi blízko.

Čo konkrétne robíte v tomto smere v Adastre?

Našou doménou je business intelligence (BI) a naše riešenie je hodnotné prirodzeným a postupným vývojom. V ideálnom prípade si tak obe strany môžu v menšom meradle vyskúšať, že všetko funguje, ako má. To znamená, že si zákazník stíha zaškoliť a pripraviť svoj tím obsluhy pre nové technológie a vie ich tiež využiť pre biznis. Preferujeme teda najprv dodávať laboratórne riešenie, vyskúšať na ňom reálne využitie big data pre nejakú špecifickú oblasť a až následne prechádzame k veľkému systematickému zavádzaniu a integrácii s ostatnými systémami. Práve preto, že naše skúsenosti s big data sú bohaté, sme v našom regióne na špičke.

Dokážu sa u vás uplatniť aj mladí ľudia?

Samozrejme. Na našich skúsenostiach so študentmi a mladými absolventmi je pozitívne predovšetkým to, že majú chuť sa učiť, chcú študovať a podieľať sa na inovatívnych postupoch. Neboja sa skúšať nové veci, nie sú zaťažení skúsenosťami tradičných riešení. Na druhej strane nám niekedy u týchto ľudí chýbajú skúsenosti z tradičných BI projektov – ukazuje sa to predovšetkým pri úlohách integrácie big data s ďalšími systémami. Preto musíme naše tímy vyvažovať a skladať z rôzne skúsených pracovníkov.

Od októbra 2017 ste zahájili sériu prednášok o problematike big data (DS & BI Academy) na VŠE. Prečo?

Dôvodov na to máme viacero. V prvom rade nám záleží na tom, aby sme dodávali zákazníkom riešenia, čiže aby technológie pomohli biznisu. Potrebujeme preto v tíme ľudí, ktorí majú určitý presah od technológií k potrebám zákazníka, alebo ľudí, ktorí vedia pomenovať technické požiadavky tak, aby ich spoločnosť fungovala efektívne. Toto prelínanie oboch svetov je pomerne dôležité pre úspešné realizácie projektov v BI, a teda potrebujeme edukovaných kolegov nielen na našej strane, ale aj na tej druhej – u zákazníka. Ukazuje sa, že aktuálne je takých ľudí vo všeobecnosti nedostatok, a tak je potrebné spraviť niečo pre to, aby zo škôl vychádzali absolventi s potrebným vzdelaním pre súčasnosť. Profil absolventa Vysokej školy ekonomickej je Adastre veľmi blízky, a tak padla voľba práve na túto inštitúciu.

Tento program je výberový, podľa čoho vyberáte študentov?

Študenti museli absolvovať vstupný písomný test, splniť podmienku absolvovania niekoľkých predmetov (databázy, analýza a návrh informačných systémov, business intelligence alebo základy BI) a následne prejsť výberovým konaním. Celý prijímací proces bol zastrešený KIT FIS VŠE. Pre nás je dôležité, aby študenti boli schopní pracovať v tíme a boli schopní dodať projekt praktickej realizácie. Nejde preto o to, že by všetci študenti museli mať rovnaké znalosti a motiváciu, ale mali by byť ako tím schopní pokryť ako technicky, tak aj biznisovo orientované časti projektu.

V čom sa váš kurz líši od bežnej výučby na univerzite?

Kurz je vedený lektormi s praxou a veľkú časť kurzu venujeme tomu, aby sme so študentmi zdieľali naše skúsenosti, postrehy a diskutovali o tom, ako sa veci v reálnom svete robia. A tiež, aby mali možnosť si to na ilustratívnom projekte vyskúšať. Cieľom je, aby sa študenti čo najviac priblížili reálnemu prostrediu praxe.

Na otázky odpovedala: Dagmar Bínová, Big Data Science Leader, Adastra

Zdroj: Studenta (11/2017), samostatný článok