Čo je dolovanie dát?

Veľké spoločnosti o vás vedia viac, ako ste si dokázali predstaviť - tu je návod

Dolovanie dát je analýza veľkého množstva údajov na objavovanie vzorov a poznatkov. V skutočnosti je vyhľadávanie údajov známy aj ako zisťovanie údajov alebo zisťovanie vedomostí.

Výskum dát využíva štatistiky, princípy strojového učenia (ML), umelú inteligenciu (AI) a obrovské množstvo dát (často z databáz alebo súborov údajov), aby sa identifikovali vzory spôsobom, ktorý je čo najprístupnejší a čo najužitočnejší.

Čo robí dolovanie dát?

Výskum dát má dva základné ciele: popis a predikciu. Po prvé, dolovanie dát opisuje poznatky a poznatky získané analýzou modelov v údajoch. Po druhé, dolovanie dát využíva opisy rozpoznaných vzorov údajov na predpovedanie budúcich vzorov.

Napríklad, ak ste prehliadali čas na internetových stránkach nákupov o knihách o tom, ako identifikovať rôzne typy rastlín, služby dolovania dát pracujúce za zákulisím na tejto webovej stránke zaznamenávajú popis vašich vyhľadávaní v súvislosti s vaším profilom. Po opätovnom prihlásení o dva týždne neskôr služby pre vyhľadávanie údajov používajú opisy vašich predchádzajúcich vyhľadávaní na predpovedanie vašich aktuálnych záujmov a ponúkajú personalizované odporúčania pre nákup, ktoré obsahujú knihy o identifikácii rastlín.

Ako pracuje dolovanie dát

Mining údajov funguje pomocou algoritmov, súborov inštrukcií, ktoré informujú počítač alebo proces, ako robiť úlohu, objavovať rôzne typy vzorov v rámci dát. Niektoré z rôznych metód rozpoznávania vzorov používaných pri získavaní údajov zahŕňajú klastrovú analýzu, detekciu anomálií, združené učenie, závislosti údajov, rozhodovacie stromy, regresné modely, klasifikácie, detekciu odlevu a neurónové siete.

Zatiaľ čo dolovanie dát môže byť použité na popísanie a predvídanie vzorov vo všetkých rôznych druhoch údajov, použitie mnohých ľudí sa stretáva najčastejšie, aj keď si to neuvedomujú, je opísať vzorce vo vašom nákupnom výbere a správaní, ktoré predpovedajú pravdepodobné budúce nákupy rozhodnutie.

Ako príklad ste už niekedy premýšľali nad tým, ako sa Facebook vždy zdá, že vie, čo ste pozerali on-line a zobrazuje vám reklamy vo vašom príspevku o novinkách súvisiacich s inými navštívenými stránkami alebo s vyhľadávaním na webe? Využívanie údajov Facebooku využíva informácie uložené vo vašom prehliadači, ktoré sledujú vaše aktivity, ako napríklad súbory cookie , spolu s vlastnými znalosťami vašich modelov na základe predchádzajúceho používania služby Facebook, aby ste mohli zistiť a predvídať produkty alebo ponuky, ktoré vás môžu zaujímať.

Aký druh údajov je možné získať?

V závislosti na službe alebo obchode (fyzické obchody používajú aj dolovanie dát) je možné vyťažiť prekvapujúce množstvo údajov o vás a vašich vzorkách. Zozbierané údaje o vás môžu obsahovať typ vozidla, kam cestujete, kde žijete, miesta, ktoré ste cestovali, časopisy a noviny, na ktoré sa prihlasujete a či ste alebo nie ste ženatí. Môžete tiež určiť, či máte alebo nemáte deti, aké sú vaše koníčky, ktorá kapela sa vám páči, vaše politické sklony, to, čo kupujete online, čo nakupujete vo fyzických obchodoch (často prostredníctvom kariet odmeny zákazníkov) a akékoľvek podrobnosti, ktoré zdieľate o svojom živote na sociálnych médiách.

Napríklad maloobchodníci a módne publikácie zamerané na teenagerov používajú pohľady na fotografie z dolovania dát v službách sociálnych médií, ako je Instagram a Facebook, aby predpovedali módne trendy, ktoré budú lákať u zákazníkov alebo čitateľov. Nálezy objavené prostredníctvom získavania údajov môžu byť také presné, že niektorí predajcovia môžu dokonca predpovedať, či žena môže byť tehotná, na základe veľmi špecifických zmien v jej rozhodovaní o nákupe. Predajca Target je údajne taký presný pri predpovedaní tehotenstva založeného na modeloch pri kúpe histórie, že odošle kupóny na detské výrobky mladým dámam a odviedla tajomstvo o tehotenstve skôr, ako povedala svojej rodine.

Data mining je všade, ale väčšina informácií objavených a analyzovaných o našich nákupných návykoch, osobných preferenciách, voľbách, financiách a on-line aktivitách využívajú obchody a služby s cieľom zvýšiť zážitok zákazníkov.