Ei se data, vaan miten sitä käytetään

download

Olen parin viime vuoden ajan seurannut kiinnostuneena Big Datan ympärillä vellovaa hypeä, joka nousee ja laskee eri aloilla vuoroveden lailla. Joidenkin mielestä se ratkaisee kaikki maailman ongelmat aina nälänhädästä Yhdysvaltojen presidentin valintaan ja siihen jääkö Iso-Britannia EU:hun vai ei.

Näin laadullisen tutkijan näkökulmasta data-hype tuntuu kuitenkin hiukan erikoiselta, koska määrällisesti suurella tietomassalla ei oikein tee mitään ellei osaa kysyä oikeita kysymyksiä. Kysymyksiä, joita ei usein voi ohjelmoida tietomassasta löytymään.

Mitä voidaan tietää ja miten se tiedetään?

Who knows why people do what they do? The point is they do it, and we can track and measure it with unprecedented fidelity. With enough data, the numbers speak for themselves.- Chris Anderson, 2008, Wired.

Wired lehti on väittänyt, että kun on tarpeeksi dataa ja datapisteitä, voidaan luoda tarpeeksi korrelaatioita ymmärtääksemme mitä tahansa.

Korrelaatiot ovat kuitenkin täysin suhteellisia (ja manipuloitavissa), kuten Nick Cage varmasti myös tietää.

Screen Shot 2016-06-23 at 13.26.39
Alkuperäinen taulukko Tyler Vigen, kuvakaappaus.

Wired-lehden kommentti on kuitenkin suhteutettava omaan aikaansa. 2008 maailma oli hyvin erilainen big datan ja sen hyödyntämisen suhteen kuin nyt 2016. (Vai oliko?)

Screen Shot 2016-06-06 at 15.34.40

Määrällisesti suuri data tarjoaa aina tietyn näkökulman. Sillä voidaan vastata numeroihin keskittyviin kysymyksiin, kuten kuinka paljon ja milloin, mutta kun halutaan laadullisempaa ja kontekstirikkaampaa tietoa, muuttuu peli hiukan erilaiseksi.

Tiheää tietoa

Tricia Wang bloggasi kolmisen vuotta “tiheän datan” merkityksestä. Termi viittaa antropologiassa käytettyyn ilmaisuun tiheästä tiedosta, joka perustuu kontekstirikkaaseen analyysiin ilmiöistä ja inhimillisestä käyttäytymisestä.

Kerron esimerkin. Big datan perusteella kerätyn tiedon mukaan huomataan, että Suomessa tietyssä kaupungissa on keskivertoa enemmän iPhone6 omistajia suhteessa muihin kaupunkeihin. Alueen ikä- ja sukupuolijakauma, sekä vuositulot ovat kyseisen puhelinmallin keskiverto-omistajien tietoja vastaavia. Voidaanko tästä vetää päätelmä, että tietyn ikäiset, tiettyä sukupuoliolettamaa edustavat ja tiettyä vuosituloa nauttivat haluavat juuri iPhone6:n?

Kyllä ja ei.

Laadullisella analyysilla (toisin sanoen esimerkiksi haastatteluilla ja havainnoinnilla) voitaisiin selvittää esimerkiksi, että kyseisellä alueella vaikuttaa edelleen 1990-luvun lama-ajan perintö. Lama-ajan lapset haluavat pönkittää omaa statustaan uusimmalla ja kalleimmalla teknologialla, joka luo myös tietynlaisen paineen ja vaatimuksen samassa elämäntilanteessa oleville: iPhone6:n omistaminen onkin statuskysymys.

Status-ajatteluun taas liittyy paljon arvolatauksia, joilla on oma kulttuuriin ja yhteiskuntaan liittyvä kytkös (ks. esim. “Suomalainen maku“, 2014).

Konteksti tuo ihmisen lähelle

Pitkään trendinä ollut asiakas- ja käyttäjälähtöinen ajattelu rakastaa tarinoita. Tarinat ovat helpommin muistettavaa ja omaksuttavaa tietoa, joka vaikuttaa voimakkaasti mielikuviin, oletuksiin ja odotuksiin. Tarinat ovat sitä inhimillistä ääntä, jota on haluttu korostaa niin politiikassa, markkinoinnissa kuin tuotekehityksessä.

Kontekstuaalisessa analyysissa ihminen ja inhimillinen kokemus tarinoineen tuo lihaa big datan luiden ympärille. Aloittamalla kontekstista voidaan myös kääntää big data asetelma toisin päin: kysytään ensin miksi ja sen jälkeen hankitaan data.

 

 

 

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s