YKSITYISYYTEEN LIITTYVÄ HUOLI VAIKUTTAA DATAN LAATUUN


Data-analytiikan luotettavuus, yksityisyyteen liittyvät huolet, joita käyttäjillä on ja datan laatu liittyvät läheisesti toisiinsa. Kyseessä on ketjureaktio: jos verkkopalvelujen käyttäjät eivät luota palveluntarjoajaan, he voivat antaa esimerkiksi vääriä tietoja itsestään. Näin datan laatu kärsii eikä data-analytiikka ole enää luotettavaa.


Yritykset keräävät tietoa käyttäjien jättämistä digitaalisista jäljistä. Käyttäjistä jää tietoa, kun he tekevät hakuja tai ostavat ja käyttävät tuotteita ja palveluita verkossa. Monet verkkopalvelujen käyttäjät kantavatkin huolta siitä, mihin heidän antamansa tiedot päätyvät tai mitä niillä tehdään.


Jos käyttäjä luottaa palveluntarjoajaan, hänellä ei ole tarvetta antaa vääriä tietoja itsestään. Luotettavuuteen vaikuttavat muun muassa palveluntarjoajan maine ja brändi.


Digitaaliset palveluntarjoajat käyttävät ensisijaisesti evästeitä, kun ne selvittävät ihmisten verkkokäyttäytymistä. Myös IP-osoitetta ja MAC-osoitetta käytetään. Tietoa saadaan myös käyttäjien sosiaalisen median profiileista.


Kun datan laatua tarkastellaan, täytyy ottaa huomioon useita tekijöitä: datan yhtenäisyys, eheys, tarkkuus ja löydettävyys. Nykyiset IT-järjestelmät eivät kuitenkaan välttämättä tunnista heikkoa dataa.


Tekoälyyn kuuluva koneoppiminen kyllä käsittelee dataa, mutta se ei pysty arvioimaan tapaa, jolla data on kerätty. Data voi teknisesti vaikuttaa virheettömältä, mutta olla laadullisesti heikkoa. Datan luotettavuus ei siis tarkoita samaa kuin täydellinen ja yhtenäinen data. Heikon datan käyttämisen riskiä voisi pienentää sillä, että määrittelee datan arviointikriteerejä uudestaan.


Datan luotettavuudella on suuri merkitys, sillä datan laatu vaikuttaa data-analytiikan luotettavuuteen. Jos datan laatu on heikkoa, myös siihen perustuvat tekoälyratkaisut ovat epäluotettavia tai heikkoja. Datan laatua tulisikin mitata kaikessa sellaisessa liiketoiminnassa, jossa data on oleellisesti mukana.

Lähde: Alamäki, A. & Mäki, M. & Chandima Ratnayake, R.M. (2019). Privacy Concern, Data Quality and Trustworthiness of AI-Analytics.https://www.fakeintelligence.fi/online-summit-2019...

Teksti: Marjo Linnasalmi