Analytiikka, evästeet ja yksityisyys (2022 Opas)

Analytiikka, evästeet ja yksityisyys

Analytiikan yksityisyyteen liittyy paljon asiaa.

Siinä tulisi tietää ainakin datanhallintaa, internetin teknologioita sekä jatkuvasti muuttuvien lakien tulkintaa.

Eli selkokielellä: Hirvittävästi vaikeita asioita, kun haluaisit vain mitata sivuston ja markkinoinnin tehoa.

Jos haluat käytännön ohjeen, että miten teet analytiikasta paremmin yksityisyyttä noudattavan, niin tämä on opas sinulle.

Huomioithan, että tätä ei ole tarkoitettu lakiavuksi, koska en ole sen alan asiantuntija. Jokaisen yrityksen tulee itse päättää miten yksityisyyslakeja soveltaa.

Käymme läpi kaiken tämän:


Sisältö:


Miksi analytiikka käyttää evästeitä? 🍪

Evästeiden päätarkoitus analytiikassa on toimia pysyvinä tunnisteina samasta käyttäjästä.

Otetaan esimerkki:

Kun menet sivustolle, jossa on Google Analytics asennettuna, niin selaimeesi tallennetaan eväste nimeltä _ga.

Tässä evästeessä on kenttä nimeltä Client ID (eli kävijän tunnus), mikä on asetettu juuri sinua varten.

Jos sitten käyt tällä sivustolla uudelleen, niin Google Analytics tarkastaa selaimesta, että onko sinulla jo tunniste olemassa.

Kaikki käyntisi tällä Client ID:llä mitataan Google Analyticsin raporteissa yhtenä samana kävijänä:

_ga-eväste ja sen Client ID pysyvät selaimessasi 2 vuotta viimeisimmästä käynnistä tai kunnes se poistetaan itse selaimesta.

Suuri osa analytiikkatyökaluista asettaa vastaavan evästeen (tosin eri nimillä).

Saman kävijän tunnistaminen ja muutkin pysyvät tunnisteet ovat nimittäin niin tärkeitä

Evästeet eivät tosin ole täydellisiä.

Mitä jos kävijän eväste poistetaan? Tai jos kävijä vain vaihtaa selainta tai laitettaan?

Evästeillä on myös vuosien myötä tullut huono maine, selaimet poistavat niitä automaattisesti, evästeitä reguloidaan lailla ja paljon käytetystä evästetyypistä (3. osapuolen eväste) ollaan kokonaan luopumassa.

Rajoitteista huolimatta evästeet ovat tällä hetkellä useimpien analytiikkatyökalujen pohja, joten niiden kanssa tulee toimia lakeja noudattaen


Analytiikan evästeet ja suostumus 🛡️

Analytiikka ja GDPR

Euroopan Unionin Yleinen tietosuoja-asetus eli GDPR toi suuria muutoksia analytiikan datan keräämiseen.

GDPR on siitä merkittävä, että se koskee kaikkia tahoja, jotka tallentavat EU:ssa asuvien henkilötietoja.

Eli siis dataa millä yksittäisen henkilön voi tunnistaa.

Sivustolle asennettu analytiikkatyökalu kerää juurikin tällaisia henkilötietoja, usein käyttämällä evästeitä.

Kuten yllä näit, niin evästeet ovat hyvälle kävijämittaukselle tärkeitä.

Tämä kuitenkin tarkoittaa, että Suomessa analytiikkaa keräävän yritysten tulee noudattaa näitä GDPR:n vaatimuksia:

  • Sivuston kävijöiltä pitää saada tietoinen suostumus ennen kuin analytiikka alkaa toimimaan
  • Analytiikan käyttämistä evästeistä pitää ilmoittaa selkeästi
  • Suostumus pitää pystyä tarvittaessa poistamaan käyttäjän toimesta

(Lisää aiheesta löytyy EU:n GDPR-apusivulta)

Ennen kuin katsomme miten tämä käytännössä tehdään, niin kiinnitetään huomio eri analytiikkatyökaluihin.


Tarvitseeko Google Analytics suostumuksen?

Google Analyticsin evästeet keräävät tietoa, mikä kuuluu GDPR:n henkilötietojen piiriin, varsinkin kun sitä yhdistettäisiin muihin datalähteisiin.

Tästä syystä Google Analyticsin käyttöön pitää saada suostumus. Tämä pätee sekä uuteen GA4:ään että vanhempaan versioon.

Evästebannerissa tämä näyttäytyy niin, että sopivan kategorian pois päältä kytkeminen estää Analytiikan tiedonkeruun (tästä lisää myöhemmin).

Analytiikka-osio evästebannerissa

Google Analyticsissa on kuitenkin erityisominaisuus nimeltä Google-signaalit.

Se löytyy Järjestelmänvalvonnasta data-asetusten alta:

Google Signaalien päälle laittaminen

Kun Google-signaalit on päällä, niin Analyticsin toiminta muuttuu näillä tavoin:

  1. Jos käyttäjä on kirjautunut Google-profiiliinsa nettiselaimella ja saapuu sivullesi, niin samaan Google-profiiliin kirjautunut kävijä voidaan myöhemmin tunnistaa samaksi henkilöksi vaikka hän vaihtaisi laitettaan (kuten puhelimesta tietokoneeseen)
  2. Kävijöiden Google-profiilista aletaan keräämään demografisia tietoja, kuten ikä, sukupuoli ja kiinnostuksen kohteet. Nämä tulevat sitten näkyviin Analyticsin raporteissa anonymisoidusti (et pysty tunnistamaan yksittäistä henkilöä)
  3. Sivustosi käyttäjiin voi kohdistaa uudelleenmarkkinointia Google Ads-mainostyökalulla

Kun puhe on yksityisyydestä, niin kohta 3 on se olennaisin.

Kun Analytics kerää kävijöiltä tietoa mainonnan ominaisuutta varten, niin on perusteltua sanoa, että Analytics on silloin analytiikan sekä mainonnan työkalu.

Tässä siis oma suositukseni:

Jos päätät kerätä Google-signaaleja, niin Google Analytics on hyvä sisällyttää Analytiikan lisäksi Mainonnan/Markkinoinnin tyypin alle

Jos et tarvitse Signaalien ominaisuuksia, niin älä laita sitä turhaan päälle.

Silloin voit paremmin mielin luokitella GA:n vain Analytiikan alle.

Haluatko oppia Google Analytics 4:n nopeasti?

Järjestän keskiviikkona 23.8 paljon toivotun Google Analytics 4 tehokoulutuksen. Paikkoja on vielä jäljellä!


Tarvitseeko Matomo suostumuksen?

Henkilötietoja sisältäviä evästeitä käytettäessä tulee siis pyytää suostumus.

Entäpä jos työkalu ei keräisi tätä tietoa?

Toinen suosittu analytiikkatyökalu Matomo viestii kovasti tällaisesta “analytiikasta ilman suostumusta”:

Matomon mainos

Tämä on vähän hämäävää.

Matomo nimittäin kyllä käyttää henkilötietoa sisältäviä evästeitä kävijöiden tunnistamiseen, ihan kuten muutkin työkalut.

Matomon evästeet

Kyse on siitä, että Matomon pystyy teoriassa määrittämään niin, että evästesuostumusta ei tarvita.

Tämä kuitenkin tarkoittaa, että analytiikka joudutaan riisumaan juuri niistä asioista, mitkä tuovat eniten hyötyä yrityksille.

Tällöin ei voida mitata verkkokauppoja tai muutakaan kävijätason tietoa.

Ja tietty jos käytät muita evästeitä käyttäviä ohjelmia, kuten yleisimpiä mainostyökaluja (Google Ads, Facebook Ads), niin banneri pitää olla sivustolla joka tapauksessa.

Käytännössä evästeetön mittaus on vaihtoehto vain Matomon pääkäyttäjäryhmälle, kuten julkiselle sektorille. Muutoin myös Matomo tarvitsee suostumuksen kerättynä esim. evästebannerilla

Tästä voit lukea lisää Matomon omasta artikkelista.


Suostumusten hallinta evästebannerilla ⚙️

Evästeet ovat jo pitkään piilotelleet meidän kaikkien selaimissa.

Netinkäyttäjille on tosin vähitellen tullut selväksi, että evästeitä on kaikkialla.

Tästä ovat pitäneet huolen bannerit, joita on nykyään joka sivustolla.

Evästebanneri auttaakin kahdessa asiassa:

  1. Viestimään sivustolla käytettävistä evästeistä
  2. Keräämään suostumuksen evästeiden käyttöön

Suostumus tai kieltäytyminen evästeiden käytöstä on tyypillisesti napin painalluksen päässä.

Evästeet myös luokitellaan eri kategorioihin.

Tässä esimerkkinä Cookiebotin bannerin vaihtoehdot Välttämätön, Mieltymykset, Tilastot ja Markkinointi:

Cookiebot-evästebannerin kategoriat

Analytiikan työkalut kuuluvat usein omaan kategoriaan, kuten Tilastot tai Analytiikka.

Olen tosin kohdannut myös tilanteita, joissa analytiikan työkalut sisällytetään muihin kategorioihin, kuten Välttämättömät.

Tämä varsinkin on kyseenalaista, sillä Välttämättömät on erityinen kategoria niille evästeille, mitkä ovat sivuston teknisen toiminnan kannalta välttämättömiä.

Siksi Välttämättömät-kategoriaa ei tyypillisesti voi kytkeä pois päältä.

Jos analytiikan määrittelee “välttämättömäksi”, niin sillä on voinut periaatteessa poistaa mahdollisuuden kieltäytyä analytiikasta.

Onko tämä kuitenkaan sopivaa nykyään?


Voiko analytiikan luokitella “välttämättömäksi”?

Vuoden 2021 lopussa EU:n (Traficomin viestimänä) tullut evästeohjeistus sanoi näin analytiikasta:

Analytiikkaevästeiden käyttöön pitää saada suostumus ja niitä EI voida luokitella välttämättömäksi evästeeksi tai oikeutetun edun piiriin. – Traficom

Tämä tarkoittaa, että analytiikka kuuluu omaan kategoriaansa, minkä voi myös ottaa pois päältä bannerista.

Uhka analytiikkadatan menettämiseltä on tietty saanut monet keksimään muitakin vippaskonsteja.

Joillakin sivustoilla evästebannerin käyttö on tehty tarkoituksella vaikeaksi, jotta kukaan ei vaivautuisi estämään analytiikkaa.

Uusi EU:n ohjeistus ottaa tosin kantaa myös tarkoitukselliseen vaikeuttamiseen, joten sitäkään ei kannata harrastaa.

Summa summarum:

Tällä hetkellä hyvä vaihtoehto on laittaa analytiikkatyökalusi Tilastojen (tai vastaavan kategorian) alle, mistä kävijä voi erikseen kieltäytyä.


Voiko analytiikan dataan enää luottaa? 🔢

Tästä kaikesta saattaa herätä tärkeä kysymys:

Voiko analytiikkadataan luottaa, kun sitä ei enää kerätä kaikista kävijöistä?

On totta, että oikein käytettynä evästebanneri tulee vähentämään datasi kokonaismäärää 100%:sta alaspäin.

Aina on osa kävijöistä joka ei anna suostumusta ja heillä on tietty oikeus toimia näin.

Moni analytiikan käyttäjä ei tästä syystä luota enää dataansa.

Haluaisin kuitenkin vähän haastaa ajatusta (koska törmään tähän työssäni jatkuvasti).

Ensinnäkin, kieltäytyjien osuus ei ehkä ole niin suuri kuin luulet.

Asian voit tarkistaa omasta evästehallintaohjelmastasi.

Cookiebot evästestatistiikka
Kuva: Cookiebot

Jos kolmasosa tai enemmän kieltäytyy, niin se on tietty suuri ongelma datan luotettavuuteen.

Monesti ongelma tosin ei ole näin suuri.

Tutkimusten mukaan evästeistä kieltäytyneiden osuus on jotakin 0,5%:sta ylöspäin riippuen bannerin tyylistä.

Muutaman prosentin menetys ei ole vielä suuri rasite.

Lisäksi kannattaa huomioida, että oli kyse analytiikasta tai muusta tutkimustoiminnasta, niin harva pystyy tavoittamaan joka ikistä tutkittavan ryhmän jäsentä.

Kun vaikka haluttaisiin tutkita kaikkein suomalaisten käyttäytymistä, niin ei silloin yritetä tavoittaa jokaista suomalaista.

Silloin käytettäisiin otantaa, eli suomalaisia edustavaa pienempää ryhmää.

Nykyään analytiikka on lakien vuoksi enemmän tai vähemmän otanta koko sivustosi kävijäkunnasta.

Hyvä otanta voi jo riittää ymmärtämään käyttäytymistä ja trendejä.

Mutta tämä ei tietenkään vakuuta kaikkia.

Siksi nyt onkin jo kehitteillä tapoja, joilla datan tarkkuutta voidaan yksityisyyttä noudattaen tulevaisuudessa parantaa.


Miten datasta saisi tarkempaa?

Ongelma analytiikassa nyt ja tulevaisuudessa tulee olemaan sama:

Osa tarvittavasta tiedosta puuttuu.

Yksi Googlen ehdottama ratkaisu on datamallinnus.

Mallinnuksessa puuttuvasta datasta tehdään valistunut arvaus, jotta kokonaiskuva kävijöistä pysyy.

Tämän valistuneen arvauksen tekisi nykyaikainen koneoppiva malli, mikä käyttää pohjana sitä osaa datasta, mikä on luotettavasti ja luvan kanssa kerätty.

Tällöin analytiikassa ei tarvitse luottaa pelkkään otantaan, vaan mallinnus täyttää aiemmin mysteeriksi jääneen aukon.

Evästeet ja mallinnus

Esimerkiksi Google Analytics 4:n on jo alkanut osittain tukemaan mallinnusta yhdessä Consent Mode-teknologian kanssa (Consent Mode on tosin vielä kehitteillä, joten en voi vielä suositella sitä ratkaisuksi kaikille).

Tämä tietenkin herättää kysymyksiä, että kuinka luotettavasti monimutkaista ihmisten käyttäytymistä voi mallintaa.

Tai kuinka selkeästi mallinnetun datan voi erottaa luvan kanssa kerätystä.

Haasteita on monia, mutta oma mielipiteeni on, että tähän analytiikkamittaus on yhä enemmän menossa.


Katsotaan nyt lopuksi neljä käytännön tapaa, joilla voit huomioida yksityisyyden analytiikassasi juuri nyt:


Hyvät käytännöt ✅

1. Ota käyttöön evästebanneri

Toimiva evästebanneri on lähtökohta suostumusten saamiseen ja hallintaan (mitä GDPR velvoittaa).

Tällä ei tosin tarkoiteta ihan mitä tahansa sivun alareunassa nököttävää palkkia.

Esimerkiksi Bloggerilla tehdyissä sivuissa näkee tällaisia ei niin hyviä bannereita:

Huono evästebanneri

Hyvä GDPR’ää noudattava banneri täyttäisi ainakin nämä kaikki vaatimukset:

  1. Suostumus evästeiden käyttöön pitää saada ennen evästeiden käyttöä (poikkeuksena välttämättömät evästeet)
  2. Suostumusta ei tule olettaa tai pakottaa
  3. Eri evästeryhmiä (markkinointi, tilastot jne.) tulee voida kontrolloida erikseen
  4. Suostumuksia tulee voida muokata myöhemmin

Kaikissa yleisimmissä evästehallintaohjelmissa on työkalut näihin asioihin.

Sopiva ohjelma säästää muutenkin aikaa, koska lain vaatimat tekstit ja kuvaukset evästeistä löytyvät myös suomen kielelle käännettynä.

Tässä muutama ohjelma mistä valita:


2. Aseta analytiikka noudattamaan suostumusta

Aloita siitä, että sisällytät kaikki analytiikkatyökaluissa käytettävät evästeet sopivaan kategoriaan.

Tällainen olisi esimerkiksi “analytiikka” tai “tilastolliset”.

Kuten yllä mainitsin, niin viimeisimpien ohjeistusten mukaan analytiikka ei kuulu “välttämättömien” kategoriaan.

Toiseksi, on tärkeää varmistaa, että analytiikkaevästeitä todellakin kerätään vasta heti suostumuksen saamisen jälkeen.

Tämä vaikuttaa ehkä simppeliltä, mutta se ei aina onnistu edes Suomen suurimmilta yrityksiltä.

Väitän, että hyviä ohjeita seuraamalla bannerin kaiken saa toimimaan halutusti kun käytät Google Tag Manageria (tässä ohje Tag Managerin asentamiseen).

Tässä myös kootusti ohjeita evästehallintaohjelmien asennusohjeisiin käyttäen Tag Manageria:


3. Anonymisoi IP-osoitteet

Analytiikka kerää tyypillisesti kävijöiden IP-osoitteita tuomaan raportointiin esimerkiksi sijaintitietoa.

IP-osoitteiden tieto on evästeiden kanssa vuosikausia kuulunut “hyväksi todettujen mittaustapojen” salakerhoon.

Sitten EU puuttui peliin:

Nykyään EU:n mukaan IP-osoitteet normaalimuodossaan ovat henkilötietoa (eli sillä voi suoraan tai epäsuoraan tunnistaa yksittäisen henkilön).

IP-osoitteiden kerääminen normaalimuodossa ei ole hyvä ajatus, koska henkilötiedoilla on tarkka regulointi.

Siksi ne kannattaa anonymisoida, jolloin ne eivät enää ole yhdistettävissä yksittäiseen henkilöön.

IP-osoitteiden anonymisointi

Voi hyvin olla, että tämä ei vaadi mitään lisätyötä.

IP-anonymisointi (IP anonymization) on oletuksena päällä mm. Matomossa ja Adobe Analyticsissa.

Uusi Google Analytics 4 taas ei kerää IP-osoitteita ollenkaan, joten sen käyttö ei vaadi toimenpiteitä.

Suurin ongelma voi tulla Google Analyticsin vanhemman version käyttäjille, koska anonymisointi ei ole oletuksena päällä, vaan se pitää erikseen laittaa päälle.

Anonymisointi pitää silloin laittaa erikseen päälle.

Jos käytät vanhempaa Analyticsin versiota, niin katso asennusoppaastani miten anonymisointi laitetaan päälle käyttäen Google Tag Manageria (tässä linkki siihen).

(Tai sitten vaihda mittaus kokonaan GA4:ään, koska vanhempi GA:n versio poistuu muutenkin käytöstä kesällä 2023.)

Mikä työkalusi sitten onkin, niin laita IP-anonymisointi toimintaan.


4. Päivitä tietosuojaseloste

Datankäytöstä tiedottaminen on toinen GDPR:n päätavoite.

Tämän vuoksi yritysten sivustolla on tärkeää olla ajantasainen tietosuojaseloste.

Tällä selosteella nimensä mukaan selostetaan miten yritys käsittelee henkilötietoja.

Kuten myös muun datan kanssa, kerro analytiikkadatasta vapaamuotoisesti ainakin näitä asioita:

  • Mitä analytiikkatietoa kerätään (ja millä työkaluilla)
  • Mihin analytiikkaa käytetään (tyypillisesti palvelujen kehittämiseen)
  • Ketkä vastaanottavat tietoa (esimerkiksi Google Analytics lähettää tietoa ulkomaille ja luovuttaa sitä kolmansille osapuolille)
  • Kauanko dataa säilytetään (tämän voi tarkistaa ja muuttaa itse työkalustasi)

Netistä löytyy myös paljon tietosuojakäytännön malleja ja pohjia auttamaan tämän tekemisessä.


Kiitos lukemisesta! Tulen julkaisemaan lisää tietoa aiheesta täällä sivustollani sekä YouTube-kanavallani.


Hei, muuten… Google Analytics 4 tehokoulutus järjestetään pian!



Santeri Kallio profiilikuva

Santeri Kallio

Data-analyytikko (Reaktor) – Kouluttaja

Blogissani näytän miten voit näkyä paremmin netissä ja parantaa myyntiä datalla … Lue lisää

Vastaa

Sähköpostiosoitettasi ei julkaista.