Twitter-tilastoja ja keskusteluverkoston analytiikkaa: case #totuusuhattuna

20Jul16

Törmäsin eilen (19.7.) Twitterissä kiinnostavaan juttuun, jonka mukaan Porin SuomiAreenan aikana eräs Twitterissä käyty keskustelu ”tavoitti viiden tunnin aikana 320 000 ihmistä”. Lukema on sitä luokkaa, että se ei missään tapauksessa voinut pitää paikkansa. Miksi ei ja mikä olisi oikea lukema, siitä lisää jäljessä.

Ensin taustat: Kyse oli Viesti Ryn eli viestinnän asiantuntijoiden ammattijärjestön nettisivuilla olevasta kirjoituksesta. Sen mukaan #totuusuhattuna-hashtag olisi tavoittanut 13.7.2016 viiden tunnin aikana mainitut 320 000 ihmistä Twitterissä. Nyttemmin kirjoitusta on muutettu, joten tässä kuvakaappaus alkuperäisestä kirjoituksesta:

totuusuhattuna-blogiin-190716

Julkaisijataho teki virheestä tavallaan vielä kiinnostavamman – etenkin, kun jutun aiheena on perustella suuren lukeman avulla, miksi sosiaalinen media on tärkeä kanava organisaatioiden viestinnälle. Kyse on siis ns. asiantuntijakirjoituksesta taholta, jonka voidaan ajatella olevan auktoriteetti omalla alallaan. Kirjoituksen tekijä on yhdistyksen toiminnanjohtaja Siina Repo.

Miksi yksittäisen hashtagin keskustelu ei voi Suomessa tavoittaa 320 000 ihmistä?

Suurin syy, miksi lähdin alunperin kyseenalaistamaan (ks. eilinen Twitter-keskustelu aiheesta) väitettä 320 000 ihmisen tavoittavuudesta, on se, ettei moiseen riittäisi edes kaikki Twitterin suomalaiset käyttäjät viiden tunnin aikana. Mittasuhde väitteen ja todellisen käyttäjämäärän välillä on täysin pielessä.

Viime viikolla Twitterissä oli Suomessa yhteensä n. 37 000 twiittaajaa. Lukema käy ilmi Suomi-Twitter-laskurista, jonka mukaan Twitterin käyttö Suomessa on laskenut käytännössä koko tämän vuoden ollen nyt matalimmillaan pariin vuoteen (syynä toki osittain kesäloma-aika, mutta laskusuhdanne on menossa joka tapauksessa). Huippuviikolla viime vuoden lopulla twiittaajia oli n. 58 000.

Samaisen laskurin mukaan keskiviikkona 13.7. Suomi-Twitterissä oli parhaimillaan n. 4000-5000 twiittiä tunnissa. Tämä ei kuitenkaan kerro mitään aktiivisten twiittajien määrästä tuolloin (koska periaatteessa yksikin twiittaaja voi kirjoittaa tuhansia twiittejä tunnissa), mutta antaa hieman osviittaa mittasuhteista. Suomi-Twitter-laskurin mukaan #totuusuhattuna oli päivän 6. suosituin hakusana.

Joku voisi tässä kohtaa syystäkin huomauttaa, että eihän twiittaajien määrä 37 000/vko tarkoita, etteikö vain-lukija-tyyppisiä Twitterin käyttäjiä olisi voinut silti olla yli 300 000 viidessä tunnissa. Siirrytään siis syvempiin vesiin…

Viime syksynä tehdyn kyselyn mukaan 18 % 12-65-vuotiaista suomalaisista käytti Twitteriä. Kyselystä ei kuitenkaan käy ilmi, tarkoittiko tämä Twitterin käyttöä esimerkiksi edellisen viikon, kuukauden tai kolmen kuukauden aikana, vai sitä, oliko vastaajalla ylipäätään Twitter-tunnus olemassa. Kun käyttöä kysytään näin yleisesti, ihmiset vastaavat kukin omalla tavallaan. Joka tapauksessa lukema 18 % tarkoittaisi yhteensä 648 000 suomalaista Twitterin käyttäjää (laskettuna sen avulla, että 12-65-vuotiaita suomalaisia oli tuolloin n. 3,6 miljoonaa). Luonnollisesti tämä lukema on epätarkka, mutta riittävän käyttökelpoinen lukema kuitenkin.

Tämä 648 000 ei kuitenkaan vielä kerro oikein mitään siitä, paljonko Twitterin käyttäjiä on yhteensä (sekä twiittaajia että vain-lukijoita) yhden viikon tai päivän aikana. Yritetään siis mennä luvuissa vieläkin pidemmälle.

Kyselyn tekoaikaan (viikot 36-40/2015) Suomi-Twitter-laskurin mukaan twiittaajia oli n. 53 000 viikossa. Tähän verrattuna viime viikolla oltiin n. 30 % matalammalla tasolla. Joten viime viikolla voitaisiin ajatella olleen suomalaisia Twitterin käyttäjiä korkeintaan 70 % lukemasta 648 000, mistä tulee tulokseksi 453 600.

Jos ajatellaan, että tämä kyselyn tuloksista johdettu lukema kuvaisi Twitterin käyttöä esimerkiksi yhden kuukauden aikana (jota useimmin käytetään mittalukuna some-palvelujen suosiota verratessa), niin yhden viikon aikana käyttäjiä on noin kolmannes koko kuukauden luvusta. Tämä ei ole pelkästään mutua, vaan perustuu aiempiin Suomi-Twitterin datoihin twiittajien määrien eroista yhden viikon ja koko kuukauden välillä.

Näin saadaan, että viime viikolla Twitterissä oli arviolta yhteensä noin 453 600 / 3 = 151 200 suomalaista käyttäjää.

Tämä on erittäin optimistinen laskelma. Jos oletetaan em. kyselyn kuvaavan Twitterin käyttöä esimerkiksi kolmen kuukauden jaksolla, olisi käyttäjiä per viikko paljon yllä laskettua vähemmän.

Riittäisikö tämä osoittamaan sen, miksi viiden tunnin aikana on teoriassa ja varsinkin käytännössä mahdotonta tavoittaa väitettyä 320 000 suomalaista ihmistä Twitterissä? Käyttäjiä ei yksinkertaisesti riitä – ei lähellekään.

Tietenkin tämä on hieman tällaista numeroilla leikkimistä, mutta tarkemman datan puutteessa on mentävä niillä, mitä käytettävissä on. Jos jollain on tarkempaa dataa, otan sen ilomielin vastaan.😉

Paljonko #totuusuhattuna -keskustelu todellisuudessa tavoitti ihmisiä Twitterissä?

On mahdotonta tietää tarkasti, paljonko tietyn hashtagin keskustelu tavoitti ihmisiä. Suuntaa-antava haarukka on kuitenkin helppo sanoa. Sen laskemiseen on muutamia eri tapoja.

Teoreettinen mahdollisen tavoittavuuden maksimi on yksi tapa. Se saadaan, kun lasketaan kaikkien ko. hashtagin keskusteluun osallistuneiden käyttäjien seuraajamäärät yhteen. Vähemmän yllättäen juuri tästä oli kyse Viesti Ryn käyttämässä luvussa. Lukema nimittäin oli otettu Pinnalla.pyppe.fi-tilastopalvelusta, mikä käy ilmi tästä Siina Revon twiitistä:

Pinnalla-palvelun ylläpitäjä vahvistaa tässä, että heidän palvelunsa kertoma luku oli laskettu juuri yllä kuvaamallani tavalla:

Tähän siis perustui Viesti Ryn / Siina Revon kirjoituksen virheellinen väite. Ikävä juttu, ettei kirjoittaja tullut arvioineeksi sitä kriittisesti, ja hän myös lainasi sitä jutussaan ja twiitissään virheellisesti väittäessään lukua ”tavoitetuiksi ihmisiksi”. Lukujen kanssa on oltava tarkkana, että mitä niiden väittää tarkoittavan(!).

Tässä luvussa on kuitenkin useampi asia pielessä:

  • Luvusta ei ole vähennetty duplikaatteja eli eri keskustelijoiden samoja seuraajia. Etenkin tietyn aihepiirin keskustelussa näitä on todella paljon, koska samasta aiheesta kiinnostuneet seuraavat suurelta osin samoja käyttäjiä.
  • Luvusta ei ole vähennetty niitä, jotka eivät käytä Twitter-tunnustaan. Maailmanlaajuisesti noin 1,3 miljardista luodusta Twitter-tunnuksesta aktiivisia on vain reilut 300 miljoonaa.
  • Luvusta ei ole vähennetty niitä, jotka eivät keskustelun aikana käyttäneet Twitteriä. Eli vaikka kaksi ensimmäistä kohtaa voitaisiin vähentää luvusta jollain konstilla, niin silloinkin kyse olisi vasta teoreettisesta maksimista.

Rautalangasta väännettynä:

Todellisen tavoittavuuden kanssa luvulla 320 000 ei ole mitään tekemistä. Lähinnä siihen vaikuttaa se, kuinka paljon keskusteluun osallistui hyvin suosittuja Twitterin käyttäjiä, sillä lukema muodostuu pitkälti muutaman eniten seuratun keskustelijan seuraajalukemista.

Syystä tai toisesta Viesti Ry on päätynyt pitämään juuri tämän käytännössä merkityksettömän lukeman kirjoituksessaan – vain korjaten hieman alkuperäistä sanamuotoa.

Toinen, huomattavasti paremmin todellista tavoittavuutta kuvaava lukema olisi kyseisen keskustelun suosituimman twiitin näyttökertojen määrä eli twiitin impressions-lukema Twitter Analyticsissa. Oletettavasti suosituimman tweetin on nähnyt selvä enemmistö hashtagiin liittyvää keskustelua seuranneista Twitterin käyttäjistä, sillä se on esiintynyt hashtag-feedissä lukuisia kertoja retweettien ansiosta.

Kysyin tätä Viesti Ryltä useaan kertaan eilisessä Twitter-keskustelussa, mutta en saanut siihen vastausta:

Kysymäni Viesti Ryn twiitti on kerännyt tätä kirjoittaessa 26 retwiittiä ja 17 tykkäystä:

Sivumennen sanoen twiitissä puhutaan täyttä asiaa. Medialukutaidon ja monilukutaidon ääressähän tässä ollaan.🙂

Tyypillisesti tämän verran retweetatulla twiitillä on suunnilleen 6000 – 8000 näyttökertaa. Viesti Ry voisi halutessaan kertoa meille, paljonko on oikea lukema, mutta jostain syystä he eivät sitä ole tehneet. Huomionarvoista on, että tässäkään ei ole kyse uniikeista eri käyttäjistä, vaan potentiaalisista mahdollisuuksista saada korkeintaan näyttökertojen verran lukijoita twiitille (lisätietoa Twitterin sivulta). Tilastoissa ei koskaan tiedetä varmasti, milloin yksittäinen käyttäjä on todella lukenut viestin.

Tämän valossa näyttäisi siltä, että #totuusuhattuna -keskustelu olisi tavoittanut pyöreästi 10 000 ihmistä Twitterissä. Lukema saattaa silti olla paljon isompikin, jos keskusteluun olisi osallistunut laajasti joko eri aikaan tai eri Twitter-verkoston osissa olevia käyttäjiä, joten varovaisempi arvio voisi olla 10 000 – 30 000 ihmistä. Sekin olisi vielä enintään kymmenesosa siitä, mitä Viesti Ry tuli väittäneeksi.

Mitä verkostoanalyysi kertoo #totuusuhattuna-keskustelusta?

Koska halusin saada aiheesta vielä paremman käsityksen, tein #totuusuhattuna-Twitter-keskustelusta oman datankeruun ja verkostoanalyysin. Huomioin siinä vain ennen 19.7. tulleet twiitit, jotta eilen käyty jälkikeskustelu ei tullut mukaan aineistoon. Mukaan on laskettu siis vain ne twiitit, joissa on mainittu #totuusuhattuna-hashtag sekä niiden retwiitit.

Verkostoanalyysin mukaan keskusteluun oli osallistunut ja siinä oli mainittu yhteensä 222 eri käyttäjää. Jos/kun tavoitteena oli synnyttää keskustelua tietystä aiheesta, niin tämä on mielestäni onnistumista parhaiten kuvaava lukema.

Vielä lukujakin tärkeämpää on tietää, keitä viesti/keskustelu tavoittaa, keitä (kaikkia)  aihe kiinnostaa ja ketkä ovat aiheeseen liittyvät tärkeimmät mielipidevaikuttajat. Näihin saadaan vastaus verkostoanalyysillä.

Mistään suuresta verkostosta ei ole kyse. Pitää muistaa, että kyse oli vain yksittäisen tapahtuman yksittäisestä keskustelusta, joten määräänsä isompaa ilmiötä siitä ei oikein voinutkaan odottaa syntyvän.

Keskustelijoiden ja siinä viitattujen käyttäjien verkostokartta näyttää tältä (klikkaa isommaksi):

screenshot_221338

Pallukan koko kuvaa käyttäjän keskeisyyttä ja väri sitä, mihin klusteriin (Gephi-analyysiohjelman muodostamat) hän kuuluu.

Kuvasta käy selvästi esiin keskustelun merkittävimmät käyttäjät (alla järjestettynä eigenvector-keskeisyysluvun mukaan):

  1. viestiry, 4172 seuraajaa
  2. rikurantala, 125033 seuraajaa
  3. hetakoski, 953 seuraajaa
  4. mikaeljungner, 80343 seuraajaa
  5. sukkola, 9295 seuraajaa
  6. eevalehtimaki, 9271 seuraajaa
  7. pnyman2, 3867 seuraajaa
  8. aivanerityinen, 1937 seuraajaa
  9. piritta, 11051 seuraajaa
  10. annevsi, 691 seuraajaa
  11. suomiareena, 5146 seuraajaa
  12. aino_kivela, 73 seuraajaa

Listassa on muutama todellinen supervaikuttaja suomalaisessa some-ympäristössä. Kun tuloksia arvioidaan, niin tällaisiin asioihin kiinnittäisin huomiota. (Edit: osittain kyse on siitä, että he olivat mukana varsinaisessa SuomiAreenan keskustelussa, ja siksi heitä mainittiin useasti Twitter-kommenteissa.) Merkittävimpien mielipidevaikuttajien välityksellä keskustelu saattaisi levitä laajemmallekin ja sillä voisi olla muitakin (joskus yllättäviä) vaikutuksia – tavallisimmin se, että joku toimittaja tarttuisi juttuun ja kirjoittaisi siitä lehteen isompien joukkojen luettavaksi.

Osaltaan näiden käyttäjien seuraajamääristä siis muodostui Viesti Ryn alkuperäinen väite 320 000 tavoitetusta ihmisestä. Sivumennen sanoen ei ole epätavallista, että keskeisimmät käyttäjät tässä verkostossa olivat myös eniten seurattuja. Suositut käyttäjät ovat vähän niin kuin retweet-, maininta- ja vastausmagneetteja – sen lisäksi, että heillä on suora yhteys muita useampiin käyttäjiin.

Verkostokartan muodosta voi myös tehdä johtopäätöksiä. Keskustelijat muodostivat pääosin hyvin tiiviin verkoston aiheeseen liittyen. Kartasta ei erotu paljonkaan selvästi muista erillään olevia ryhmittymiä, vaan useimmat klusterit (pallukoiden värit) sekoittuvat iloisesti toisiinsa. Verkoston keskimääräinen klusterointiluku on 0,4, mikä myös kertoo suhteellisen tiiviistä verkostosta.

Toisinaan näkee verkostokarttoja, jotka jakaantuvat selvästi useampiin verkoston osiin, joista osa on lähempänä keskustaa ja osa kauempana liittyen keskustaan vain toisten klustereiden kautta. Tässä tapauksessa sellainen on vasemman ylänurkan oranssi klusteri. Ainoa selvästi muista erillään oleva klusteri on oikean alakulman punainen porukka (se on kuvan ottamista varten vedetty lähemmäksi muita), joka liittyy vain yhdellä yhteydellä muuhun verkostoon.

Yhteenvetoa

Toivottavasti tämä tapaus on opiksi siitä, miksi viestijöiden kannattaa tuntea käyttämiensä some-palvelujen

a) Käyttäjämäärät. Eli mitä voi enintään odottaa tarkasteltavana aikana ja toisaalta: mikä lukema ei kerta kaikkiaan voi pitää paikkaansa.

b) Analytiikka. Ainakin peruskäsitteet on syytä tuntea ja olla sotkematta toisiinsa: mahdolliset näyttökerrat, näyttökerrat, yksilöidyt tavoitetut ihmiset.

Lisäksi tapaus on opetus siitä, miten vaikeaa on korjata oma virheensä – jopa viestinnän ammattilaisten ammattijärjestölle. Viesti Ryn kirjoituksen pointti perustui suurelta osin isoon lukuun 320 000, jonka luultiin tarkoittavan tavoitettuja ihmisiä. On hämmästyttävää, että lukua ei alunperin tarkistettu huolella, mutta viimeistään virheen tultua esille olisin odottanut sen selväsanaista korjaamista, että kyse ei ollutkaan tavoitettujen ihmisten määrästä, ja samalla esimerkin näyttämistä koko viestintäalalle, miten virhetilanteessa pitäisi toimia. Heille oli kuin tarjottimella paikka alan eettisen johtajuuden näyttämiselle.

Mutta kun ei, niin ei. Selvän korjauksen sijasta Viesti Ry muutti lauseen sanamuotoja, ja nyt se on tällainen: ”Aiheen Twitter-tavoittavuus oli lähes 320 000.” Vaikka teksti on lähes teknisesti hyväksyttävissä (minkä kyseenalaistan, syyt edellä), niin siitä syntyy edelleen monelle analytiikkaa tuntemattomalle lukijalle kuva, että aihe olisi tavoittanut 320 000 ihmistä. Miksi käyttää moista lukemaa, jonka merkitys ja informaatioarvo on lähes olematon?

Minulle tämä ”korjaus” näyttäytyy niin, että oikeastaan Viesti Ry ei halunnut tuoda selvästi esiin tekemäänsä virhettä, joka johtui aiheen huonosta tuntemisesta ja jonka kokoluokka oli vähintäänkin yhden ylimääräisen nollan luokkaa.

Eettisyys ei ole sitä, että yritetään peittää oma virhe. Tässä tapauksessa se olisi ollut sitä, että olisi pyritty selkeästi korjaamaan virheestä lukijoille syntynyt väärä käsitys ja selitetty, mistä se johtui.



One Response to “Twitter-tilastoja ja keskusteluverkoston analytiikkaa: case #totuusuhattuna”

  1. 1 Siina Repo

    Viestin blogissa käytettiin Pinnalla-palvelun tarjoamaa lukua 319 315, joka tarkoittaa siis totuusuhattuna-hashtagia käyttäneiden uniikkien käyttäjien seuraajien summaa, ei yksittäisiä ihmisiä. Pahoittelemme epätäsmällisyyttä ja olemme jatkossa tarkempia analytiikkatermien käytön suhteen.

    Vaikka sekaannus harmittaa, olemme samalla iloisia aiheen synnyttämästä aktiivisesta keskustelusta. Tuoreen European Communication Monitorin mukaan viestinnän asiantuntijat pitävät analysointiosaamisen puutetta merkittävimpänä haasteena big datan käytössä viestintäalalla. Tarvetta keskustelulle ja koulutukselle on, ja pyrimme Viestissä ottamaan tämän huomioon esimerkiksi tulevassa jäsenillemme suunnatussa koulutustarjonnassamme.


Vastaa

Täytä tietosi alle tai klikkaa kuvaketta kirjautuaksesi sisään:

WordPress.com-logo

Olet kommentoimassa WordPress.com -tilin nimissä. Log Out / Muuta )

Twitter-kuva

Olet kommentoimassa Twitter -tilin nimissä. Log Out / Muuta )

Facebook-kuva

Olet kommentoimassa Facebook -tilin nimissä. Log Out / Muuta )

Google+ photo

Olet kommentoimassa Google+ -tilin nimissä. Log Out / Muuta )

Muodostetaan yhteyttä palveluun %s


%d bloggers like this: