• Tärkein
  • Uutiset
  • K & V: Google-hakutietojen käyttäminen tutkia yleistä kiinnostusta Flintin vesikriisiin

K & V: Google-hakutietojen käyttäminen tutkia yleistä kiinnostusta Flintin vesikriisiin

Kuinka amerikkalaiset käyttivät Googlea oppimaan veden saastumiskriisistä Flintissä, Michiganissa, ja miten heidän verkkohaut kehittyivät ajan myötä? Nämä kysymykset ovat uuden Pew Research Center -tutkimuksen keskiössä, jossa analysoidaan 18 kuukauden Google-hakutiedot seuratakseen yleistä kiinnostusta Flintin monikerroksiseen kriisiin.

Tutkimuksessa keskitytään yhteen tiettyyn uutistapahtumaan, mutta se valaisee laajempia tutkimuskysymyksiä, mikä näkyy ennen kaikkea siitä, mitkä kootut Internet-hakukyselyt voivat kertoa meille, kuinka uutiset leviävät tämän päivän digitaalisessa uutisympäristössä. Pew Research Centerin journalistisen tutkimuksen johtaja Amy Mitchell auttoi tutkimusta; Seuraavassa on toimitettu haastattelu Mitchellin kanssa raportin metodologiasta.

Miksi keskityit Flintin vesikriisiin?

Vaikka tutkimuksen kohteemme ovat laajat, mielestämme tapaustutkimuksen avulla voimme tutkia syvällisesti yleisen mielenkiinnon vivahteita uutisaiheessa tarinan edetessä. Halusimme tarinan, jossa oli monia ainutlaatuisia Internet-hakusanoja sekä tarkka maantieteellinen alue, jotka molemmat mahdollistavat tarkemman Internet-hakutoiminnan seuraamisen. Toivoimme myös uutisen, johon ihmiset voisivat olla yhteydessä monilla tasoilla. Flint-tapaus täyttää nämä kriteerit. On monia hakusanoja, jotka liittyvät nimenomaan Flint-kriisiin. Sillä oli myös pitkä aikajana, se kehittyi paikallisesta kysymyksestä kansalliseksi ja siitä tuli tarina, jolla oli vaikutuksia henkilökohtaisella, yhteisön ja poliittisella tasolla.

Tämä raportti eroaa monista Pew Research Center -analyyseistä siinä, että siinä ei käytetä kyselytietoja. Kuinka tämä raportti tehtiin?

Pew Research Centerissä käytämme tutkimuksessamme monia menetelmiä riippuen kysymyksistä, joihin yritämme vastata. Nämä menetelmät sisältävät alkuperäisten analyysien suurista ulkoisista aineistoista, mitä teimme täällä. Tämä oli ensimmäinen käyttämämme tiedot Google Health -sovellusliittymästä, joka on lähinnä tukiasema analysoimaan suuria määriä tietoja termeistä, joita Internet-käyttäjät etsivät tietyn ajanjakson aikana.

Tiimimme käytti useita kuukausia varmistaakseen, että ymmärrimme tiedot täysin, miten ne on järjestetty ja mitkä ovat parhaat menetelmät tarkkojen tietojen palauttamiseksi, ennen kuin aloitimme itse Flint-tutkimuksen. Kun tunsimme olevamme varmoja menetelmistä, tiimi poimi kyselyjen tulokset tämän tutkimuksen 130 viikon aikana, otti useita tilastollisia vaiheita tietojoukon puhdistamiseksi ja aloitti sitten sisäiset analyysimme.

Miksi käytit nimenomaan Google-hakutietoja?

Mikään hakukone ei voi edustaa kaikkien amerikkalaisten kyselyjä, valtaosa online-hakijoista käyttää Googlea, ja monet tutkijat kokeilevat sen käyttöä työkaluna kansalaisten asenteiden ja käyttäytymisen ymmärtämiseen. Tätä projektia varten haetimme Googlelta ja saimme pääsyn yksityiseen Google Health -sovellusliittymään, joka tarjoaa tarkempia tietoja kuin julkinen Google Trends -sivusto.



Mitä voit oppia tällaisista hakutiedoista? Voivatko hakutiedot tuottaa edustavan otoksen joistakin populaatioista?

Tietojen palautustapa ei ole käyttäjän tasolla, vaan yksittäisen hakukyselyn tasolla. Toisin sanoen analyysin yksikkö on haut, ei ihmiset. On tärkeää muistaa, että tiedot näytetään osuutena kaikista kyseisen ajanjakson maantieteellisellä alueella tehdyistä hauista, ei kokonaismäärästä. Joten esimerkiksi kun puhumme henkilökohtaiseen terveyteen liittyvien termien hakutoiminnan lisääntymisestä Michiganissa, se tarkoittaa, että kyseisten tuotteiden haut olivat suurempi osakaikkihaut Michiganin osavaltiossa kyseisellä viikolla verrattuna edelliseen viikkoon.

Mitä haasteita kohdat hakutietojen käytössä?

Kuten minkä tahansa uuden tietolähteen tai työkalun kohdalla, esiin nousi useita haasteita, kun pyrimme ymmärtämään täysin, mitä tiedot edustavat, mitä ne eivät edusta ja miten parhaiten jäsennellä tarkka analyysi. Monista haasteista keskustellaan yksityiskohtaisesti metodologiassa, joten korostan vain yhden esimerkin.

Google Health -sovellusliittymä ottaa mistä tahansa kyselystä otoksen hauista. Tulokset voivat vaihdella kyselystä melko vähän vedetyn näytteen perusteella. Tämän vaihtelun ratkaisemiseksi otimme 50 näytettä kullekin hakuluokalle kullakin maantieteellisellä alueella kutakin viikkoa kohden 2 ½ tutkitun vuoden aikana, jolloin saatiin yhteensä 91 000 näytettä. Sitten otimme jokaisesta viikosta 50 näytteen keskiarvon.

Toinen tämän raportin osa sisälsi Flint-kriisiin liittyvien uutisten seurannan. Kuinka menit tekemään niin?

Tämän projektin osan tavoitteena oli kaapata laaja medianäkyvyys ajan myötä; se ei ollut tehdä yksityiskohtaista mediasisällön analyysiä. Tätä varten keräsimme uutisia paikallisten, alueellisten ja kansallisten tiedotusvälineiden otoksesta samalla aikavälillä kuin Google-hakutiedot. Sisällytimme kaiken, mikä voidaan tunnistaa koskemaan Flintin vesikriisiä. Tunnistaminen oli kaksivaiheinen prosessi: Ensinnäkin avainsanahakuja käytettiin mahdollisten liittyvien tarinoiden tunnistamiseen ja kaappaamiseen. Sitten joukko koodaajia luki tai katsoi jokaisen tarinan varmistaakseen, että ainakin 50% siitä koski Flintin vesikriisiä.

Onko tässä hankkeessa oppitunteja tai varoituksia muille tutkijoille, jotka haluavat käyttää hakutietoja arvioidakseen amerikkalaisten kiinnostusta uutistapahtumiin?

Ehdottomasti. Kirjoitimme useista heistä Medium-viestissä, mutta muutama mielessä pidettävä asia on, että Google Trends mittaa hakutoimintaa, ei mielipidettä tai prioriteettia. Vaikka hakutoiminta voidaan usein yhdistää kiinnostukseen, se ei osoita yleisön myönteisiä tai kielteisiä mielipiteitä tai että enemmän tuloksia tuottava hakutermi on tärkeämpi kuin jokin muu termi. Lisäksi avainsanahauissa termien on oltava tarkkoja, mikä tarkoittaa, että jokainen sanan taivutus tai sanayhdistelmä on kirjoitettava erikseen. Esimerkiksi, jos joku haluaa nähdä hakutoiminnan lyijytestauksen ympärillä, sinun on annettava lyijytestit, lyijytestaus, lyijytesti ja lyijytesti. Meille tämä tarkoitti lähes 2700 erilaisten hakutermien käyttöä.