Halusin tutkia väitöstutkimuksessani, miten murteentutkimus ja sen keskinen käsitteistö on ajan saatossa muuttunut. Kaikenlaiset rajaukset ”tutkimusalan keskeisistä teoksista”, joista asiaa voisin tarkastella, tuntuivat puutteellisilta ja perusteettomilta. Seisoessani liikennevaloissa talvella 2016 sen keksin: Sitaatiot! Jos tutkin väitöskirjojen lähdeluetteloita, saan niistä selvitettyä aineistoon perustuen, mihin tutkimuskirjallisuuteen tieteenalalla viitataan eniten, ja näin perustellusti rajattua itselleni aineiston.
Epätoivoa ja taulukkorivejä
Alkoi pitkä ja kivinen aineistotyö. Digitoin suomen kielen alla ilmestyneiden murteita käsittelevien väitöskirjojen lähdeluettelot ja pyöritin niitä eri tiedostomuodoiksi ja erilaisten ohjelmistojen lävitse. Näin sain aikaan excelin, jossa on lähes 10 000 riviä. Käytin uuden opetteluun ja erehtymiseen yhteensä kymmenen kuukautta.
Välissä meinasi usko loppua. Tarkistaessani käsin jättiexcelini yksittäisiä rivejä pohdin, onko tutkimuksellani mitään merkitystä ja onko missään mitään järkeä. Kun excel-tiedosto lopulta taittui kuvaajiksi, jotka todella paljastivat ennen piilossa ollutta tietoa, olo oli maaginen – kuin olisin kuukausien tonkimisen jälkeen löytänyt pellosta timantin.
Väitöskirjaprosessi on mutkikas ja täynnä sekavuuden ja kirkkauden hetkiä. Aikaisemmista suunnitelmistani poiketen en nyt väitöstutkimuksessani keskitykään lähdetietokannassani viitatuimpien teosten sisällölliseen analyysiin, vaan tutkailen itse murreväitöskirjojen aineslähteitä. Millaista ja miten kerättyä aineistoa on tutkittu, kun on tutkittu murteita? Millaiset ihmiset on katsottu ”murteenpuhujiksi”?
Oliko siis kaikki työ lähdetietokannan parissa turhaa? Väitöskirjani ripeän valmistumisen kannalta kyllä, viisastumiseni kannalta ei. Työ aineiston parissa syvensi ymmärrystäni tutkimani tieteenalan historiasta. Ilman sitä tekisin nyt huonommin työni. Lisäksi aineistotyöllä on myös omanlaisensa arvo.
Avoimen aineiston merkitys
Päätin jo alussa, että julkaisen aineistoni avoimena datana Kielipankissa. Näin myös muut tutkijat voivat käyttää lähdetietokantaa eri tarkoituksiin.
Ratkaisuni julkaista datani on herättänyt joissakin tutkijoissa myös ihmetystä: Miksi haluan luovuttaa muille aineistokokonaisuuden, jonka koostamiseen käytin hirvittävästi aikaa? Datan avoimuus ei tarkoita, että luopuisin täysin sen tekijänoikeuksista. Tietokannan koostaminen on tutkimuksellinen saavutus, ja jotkut jopa ennustavat, että jatkossa aineistotyötä arvostetaan yhtä paljon kuin julkaisemista.
Vaikka lähdetietokantani viitatuimmista teoksista ja tutkijoista varmasti monet ovat sellaisia, jotka alan tutkijat osaisivat ravistaa hihastaan, lähdetietokanta osoittaa empiirisesti – siis aineistolähtöisesti – keihin ja mihin teoksiin väitöskirjoissa viitataan. Se siis tuottaa uutta tietoa maailmasta, mikä on tieteen perimmäinen tarkoitus ja tutkijan suurin ilo.
Lotta Aarikka
Kirjoittaja on Turun yliopiston väitöskirjatutkija, joka vapaa-ajallaan rapsuttelee kahta corgia ja kuulostelee murteellisuuksia tosi-tv-ohjelmien esiintyjen puheesta.
Lue lisää murteiden tutkimuksessa käytetyistä lähteistä ja viitteistä Virittäjästä 3/18. Artikkeli on Virittäjän tilaajille vapaasti luettavissa. Muut pääsevät tutustumaan artikkeliin 12 kuukauden kuluttua sen julkaisusta.