Aineiston käsittely tietokannassa – Kulkine.net


A:2.4 Aineiston käsittely tietokannassa

Haastatteluista, lehdistä ja kirjoista tehdyt muistiinpanot ja saadut tekstiviestit tallennettiin aluksi vihkoon. Verkosta tehdyt tekstipoiminnat siirrettiin leikkaa–liitä-menetelmällä tekstitiedostoihin. Näiden pohjalta muodostettiin aluksi Excel-taulukko, johon tallennettiin tiedot nimestä, nimen tarkoitteesta, nimen viittaustasosta, nimen kielestä, nimen muodostusalkuperästä (primääriys vs. sekundääriys alatyyppeineen), mahdollisista nimeämisperusteista, sekundäärinimissä käytetyistä muokkauskeinoista ja lähteistä, joista nimi oli saatu. Lisensiaatintutkielmavaiheessa järjestin taulukon sisältämää tietoa eri perustein, mikä oli tuossa vaiheessa riittävä menettely.

Väitöskirjaa suunnitellessani kävi ilmeiseksi, että sähköisen muodon etujen hyödyntäminen tulisi edellyttämään kerätyn tiedon hallinnointia Excel-taulukon sijasta jossakin monipuolisemmat ominaisuudet tarjoavassa tietokantaympäristössä. Tällaiseksi valittiin MySQL. Koska oletan nimiaineistotietokannan nimineen ja analyyseineen kiinnostavan sekä maallikoita että tieteilijöitä, päädyin suunnittelemaan tutkielmani sellaiseksi, että nimitietokanta on osa tutkielman kokonaisuutta ja avoimesti käytettävissä hakutoimintojen kautta. Näin koko tutkimusaineisto ja sen analyysit ovat käytettävissä, mutta eivät samaan aikaan kuormita juoksevaa tekstiä samaan tapaan kuin lisensiaatintutkielmassani. Koska aineistokokoelma oli muokattava julkisesti näytettävään muotoon, sitä ei kannattanut konvertoida Excelistä csv-muodon kautta sql-tiedostoksi, vaan tietokantarakenne oli suunniteltava ja toteutettava alusta alkaen ja kaikki tiedot syötettävä tietue kerrallaan uuteen tietokantaan. Tietokannan suunnittelussa, rakentamisessa ja tiedonsyöttöratkaisujen kehittämisessä yhteistyökumppaniksi ryhtyi Fennosol Oy, jonka kanssa yhteistyö oli sujuvaa ja hedelmällistä. Tietokannan rakenteen pohdinnassa myös nimien rakenteita ja niihin liittyviä ilmiöitä jouduttiin miettimään, joten teknisen toteutuksen suunnittelun yhteydessä syntyi myös kielitieteellisiä ajatuksia. Nyt tietokanta sisältää nimen tarkoitteen lajin (esim. polkupyörä), epävirallisen nimen viittaustason (esim. merkkinimi), viralliset nimet, neliportaisen nimeämisperuste-analyysin kolmella nimeämisperusteen varmuusasteella (ks. nimeämisperusteiden luokittelumalli luvusta E:2.3, varmuusasteet E:4.1.1), nimeen sisältyvät nimenosat, tiedon nimenosan sijainnista nimessä (alkuosa, loppuosa), nimenosan muodostusalkuperän (primääri, sekundääri ym.) ja nimenosan tavuluvun. Sekundäärinimistä on tallennettu muodostusmenetelmät (esim. typistys) ja se, onko sekundäärinimen kantanimenä oleva nimi virallinen vai epävirallinen. Lisämerkityksisistä sekundäärinimistä on tallennettu sekä muodostusmenetelmä (äänteellinen muuntelu, käännös jne.) että harhalekseemin ryhmä (esim. eläimennimitys). Tietokannan taulurakennetta ja muuta teknistä toteutusta kuvataan tarkemmin väitöskirjan teknistä toteutusta käsittelevässä luvussa H:3.


Siirry seuraavaan alalukuunA:2.5 Aineistonkeruu kansanperinteen tallennuksena