1Parlamentarni korpusi so različnih velikosti in vsebujejo podatke v različnih modalitetah (pisni, govorjeni, gestikulacija), iz različnih časovnih obdobij in v enem ali več jezikih. Čeprav so parlamentarne razprave večinoma dostopne v besedilni obliki (npr. korpus razprav iz danskega parlamenta), so včasih dostopne tudi kot zvočni posnetki ali videoposnetki skupaj s transkripcijami (npr. korpus razprav iz češkega parlamenta). Parlamentarni korpusi kot diahroni viri nam omogočajo poglobljeno raziskovanje jezikovnih in družbenih sprememb skozi čas. Večina parlamentarnih korpusov vsebuje bogate metapodatke o govorih (npr. datum govora, trajanje govora, točka dnevnega reda, v kateri je bil govor podan) ali govorkah in govorcih (npr. spol, starost, izobrazba, politična pripadnost, institucionalna vloga), kar omogoča poglobljen vpogled v kontekst preučevanega pojava (glej Alasuutari idr., 2018; Demmen idr., 2018).
1Parlament je institucija, za katero veljajo specifična pravila in konvencije, kar vpliva tudi na jezikovno rabo, začenši s pravili glede podeljevanja besede, naslavljanja itd. (glej npr. poslovnik državnega zbora RS). Ta pravila in konvencije so se izoblikovale v določenem družbenozgodovinskem okolju, zato niso v vseh parlamentih enake; v grškem parlamentu je na primer skakanje v besedo strogo prepovedano, medtem ko je v britanskem parlamentu prekinjanje govorcev pogosto in običajno ni sankcionirano (Ilie, 2017). To je seveda treba upoštevati pri oblikovanju raziskovalnih vprašanj, izvedbi raziskave in interpretaciji rezultatov. Zato je pri raziskovanju te vrste diskurza še posebej pomembno, da dobro razumemo okoliščine, v katerih je nastal.
1Uradno objavljeni sejni zapisi niso dobesedne transkripcije parlamentarnih razprav, ampak zapisi v skladu z uveljavljenimi zapisovalnimi praksami institucije. Te prakse se razlikujejo med posameznimi državami in časovnimi obdobji. Med urejanjem zapisov običajno pride do izločanja značilnih prvin govorjenega jezika, lahko pa tudi do nekaterih drugih posegov, kot so izločanje očitnih jezikovnih ali vsebinskih napak, narečnih ali pogovornih izrazov ter žaljivega in vulgarnega jezika. Smernice za urejanje sejnih zapisov običajno žal niso javno objavljene, kar lahko bistveno oteži raziskovalno delo. Kritiko virov v parlamentarnem kontekstu podrobneje obravnavata Molli (2007) in Rix (2014). Drug pomemben vidik pri proučevanju parlamentarnega govora je, da so govori poslank in poslancev pogosto pripravljeni vnaprej, in sicer v pisni obliki, kar vpliva na njihove skladenjske in slogovne značilnosti. To sicer ne velja za vsa parlamentarna okolja, niti za vse vrste parlamentarnih nastopov (npr. interpelacije, obrazložitve glasu, poslanska vprašanja). Tudi te posebnosti je poleg družbenozgodovinskega konteksta treba vedno upoštevati pri oblikovanju raziskovalnih vprašanj, izvedbi raziskave in interpretaciji rezultatov.
2Slika 2 prikazuje primerjavo uradnega zapisa govora Anje Bah Žibert, poslanke Državnega zbora RS 2014–2018, s 33. seje Državnega zbora na temo predloga zakona o Prešernovi nagradi (18. točka dnevnega reda, str. 128) z dobesedno transkripcijo njenega govora, ki smo jo pripravili na podlagi videoposnetka seje (min. 5:00–7:33). Že na prvi pogled se vidi, da uradni sejni zapisi DZ RS niso najboljši vir za preučevanje značilnosti spontanega govora, kot so napačni začetki, premori, raba mašil ali ponovitev.
1Predpogoj za ustrezno oblikovanje raziskovalnih vprašanj, izvedbo raziskave in interpretacijo rezultatov, pa tudi za optimalno izkoriščanje vsega, kar raziskovalni podatki omogočajo, je, da se najprej podrobno seznanimo s tem, kaj izbrani korpus vsebuje, kako je bil zgrajen in označen ter kakšne so njegove omejitve. Ker niso vsi korpusi enako označeni , moramo vedno preveriti podrobnosti o izbranem korpusu. Te informacije so običajno na voljo na domači strani korpusa (npr. korpus historične nizke nemščine), v konkordančniku, prek katerega je korpus na voljo (npr. britanski parlamentarni korpus Hansard v konkordančniku Univerze Brigham Young), ali v repozitoriju, kjer je korpus arhiviran, (npr. hrvaški parlamentarni korpus ParlaMeter-hr v repozitoriju CLARIN.SI). Več o kodiranju in označevanju parlamentarnih podatkov lahko preberete v izobraževalnem modulu o zbirkah parlamentarnih podatkov Parthenos.