6 Korpusna analiza

1V tem razdelku bomo na obsežnem korpusu slovenskih parlamentarnih razprav pokazali, kako lahko osnovne tehnike korpusne analize (za več o tem glej razdelek 3) uporabimo za iskanje odgovorov na naslednja raziskovalna vprašanja:

  • V Nalogi 1 bomo analizirali zastopanost žensk v slovenskem parlamentu. Najprej si bomo ogledali, kako ustvarimo podkorpuse. Nato se bomo naučili, kako sestaviti frekvenčne sezname, ki prikazujejo število govorcev oziroma govork in njihovih govorov v podkorpusih.
  • V Nalogi 2 bomo identificirali tematike, o katerih so skozi čas razpravljale poslanke v primerjavi s poslanci. Pri tem se bomo naučili, kako izluščimo ključne besede iz podkorpusov, in si nato ogledali, kako s pomočjo analize konkordanc preverimo njihov kontekst in rabo.
  • V Nalogi 3 bomo raziskali, kako so poslanke in poslanci v minulih 25 letih razpravljali o tematikah, povezanih z ženskami. Ogledali si bomo, kako uporabljamo podatke o relativni frekvenci v različno velikih podkorpusih in kako izluščimo kolokacije izbranih samostalnikov v podkorpusih.

6.1 Korpus siParl 2.0

1Korpus siParl 2.0 (Pančur idr., 2020) vsebuje sejne zapise 11. mandata Skupščine socialistične republike Slovenije za obdobje 1990-1992, sejne zapise Državnega zbora Republike Slovenije za obdobje 1992-2018 (1.–7. mandat), sejne zapise delovnih teles Državnega zbora Republike Slovenije za obdobje 1996-2018 (2.–7. mandat) in sejne zapise Sveta predsednika Državnega zbora za obdobje 1996–2018 (2.–7. mandat).

2Korpus vsebuje metapodatke o govorkah in govorcih (npr. ime, spol, vloga, politična stranka), tipologijo parlamentarnih zasedanj (npr. redna seja, izredna seja itd.) ter strukturne in uredniške oznake (npr. zakonodajno obdobje, leto/naslov seje, imenske entitete ). Korpus je tudi oblikoskladenjsko označen in lematiziran. Poleg tega vsebuje nekatere druge jezikoslovne oznake (npr. oznake univerzalne odvisnostne drevesnice (Universal Dependencies) in skladenjsko razčlenjevanje), ki pa jih v tem gradivu ne uporabljamo. Korpus obsega več kot milijon govorov oziroma 200 milijonov besed, ki jih je prispevalo skoraj 8.500 različnih govork in govorcev (npr. poslanke in poslanci, članice in člani vlade, predstavnice in predstavniki ministrstev, strokovnih organizacij, nevladnih organizacij in interesnih skupin). Splošne informacije o korpusih in o zapisih parlamentarnih sej najdete v razdelku 3 in v razdelku 4.

3Te informacije o korpusu so na voljo tudi v konkordančniku na strani CLARIN.SI (glej Sliki 3a in 3b) 2:

  • Kvantitativne informacije o velikosti korpusa so na voljo v razdelku Zadetki (glej številko 1).
  • Osnovne oznake za besedne vrste so navedene v Legendi oznak (glej številko 2), opis celotnega nabora oznak pa je na voljo prek povezave Tagset/Opis 3 (glej številko 3).
  • Korpus je organiziran prek strukturnih atributov. Atribut session/seja zamejuje posamezne seje (glej številko 4) in vsebuje informacije, kot so datum, vrsta in naslov seje (glej Sliko 3b, številko 4).
  • Atribut speech/govor zamejuje posamezne govore (glej številko 5) in vsebuje informacije o imenu, spolu, vlogi in strankarski pripadnosti govorke oz. govorca (glej Sliko 3b, številko 5).
Slika 3a: Osnovne informacije o korpusu siParl 2.0.
Slika 3a: Osnovne informacije o korpusu siParl 2.0.


Slika 3b: Razširjene informacije o strukturnih atributih v korpusu siParl 2.0.
Slika 3b: Razširjene informacije o strukturnih atributih v korpusu siParl 2.0.


6.2 NALOGA 1: Zastopanost žensk v slovenskem parlamentu

1Državni zbor Republike Slovenije ima 90 poslank in poslancev, vključno s predstavnico oz. predstavnikom italijanske in madžarske manjšine, ki so trenutno del devetih političnih strank. Slovenija je ena od najmlajših držav Evropske unije, ki je v preteklih 30 letih doživela dramatične spremembe na področju enakosti spolov. Leta 1986, ko je bila Slovenija še vedno del Socialistične federativne republike Jugoslavije, so poslanke zasedale skoraj četrtino vseh poslanskih sedežev, leta 1992, ko je bil prvič sklican Državni zbor Republike Slovenija, pa se je ta delež občutno zmanjšal, saj so poslanke zasedale le še vsaki deseti poslanski sedež (Selišnik in Antić Gaber, 2017). Med postopkom tranzicije, ko so se družbeni, politični, gospodarski in vrednostni sistem bistveno spremenili, so ženske v Sloveniji izgubile več gospodarskih in družbenih prednosti, pridobljenih v času socializma, in so bile skoraj popolnoma izrinjene iz političnih institucij. V sedmem mandatu (1. 8. 2014–21. 6. 2018), ki je zadnji mandat, vključen v korpus siParl 2.0, so poslanke zasedle malo več kot 40 % sedežev, večinoma zaradi zakonodajnih ukrepov, ki predpisujejo spolne kvote. 4 Glede na EU indeks vrednosti enakosti spolov in politične moči v Evropski uniji za leto 2017 je bila Slovenija uvrščena med prvih 10 držav Evropske unije po deležu poslank.

2V Nalogi 1 bomo primerjali govore v korpusu siParl 2.0 s trendi na parlamentarnih volitvah in v slovenski družbi.

6.2.1 Izdelava podkorpusov

1Na podlagi metapodatkov, ki so na voljo v korpusu (glej Sliko 3b), korpus razdelimo na več delov, t. i. podkorpuse, in sicer glede na naslednja merila:

  • Spol. Govorke in govorci so v korpusu označeni z eno od naslednjih kategorij v skladu s podatki iz uradnih sejnih zapisov državnega zbora: moški, ženska ali ni podatka (v primerih, ko so zapisi metapodatkov nepopolni). V tem gradivu uporabljamo le prvi dve kategoriji (moški, ženska), medtem ko tistih, za katere ni podatka o spolu, v analizo ne vključujemo.
  • Vloga. Govorkam in govorcem je v korpusu pripisana ena od dveh vlog, in sicer član parlamenta oziroma zunanji govornik 5 (ta vloga označuje povabljene govorke in govorce, ki niso del parlamenta (npr. članice in člani vlade, predstavnice in predstavniki ministrstev ali nevladnih organizacij). V tem gradivu upoštevamo le govorce in govorke z oznako član parlamenta, ker se želimo osredotočiti na prispevke izvoljenih predstavnic in predstavnikov državljanov Slovenije.
  • Tip. Poleg vloge je govorkam in govorcem v korpusu pripisan tudi njihov tip, ki ima eno od naslednjih dveh vrednosti: redni govornik ali predsedujoči. Prva kategorija označuje govorke in govorce v parlamentu, ki so v skladu s poslovnikom izrecno dobili besedo. V naši analizi upoštevamo le te. Tiste z oznako predsedujoči smo namerno izključili, saj je večina njihovih izjav namreč pogojena s postopkovnimi predpisi in dogovori in torej nanje ne vplivajo strankarska pripadnost, spol ali drugi dejavniki.
  • Mandat. Vsak govor v korpusu je kategoriziran glede na parlamentarno obdobje, v katerem je bil izrečen (1.–7. mandat). Ker to presega meje naše raziskave, smo iz analize izključili obdobje odcepitve od Jugoslavije , ki je v korpusu označeno kot 11. sklic.
  • Delovni organ. Korpus siParl 2.0 vsebuje govore s plenarnih zasedanj, z zasedanj delovnih organov državnega zbora (npr. Komisija za peticije, človekove pravice in enake možnosti) in z zasedanj Sveta predsednika Državnega zbora. V tem gradivu analiziramo le govore s plenarnih zasedanj.

2Na podlagi teh meril izdelamo 14 podkorpusov, po dva za vsakega od sedmih mandatov, pri čemer eden vsebuje govore poslank, drugi pa govore poslancev s pripisano vlogo redni govornik. Poleg teh 14 podkorpusov izdelamo tudi podkorpuse, ki vsebujejo vse govore poslank in poslancev za vsak posamezni mandat in za vseh sedem mandatov skupaj.

1Videoposnetek, ki prikazuje izdelavo podkorpusa v konkordančniku NoSketch Engine, je na voljo na tej povezavi.

2Ustvarjeni podkorpusi in informacije o njihovi velikosti so na voljo tukaj.

3Spodaj je naveden tudi primer zahtevnejšega iskalnega izraza v jeziku CQL, ki ga je treba uporabiti pri izdelavi spodnjega podkorpusa:

4Mandat1-Ženske6:

5<speech gender="F" & role_en="MP" & type_en="Regular speaker"/> within <session mandate_en="Term 1 .*" & organ="Državni zbor Republike Slovenije"/>

6S tem ukazom poiščemo vse izjave (atribut speech/govor)) govork (atribut F/Ž), ki so članice parlamenta (atribut MP/Član parlamenta) in redne govorke (atribut Regular speaker/Redni govornik), in sicer v govorih iz prvega mandata (atribut Term 1 .*/1. Mandat .*), ki so bili izrečeni v Državnem zboru Republike Slovenije (atribut Državni zbor Republike Slovenije).

7Če želimo ustvariti podkorpus govorov poslancev, moramo spremeniti le spol prek atributa speech gender/spol (speech gender="M"). Za podkorpus, ki vsebuje govore poslank in poslancev iz vseh mandatov, pa moramo najprej vključiti moški in ženski spol prek atributa speech gender/spol (speech gender="F|M"), nato pa še vse mandate prek atributa session mandate/mandat seje (session mandate_en="Term .*").

6.2.2 Uporaba frekvenčnih seznamov

1V podkorpusih, ustvarjenih v prejšnjem koraku, bomo analizirali govore poslank in poslancev skozi čas, in sicer na podlagi podatkov s frekvenčnih seznamov, ki so ena od najosnovnejših korpusnih tehnik. Frekvenčni seznami prikazujejo rezultate od najbolj do najmanj pogostega. To tehniko lahko na primer uporabimo za sestavljanje frekvenčnega seznama vseh besed, ki so bile izrečene v parlamentu oziroma v govorih izbrane poslanke ali izbranega poslanca. V tej nalogi bomo s to tehniko pridobili podatke o številu vseh poslank in poslancev v posameznem mandatu ter številu njihovih govorov, vključno s skupnim številom pojavnic v teh govorih.

1Videoposnetek, ki prikazuje izdelavo frekvenčnega seznama v konkordančniku NoSketch Engine, je na voljo na tej povezavi.

2Slika 4 prikazuje primer dveh frekvenčnih seznamov.

Slika 4. Frekvenčna seznama za poslanke iz prvega mandata. Na levi je prikazano število govorov, ki jih je posamezna poslanka prispevala, na desni pa je število pojavnic v teh govorih.
Slika 4. Frekvenčna seznama za poslanke iz prvega mandata. Na levi je prikazano število govorov, ki jih je posamezna poslanka prispevala, na desni pa je število pojavnic v teh govorih.


2Kot prikazuje Slika 4, je bilo v prvem mandatu prisotnih 14 poslank, ki so skupno izrekle več kot 3.500 govorov, kar je le malo manj kot milijon pojavnic. Povprečno je to skoraj 260 govorov oziroma 69.000 pojavnic na poslanko. Vendar pa je porazdelitev med poslankami zelo neenakomerna, pri čemer sega od skoraj 700 govorov oziroma več kot 170.000 pojavnic do manj kot 40 govorov oziroma 9.000 pojavnic.

3Po številu govorov je na prvem mestu Danica Simšič, članica Demokratske stranke Slovenije, manjše opozicijske stranke iz prvega mandata. Ta poslanka je prispevala 680 govorov ali skoraj 19 % vseh govorov v celotnem podkorpusu, kar je skoraj 3-kratno povprečje pri ženskah. Podatek o deležu govorov smo pridobili tako, da smo število njenih govorov delili s številom vseh govorov poslank (glej Slika 4, levo: Total frequency in Simšič, Danica), podatek o razmerju glede na povprečje pa smo pridobili tako, da smo število poslankinih govorov delili s povprečjem števila vseh govorov, ki ga dobimo tako, da skupno število govorov poslank delimo s številom vseh poslank (glej Slika 4, levo: Total frequency in Total number of items).

4Po številu pojavnic je poslanka z največjim prispevkom v tem podkorpusu Metka Karner Lukač, članica Slovenske ljudske stranke, najstarejše stranke v Sloveniji. Njeni govori vsebujejo 173.067 pojavnic ali 18 % celotnega podkorpusa, kar je skoraj 3-kratnik povprečja. Poslanka z najnižjim številom govorov in pojavnic je Mihaela Logar, prav tako članica Slovenske ljudske stranke, ki je v svojem 4-letnem mandatu spregovorila le 39-krat, v njenih govorih pa je nekaj več kot 9.000 pojavnic, kar je skoraj 20-krat manj od prvouvrščene govorke. Poleg tega je še zanimivo, da približno polovica vseh prispevkov pripada le trem poslankam, in sicer že omenjenima poslankama ter Bredi Pečan, članici Socialnih demokratov, katere govori so bili v povprečju tudi najdaljši. Ta podatek razberemo iz podatkov o povprečni dolžini govorov za posamezno poslanko, pri čemer povprečno dolžino govora izračunamo tako, da število vseh pojavnic za posamezno poslanko (glej Slika 4, desno) delimo s številom vseh govorov te iste poslanke (glej Slika 4, levo).

6.2.3 Primerjalna analiza

1Za potrebe primerjalne analize zastopanosti moških in žensk v slovenskem parlamentu skozi čas zabeležimo število poslancev in poslank ter število pojavnic v vsakem od 14 podkorpusov (glej razdelek 6.2.1 Izdelava podkorpusov). Ker zbirnih tabel s podatki ne dobimo neposredno v konkordančniku, si pomagamo tako, da podatke ročno vnesemo v preglednico, kot prikazuje Tabela 1. Grafični prikaz rezultatov si lahko ogledate na Sliki 5 in Sliki 6.

Tabela 1. Pregled velikosti podkorpusov siParl 2.0.Zaradi napake v metapodatkih korpusa, ki so bili pripisani enemu od poslancev (in sicer poslancu z imenom Geza, ki mu je bil napačno samodejno pripisan ženski spol najverjetneje zaradi kombinacije končnice –a, ki je sicer tipična za samostalnike ženskega spola, in redkosti imena), podatki za šesti mandat v času analize ne odražajo uradnega števila poslank, ki je po navedbah Kustec (2017) 39, in ne 38, kot prikazuje korpus.
Tabela 1. Pregled velikosti podkorpusov siParl 2.0.7


Slika 5: Delež poslank in poslancev v korpusu siParl 2.0 skozi čas.
Slika 5: Delež poslank in poslancev v korpusu siParl 2.0 skozi čas.


Slika 6: Prispevek poslank in poslancev v korpusu siParl 2.0, izmerjen v izrečenih pojavnicah skozi čas.
Slika 6: Prispevek poslank in poslancev v korpusu siParl 2.0, izmerjen v izrečenih pojavnicah skozi čas.


2Rezultati kažejo, da delež pojavnic, ki sestavljajo govore poslank, postopoma narašča skupaj z zastopanostjo žensk v parlamentu. Precejšen skok v zastopanosti žensk je mogoče opaziti predvsem v zadnjih dveh mandatih, vključenih v korpus siParl 2.0, kar je najverjetneje posledica sprejema spolnih kvot, v skladu s katerimi mora biti od leta 2011 35 % kandidatov na volitvah žensk (Selišnik in Antić Gaber, 2017). Pomembna pa je ugotovitev, da kljub temu, da so kvote eden najuspešnejših ukrepov za povečanje števila poslank (Selišnik in Antić Gaber, 2017), naša korpusna analiza prikazuje velika odstopanja med številom govork in številom pojavnic v njihovih govorih. Rezultati volitev so enostavno dostopni in raziskovalci in analitiki jih pogosto uporabljajo, število in vsebina govorov pa sta veliko težje dostopna, zato ju raziskovalci izven korpusnega jezikoslovja precej manj izčrpno preučujejo, kar predstavlja vrzel, ki jo želimo s to analizo premostiti. Podatki kažejo jasen trend, da poslanke prispevajo manjši delež vsebine, kot bi pričakovali glede na njihov delež v izbranem mandatu. To velja zlasti za drugi mandat, kjer govori poslank vsebujejo dvakrat manj pojavnic glede na njihovo število. Pravzaprav je le v četrtem mandatu prispevek žensk nekoliko večji od njihovega deleža v parlamentu. Zato lahko sklepamo, da več izvoljenih poslank ne pomeni nujno, da bo njihov glas tudi bolj prisoten v Državnem zboru. Vseeno pa se je v preteklih letih z večanjem števila poslank v parlamentu začelo povečevati tudi število njihovih govorov. Prispevek poslank se je s pičle desetine vseh govorov v parlamentu v prvih petih mandatih povečal na skoraj tretjino v zadnjih dveh mandatih, ki jih pokriva naš korpus.

6.3 NALOGA 2: Ključne teme poslank in poslancev

1Raziskave političnega diskurza žensk so pokazale, da ženske običajno razpravljajo o drugačnih temah kot moški. Več o vplivu spola na jezik si lahko preberete v razdelku 5.

2V Nalogi 2 želimo na podlagi govorov iz korpusa siParl 2.0 primerjati teme, o katerih razpravljajo poslanke in poslanci. Za nekatere parlamentarne korpuse je klasifikacija tem že na voljo (glej Nanni idr. 2018), za korpus siParl 2.0 pa to ne velja. Klasifikacijo tem je mogoče izvesti samodejno, kot v Karan idr. (2016), vendar pa je cilj tega gradiva pokazati učinkovitost raziskav parlamentarnih korpusov zgolj prek uporabe konkordančnikov, torej brez kakršnegakoli znanja programiranja, zaradi česar smo izbrali ročni pristop v dveh korakih. Ročni pristopi so še posebej primerni za zelo specifično razvrščanje tem, kot to velja za našo analizo, za katero še ne obstajajo računalniški modeli ali učne množice za razvoj takih modelov. Pri tem je treba opozoriti, da lahko tako pri samodejnem kot pri ročnem razvrščanju pride do napak, vendar lahko pri ročnem označevanju število napak, ki so posledica nenatančnosti ali pa tudi pristranskosti označevalca oziroma označevalke, zmanjšamo z večjim številom označevalk oz. označevalcev, s čimer pridobimo vpogled v stopnjo ujemanja med njimi, za nadaljnje delo pa lahko upoštevamo temo, ki jo je izbrala večina, oz. vse pripisane teme.

6.3.1 Luščenje ključnih besed

1V tej nalogi bomo uporabili uveljavljeno tehniko korpusne analize, ki ji rečemo luščenje ključnih besed. S to tehniko izbrani korpus primerjamo z referenčnim korpusom in tako pridobimo najbolj značilno besedišče izbranega korpusa, torej (pod)korpusa, ki ga analiziramo. Referenčni korpus pa je običajno velik reprezentativni korpus ustreznega jezika, lahko pa je tudi kateri koli drug (pod)korpus, ki ga želimo uporabiti kot referenčno točko za primerjavo. V tej nalogi bomo primerjali podkorpusa govorov poslank in poslancev za posamezni mandat. Tako bomo pridobili podatke, na podlagi katerih bomo lahko opredelili najbolj izstopajoče teme v slovenskem parlamentu.

1Videoposnetek, ki prikazuje izdelavo seznama ključnih besed v konkordančniku NoSketchEngine, je na voljo na tej povezavi.

2Ustvarjeni seznami ključnih besed, prikazanih kot leme s poenoteno malo začetnico, so na voljo tukaj:

3Sezname ključnih besed za vse štiri podkorpuse izvozimo v preglednico in jih ročno označimo (glej razdelek 6.3.3).

2Sliki 7 in 8 prikazujeta prvih 20 ključnih besed poslank in poslancev v sedmem mandatu. 8 Opazimo lahko velike razlike. Večina vseh prikazanih ključnih besed poslank je povezana s področjem zdravstvenega varstva, medtem ko ključne besede govorov poslancev pripadajo področjem zunanjih zadev, infrastrukture in pravosodja.

Slika 7: Prvih 20 ključnih besed poslank v primerjavi s poslanci v prvem mandatu.
Slika 7: Prvih 20 ključnih besed poslank v primerjavi s poslanci v prvem mandatu.


Slika 8: Prvih 20 ključnih besed poslancev v primerjavi s poslankami v prvem mandatu.
Slika 8: Prvih 20 ključnih besed poslancev v primerjavi s poslankami v prvem mandatu.


6.3.2 Analiza konkordanc

1Za nadaljnjo analizo izberemo prvih 100 ključnih lem z vsakega od štirih seznamov ključnih besed, pri čemer ne upoštevamo osebnih lastnih imen. Naš cilj je ročno kategorizirati leme, in sicer glede na prevladujočo temo, ki jo prepoznamo pri pregledu konkordanc za izbrano lemo. Konkordančni niz vsebuje seznam vseh pojavitev iskane pojavnice v kontekstu, kot prikazuje Slika 9:

  • Konkordance je mogoče neposredno prikazati s klikom leme na seznamu ključnih besed. Prikaže se stran, kjer je na vrhu zaslona prikazana izbrana lema z vsemi zadetki (glej številko 1).
  • Besede v rdeči barvi na sredini zaslona (glej številko 2) so zadetki iskane besede v našem podkorpusu, besedilo v črni barvi (glej številko 3) pa je kontekst.
  • Besedilo v modri barvi na levi (glej številko 4) so metapodatki. V našem primeru je prikazan podatek o govorcu.
  • S klikom želene konkordance lahko še dodatno razširimo kontekst (glej številko 5). Na podoben način lahko s klikom govorca pridobimo več metapodatkov.
  • Prikaz lahko tudi prilagodimo, in sicer prek Možnosti prikaza (glej številko 6), ter prikažemo več metapodatkov ali širši kontekst.
Slika 9: Razširjeni kontekst za prvi zadetek v konkordančnem nizu za ključno besedo »proporcionalen«.
Slika 9: Razširjeni kontekst za prvi zadetek v konkordančnem nizu za ključno besedo »proporcionalen«.


6.3.3 Primerjalna analiza

1Parlament je v prvi vrsti zakonodajno telo, v katerem potekajo zakonodajne in proračunske razprave, ki so strukturirane po ministrstvih. Zato nam bo seznam 14 ministrstev trenutne slovenske vlade služil kot seznam kategorij za ročno označevanje tem. Kategorije so navedene v Tabeli 2. Lahko bi uporabili tudi številne druge sezname tem, vendar je takšen nabor tem po našem mnenju najbolj naravna izbira v specifičnem okolju parlamentarnega diskurza. Tem 14 vsebinskim kategorijam bomo dodali še 4 tehnične kategorije za ključne besede, ki jih ni mogoče uvrstiti drugam: razno – za ključne besede, uporabljene v razpravah o več različnih temah; slog – za očitne pogovorne ali žargonske ključne besede, ki so izrazito značilne za posamezne govorce, ideologija – za ključne besede, uporabljene za ideološko označevanje (npr. partijski, socialist), in interakcija/postopkovnik – za ključne besede, ki naslavljajo druge poslance ali pa so del postopkovnika. V Tabeli 3 so navedeni ponazoritveni primeri ročno pripisanih tem za prvih 10 ključnih besed poslank in poslancev.

Tabela 2. Kategorije za označevanje ključnih besed. Zadnje štiri kategorije zapisujemo z velikimi tiskanimi črkami, da jih tako ločimo od vsebinskih kategorij.
Tabela 2. Kategorije za označevanje ključnih besed. Zadnje štiri kategorije zapisujemo z velikimi tiskanimi črkami, da jih tako ločimo od vsebinskih kategorij.


Tabela 3: Ponazoritveni primeri ročno pripisanih oznak glede na temo za prvih 10 ključnih besed poslank in poslancev v prvem mandatu.
Tabela 3: Ponazoritveni primeri ročno pripisanih oznak glede na temo za prvih 10 ključnih besed poslank in poslancev v prvem mandatu.


2Tabeli 4 in 5 vsebujeta povzetek rezultatov ročnega označevanja prvih 100 ključnih lem poslank in poslancev v prvem in sedmem mandatu. Rezultati kažejo, da je nabor tem skozi čas in med spoloma primerljiv. Kljub podobnemu številu opredeljenih vsebinskih tem se poslanci in poslanke pri najbolj izpostavljenih tematikah zelo razlikujejo.

Tabela 4: Teme prvih 100 ključnih besed poslank in poslancev v prvem mandatu.
Tabela 4: Teme prvih 100 ključnih besed poslank in poslancev v prvem mandatu.


Tabela 5: Teme prvih 100 ključnih besed poslank in poslancev v sedmem mandatu.
Tabela 5: Teme prvih 100 ključnih besed poslank in poslancev v sedmem mandatu.


3V prvem mandatu večina (54 %) vseh analiziranih ključnih besed poslank spada v dve tematski kategoriji: Zdravje in Delo, družina in socialne zadeve, pri poslancih pa sta najpogostejši temi s podobnim deležem (55 %) Infrastruktura in Javna uprava. V sedmem mandatu sta najpogostejši temi poslank enaki kot v prvem mandatu, vendar predstavljata večji delež ključnih besed (58 %), pri poslancih pa je najpogostejša tema postala Zunanje zadeve. Razdelitve tem med spoloma ni mogoče v celoti razložiti s korpusno analizo, vendar pa dobljeni rezultati, ki pri poslankah kažejo izrazito zanimanje za zdravstvene in socialnovarstvene teme, pri poslancih pa premik z infrastrukturnih tematik na zunanjepolitične, zelo nazorno odražajo stanje v družbi. V času neodvisnosti je morala novonastala država oblikovati javno upravo in izgraditi infrastrukturo, za kar so bile v prvem mandatu potrebne intenzivne razprave. Zadnji mandat pa zaznamujejo živahna mednarodna trgovina in večje mednarodne varnostne grožnje, kar vpliva na zakonodajne in proračunske odločitve. V sedmem mandatu lahko še vedno zasledimo poudarjeno zanimanje za socialnovarstvene tematike, poleg tega pa tudi intenzivnejše razprave s področja zdravstva, kar je v veliki meri posledica močnega pritiska na proračun zaradi hude gospodarske krize v tistem obdobju, ki je negativno vplivala tudi na že propadajoči sistem javnega zdravstva.

4Opazimo lahko tudi, da v prvem mandatu poslanci in poslanke namenjajo skoraj enako pozornost (glede na delež analiziranih ključnih besed) večjemu številu tem kot v sedmem mandatu (5 skupnih tem z enako pomembnostjo v prvem mandatu oz. 3 skupne teme v sedmem mandatu). V prvem mandatu tako poslanci le rahlo pogosteje kot poslanke razpravljajo o Javni upravi (M: 14 %, Ž: 11 %), Gospodarstvu in tehnologiji (M: 8 %, Ž: 6 %) ter Pravosodju (M: 2 %, Ž: 1%), poslanke pa nekaj pogosteje o Kmetijstvu, gozdarstvu in prehrani (M: 3 %, Ž: 4 %), medtem ko vsi razpravljajo enako pogosto o Obrambi (1 %). V sedmem mandatu so glede na delež analiziranih ključnih besed poslankam in poslancem enako pomembne zgolj tri teme, in sicer Finance (4 %), Pravosodje (3 %) in Javna uprava (3 %). Za poglobitev rezultatov bi bilo zanimivo raziskati, na kakšne načine poslanke in poslanci pristopajo k tem skupnim temam in o njih razpravljajo.

5Med temami, ki se pojavijo zgolj v podkorpusu govorov poslank, najdemo Izobraževanje, znanost in šport v prvem mandatu ter Zdravje, Delo, družino in socialne zadeve ter Kulturo v sedmem mandatu. Teme, ki se pojavijo zgolj pri poslancih, pa so Okolje in prostor ter Notranje zadeve v obeh parlamentarnih mandatih, Zunanje zadeve (v prvem mandatu) in Obramba (v sedmem mandatu). Presenetljivo je, da se najpogostejše tri teme poslank sploh ne pojavijo na seznamu tem poslancev, medtem ko se najpogostejše teme poslancev (Infrastruktura, Javna uprava, Zunanje zadeve) pojavijo na seznamu tem poslank, čeprav je delež teh tem majhen. Poleg tega je zanimivo, da tema Gospodarstvo in tehnologija pri poslankah izgubi na pomembnosti med prvim in sedmim mandatom, medtem ko to ne velja za poslance.

6Rezultati poleg različnih področij zanimanja kažejo tudi na slogovne razlike v razpravah poslank in poslancev. V obeh mandatih so poslanci uporabili precej več slogovno zaznamovanih besed (tj. Očitnih pogovornih ali žargonskih besed, ki so izrazito značilne za posamezne govorce) kot poslanke. Uporaba takšnih besed pri poslancih se je v sedmem mandatu v primerjavi s prvim mandatom potrojila, kar po eni strani kaže na večjo sproščenost poslancev na splošno, po drugi pa označuje spremembo v kulturi razpravljanja, ki je v zadnjih dveh desetletjih postala živahnejša in bolj neformalna. Opazimo lahko tudi, da so ideološke besede, ki običajno delujejo razdvajajoče, značilne le za poslance. To je v skladu z literaturo, kjer avtorji ugotavljajo, da so moške sporazumevalne strategije bolj agresivne in tekmovalne, medtem ko je ženski slog sporazumevanja bolj sodelovalen (Coates, 1997). Vendar naj opozorimo, da bi bilo treba te zaključke preveriti s podrobnejšo analizo, saj nekatere sodobne raziskave kažejo, da na sporazumevanje vplivajo številni dejavniki in je zato razlikovanje med moškim in ženskim načinom sporazumevanja pogosto preveč simplistično (prim. Ilie, 2013).

7Naša analiza kaže tudi na opazne razlike v vlogah in zanimanjih poslank in poslancev, kar je v skladu s prejšnjimi raziskavami, iz katerih je razvidno, da se ženske v primerjavi z moškimi bolj osredotočajo na t. i. Mehka zakonodajna področja. Diahrone primerjave razkrivajo, da temi Zdravje in Socialne zadeve ostajata med prednostnimi zanimanji poslank, osredotočenost poslancev pa se je premaknila s tem Infrastruktura in Javna uprava na Zunanje zadeve. V prvem mandatu je bila najpogostejša skupna tema Javna uprava, v zadnjem mandatu pa so poslanke in poslanci najpogosteje razpravljali o temi Finance. To pa ne pomeni, da poslanke zdaj več razpravljajo o t. i. Trdih zakonodajnih področjih. Pravzaprav je ravno nasprotno, saj analiza kaže, da so se poslanke v sedmem mandatu celo bolj osredotočale na t. i. Mehka zakonodajna področja kot v prvem mandatu.

6.4 NALOGA 3: Obravnava tematik, povezanih z ženskami

1Ta naloga se naslanja na sorodne raziskave (prim. Blaxill in Beelen, 2016), v katerih so raziskovalci ugotavljali, kako pogosto so bile v parlamentarni zgodovini naslovljena vprašanja enakosti spolov (npr. pravice žensk, diskriminacija itd.) ter kdo in na kakšen način je takšna vprašanja odpiral. Zanimivo je, da je vpliv spola očitno opazen tudi v državah z visokim deležem žensk v parlamentu. Ena takšnih je Švedska, za katero so Bäck idr. (2014) ugotovili, da poslanke redkeje razpravljajo o vprašanjih s t. i. trdih zakonodajnih področij. Antić Gaber in Ilonszki (2003) pravita, da družba običajno pričakuje, da bodo poslanke dejavne na drugih področjih politike kot moški. Pri tem gre, kot to ugotavljajo politologi (glej Osborn, 2012), za področja politike, ki so še posebej povezana z ženskami zaradi njihove zgodovinske vloge v družbi ali neposrednega vpliva na življenje žensk.

2Ker se pri vprašanjih enakosti spolov še vedno največkrat govori o neenaki vlogi žensk v družbi in njihovem posebnem položaju, iz katerega izhajajo tako določene pravice in teme, ki se tičejo njihovega življenja, kot tudi diskriminatorne prakse, bomo v Nalogi 3 raziskali, katere tematike, povezane z ženskami, prevladujejo v parlamentarnih razpravah in kako pogosto se o njih razpravlja, pri čemer se bomo osredotočili na uporabo samostalnika »ženska« kot eksplicitnega pokazatelja razprav o teh tematikah.

6.4.1 Delo s frekvencami

1Najprej nas zanima, kako pogosto poslanci in poslanke uporabljajo lemo samostalnika »ženska« v različnih časovnih obdobjih (1992–2018). Izvedemo poizvedbe v vseh podkorpusih in v preglednico zabeležimo podatke o frekvenci, kot prikazuje Tabela 6. Ker želimo primerjati podkorpusa različnih velikosti, moramo namesto absolutne frekvence uporabiti normalizirano frekvenco, pri kateri je uporabljeno enako skupno število vseh besed v (pod)korpusu. Absolutna frekvenca je v primeru primerjave korpusov različnih velikosti namreč lahko zavajajoča. Če na primer pogledamo podatka o absolutni frekvenci izbrane besede za drugi mandat (Ž: 190; M: 794), bi lahko sklepali, da poslanci uporabijo samostalnik »ženska« štirikrat pogosteje kot poslanke. Ker pa je podkorpus govorov poslank v tem parlamentarnem mandatu veliko manjši od podkorpusa govorov poslancev, nam šele normalizirana frekvenca (v našem primeru na milijon besed), pove, da so ta samostalnik poslanke izrekle pravzaprav petkrat pogosteje (249,29) kot poslanci (50,36).

1Prikaz poizvedbe v konkordančniku NoSketchEngine za lemo samostalnika »ženska« si lahko ogledate v videoposnetku o luščenju kolokacij (min. 00:10–1:13).

2Konkordančni niz za lemo samostalnika »ženska« je na voljo tukaj:

Slika 10: Začetek konkordančnega niza za lemo samostalnika »ženska« z absolutno frekvenco (številka 1) in normalizirano frekvenco (številka 2).
Slika 10: Začetek konkordančnega niza za lemo samostalnika »ženska« z absolutno frekvenco (številka 1) in normalizirano frekvenco (številka 2).


Tabela 6. Podatki o absolutni in normalizirani frekvenci za lemo samostalnika »ženska« v korpusu siParl 2.0.
Tabela 6. Podatki o absolutni in normalizirani frekvenci za lemo samostalnika »ženska« v korpusu siParl 2.0.


2Na splošno je normalizirana frekvenca iskane besede za celotno časovno obdobje, ki ga zajema korpus siParl 2.0, skoraj petkrat višja v podkorpusu govorov poslank kot v podkorpusu govorov poslancev (221,21 proti 45,99). Kot je razvidno iz Slike 11, poslanke v svojih govorih pogosteje omenjajo ženske kot poslanci. Čeprav je v obdobju med drugim in četrtim mandatom (1996–2008) mogoče opaziti intenzivnejšo obravnavo teh področij pri poslankah, je v zadnjih mandatih njihovo zanimanje za ta področja izrazito usahnilo.

3Najbolj presenetljive rezultate pri poslankah smo odkrili v tretjem in petem mandatu. V tretjem mandatu je normalizirana frekvenca iskane besede dosegla rekordno visoko stopnjo, kar je lahko posledica manjšega števila poslank v prejšnjih dveh parlamentarnih mandatih in neenakopravnega položaja žensk v družbi nasploh. Ker pa je enak trend mogoče opaziti tudi v podkorpusu govorov poslancev, se zdi, da so k temu prispevali tudi drugi razlogi. Za boljši vpogled v ta pojav smo izvedli kvalitativno analizo, pri kateri smo pregledali 50 konkordanc petih najdejavnejših poslancev. Iz konkordanc je razvidno, da se je v tistem času veliko razpravljalo o zakonodaji prav v zvezi z vprašanji enakosti spolov (npr. zakonodaja o enakih možnostih in spolnih kvotah). Skoraj desetletje pozneje, v petem mandatu, se je število omemb iskane besede v podkorpusu govorov poslank nenadoma zmanjšalo in padlo celo pod vrednost frekvence pred letom 2000, kljub precej večjemu številu poslank v parlamentu. Peti mandat je potekal v obdobju velike svetovne gospodarske krize, ki je Slovenijo močno prizadela in je bila verjetno osrednji predmet parlamentarnih razprav, vendar bi bilo to treba potrditi z nadaljnjo raziskavo in kontekstualizacijo ob uporabi kvalitativnih metod, kot je analiza konkordanc.

4Zanimivo je tudi, da se v četrtem mandatu kljub drugemu najnižjemu številu poslank samostalnik »ženska« še vedno zelo pogosto pojavlja v primerjavi s šestim in sedmim mandatom, kjer je bilo število poslank precej večje, frekvenca iskane besede pa skoraj dvakrat nižja. Kot smo opazili že pri splošnem doprinosu poslank k razpravam (glej razdelek 6.2.3), kjer smo odkrili veliko razhajanje med številom poslank in številom besed, ki so jih izrekle, ti rezultati znova kažejo, da zgolj večje število poslank ne zagotavlja intenzivnejše razprave o tematikah, ki zadevajo ženske.

Slika 11: Normalizirana frekvenca za lemo samostalnika »ženska« v govorih poslank in poslancev v korpusu siParl 2.0.
Slika 11: Normalizirana frekvenca za lemo samostalnika »ženska« v govorih poslank in poslancev v korpusu siParl 2.0.


6.4.2 Luščenje kolokacij

1Predstavili bomo še eno priljubljeno tehniko korpusne analize, in sicer luščenje kolokacij. S to tehniko, ki temelji na statističnih testih, pridobimo seznam besed, ki se ob jedrni besedi pojavljajo pogosteje, kot bi bilo to naključno verjetno. Kolokacije se najpogosteje uporabljajo v leksikografiji in na sorodnih področjih uporabnega jezikoslovja, mi pa jih bomo uporabili kot sredstvo za raziskovanje konceptov ali tem, o katerih se razpravlja v parlamentu.

2Da bi lahko ugotovili, o katerih tematikah, ki zadevajo ženske, se v parlamentu največ razpravlja, bomo analizirali kolokacije samostalnika »ženska« v dveh podkorpusih, ki vsebujeta govore poslank oziroma poslancev iz vseh sedmih mandatov, torej podkorpusa VsiMandati-Ženske in VsiMandati-Moški.

1Videoposnetek, ki prikazuje postopek luščenja kolokacij v konkordančniku NoSketchEngine, je na voljo na tej povezavi.

2Izluščimo kolokacije v razponu ene besede levo in ene besede desno od jedrne besede (tj. leme samostalnika »ženska«), pri čemer se mora kolokacijski kandidat (tj. beseda, ki se tipično pojavlja ob jedrni besedi) v korpusu pojaviti vsaj petkrat, skupaj z jedrno besedo v določenem razponu pa vsaj trikrat. Razpon in najnižjo frekvenco je mogoče nastaviti ročno in sta odvisna od jedrne besede, velikosti korpusa ter cilja naše raziskave. Ker želimo analizo v tem gradivu omejiti na ustaljene besedne zveze, uporabljamo ozek razpon in stroga merila glede frekvence.

3Za določanje trdnosti kolokacij uporabimo statistično mero logDice. Čeprav konkordančnik NoSketch Engine ponuja tudi druge mere, po katerih se izračuna trdnost kolokacij, kot sta Mutual Information ali T-score, izberemo mero logDice, ker nanjo ne vpliva velikost korpusa in so zato rezultati uporabni za primerjalno analizo tudi v primeru uporabe podkorpusov različnih velikosti, kot to velja za našo analizo.

4Seznama kolokacij za lemo samostalnika »ženska« sta na voljo tukaj:

5Oba seznama kolokacij uvozimo v preglednico in ju ročno analiziramo.

6.4.3 Primerjalna analiza

1Z vsakega seznama vzamemo prvih 100 kolokacijskih kandidatov (tj. besed, ki se tipično pojavljajo ob jedrni besedi in torej skupaj z njo tvorijo kolokacijo) in jih ročno razdelimo v tri kategorije: ženske, moški in skupno9. Nato vsako besedo razvrstimo v enega od sedmih tematskih sklopov, ki smo jih oblikovali na podlagi predhodnega pregleda konkordanc, kot prikazuje Tabela 7. Kolokacijskim kandidatom, ki so slovnične besede (na primer predlogi) in niso uporabljeni v konkordancah na eno prevladujočo temo, pripišemo oznako Razno.

Tabela 7: Primeri sklopov kolokacij.
Tabela 7: Primeri sklopov kolokacij.


2Rezultati, predstavljeni v Tabeli 8, kažejo, da se nekaj več kot polovica kolokacij (51 %) pojavlja tako pri poslankah kot pri poslancih, kar kaže na skupne točke v razumevanju položaja žensk v sodobni družbi. Velika večina skupnih kolokacij (skoraj 70 %) spada v prva dva tematska sklopa: Politika, zastopanost in enakopravnost in Družbeni status in zaposlitev, in se nanaša na koncepte, povezane z zastopanostjo žensk (npr. »participacija«), njihovim družbenim položajem (npr. »samski«) in enakostjo (npr. »emancipacija«).

Tabela 8: Frekvenca tematskih sklopov za prvih 100 kolokacijskih kandidatov v govorih poslank in poslancev v vseh sedmih mandatih.
Tabela 8: Frekvenca tematskih sklopov za prvih 100 kolokacijskih kandidatov v govorih poslank in poslancev v vseh sedmih mandatih.


3Opazimo lahko tudi, da so v podkorpusu govorov poslank primerljivo zastopani vsi tematski sklopi razen enega, skupaj pa pokrivajo skoraj 60 % kolokacij. Tako je edina izjema tematski sklop Proaktivnost žensk in opolnomočenje. Kolokacije, ki spadajo v ta tematski sklop, so približno dvakrat redkejše kot kolokacije iz katerega koli drugega sklopa. V podkorpusu govorov poslancev večina kolokacij (61 %) spada v tri tematske sklope, in sicer Problemi in nasilje, Politika, zastopanost in enakopravnost in Proaktivnost žensk in opolnomočenje. Poleg tega podroben pregled oznak razkriva, da se poslanci osredotočajo predvsem na družbeni status žensk (npr. »poročen«) in njihove težave (npr. »zatiranje«) ter na njihovo proaktivnost in opolnomočenje (npr. »sposoben«), medtem ko težavam, povezanim z zaposlitvijo in zdravjem žensk, ne posvečajo posebne pozornosti. Kolokacije iz podkorpusa govorov poslank se v prvi vrsti nanašajo na področje zdravstva (npr. »zdrav«) in ukrepe, vezane na pomoč in zaščito (npr. »omogočati«). Tem sledijo kolokacije, ki se nanašajo na družbeni status žensk (npr. »izobrazba«) in nasilje (npr. »posiljen«), kar je spet v nasprotju s podkorpusom govorov poslancev, kjer je večji poudarek na težavah, ki ne vključujejo nasilja (npr. »poniževanje«). Podobno kot v podkorpusu govorov poslancev pa tudi v podkorpusu govorov poslank med prvimi 100 kolokacijskimi kandidati ni besed, povezanih z zaposlitvijo.

4Ti rezultati kažejo, da poslanke poskušajo obravnavati številna vprašanja, s katerimi se ženske srečujejo na različnih področjih življenja, in sicer od zdravstvenih vprašanj do nasilja nad ženskami in težav pri političnem delovanju. Poslanci pa se bolj osredotočajo na neenakopravnost žensk v sodobni družbi in ženske vidijo kot dejavne udeleženke v procesu sprememb. Ti rezultati potrjujejo tudi ugotovitve avtoric Antić Gaber in Ilonszki (2003), ki sta opazovali dejavnost žensk v slovenskem parlamentu v krajšem obdobju (1996–2004) in z raznolikimi nekorpusnimi metodami analize pokazali, da med poslankami in poslanci obstaja jasna razlika med zakonodajnimi prioritetami, pri čemer sta opredelili podobne teme kot naša analiza.

5Naša zadnja ugotovitev zadeva veliko število slovničnih besed v podkorpusu govorov poslank, ki so skoraj štirikrat pogostejše kot v podkorpusu govorov poslancev. Slovnične besede kot kolokacijski kandidati v podkorpusu govorov poslank večinoma vključujejo prislove, predloge, veznike, zaimke in števnike, v podkorpusu govorov poslancev pa prevladujejo le števniki. Podobno kot smo ugotovili pri analizi ključnih besed (glej razdelek 6.3.3), to znova kaže na drugačen slog razpravljanja pri poslankah. Ta ugotovitev je skladna s sorodnimi raziskavami, v katerih raziskovalci poročajo, da ženske običajno uporabljajo več jezikovnih sredstev, kot so diskurzni omejevalci, vljudnostne oblike in vprašalni pristavki (Coates, 1997), več intenzifikatorjev in (predvsem ocenjevalnih) pridevnikov (Poynton, 1989) ter več osebnih zaimkov kot moški, ki pri sporazumevanju uporabljajo več števnikov, členov in predlogov (Newman idr., 2008).

Notes

2. Slovensko različico konkordančnika izberete v zgornjem desnem kotu s klikom simbola zobnika in izbiro ustreznega jezika s spustnega seznama.

3. Zaradi izida nove različice konkordančnika je ta trenutno zgolj delno preveden v slovenščino.

4. Delež temelji na uradnem številu vseh poslank, kot ga navaja Kustec (2017), nato pa je deljen s številom vseh poslank in poslancev (tj. 90). Ta delež je rahlo višji od deleža, navedenega v naši analizi, v kateri smo dosledno uporabljali le podatke iz korpusa. Ker le redko vsi izvoljeni poslanci in poslanke ostanejo na istem položaju celoten mandat, jih nato zamenjajo drugi poslanci oziroma poslanke. To se odraža v korpusu, ki vključuje vse poslanke in poslance, in ne le tistih, ki so bili izvoljeni na volitvah. Glede na podatke iz korpusa je skupno število poslancev in poslank na mandat tako večje od 90.

5. Pri oznakah v korpusu je uporabljen generični moški spol.

6. Ker je to gradivo na voljo v slovenščini in angleščini, so poimenovanja podkorpusov v konkordančniku dvojezična. Vendar pa v tem gradivu zaradi jasnosti in jedrnatosti uporabljamo zgolj slovenski del imena podkorpusov.

7. Zaradi napake v metapodatkih korpusa, ki so bili pripisani enemu od poslancev (in sicer poslancu z imenom Geza, ki mu je bil napačno samodejno pripisan ženski spol najverjetneje zaradi kombinacije končnice –a, ki je sicer tipična za samostalnike ženskega spola, in redkosti imena), podatki za šesti mandat v času analize ne odražajo uradnega števila poslank, ki je po navedbah Kustec (2017) 39, in ne 38, kot prikazuje korpus.

8. Konkordančnik NoSketchEngine za računanje ključnih besed uporablja formulo Simple Maths.

9. Kategorija skupno, kot nakazuje njeno ime, združuje kolokacijske kandidate, ki se pojavijo tako na seznamu za podkorpus govorov poslank kot za podkorpus govorov poslancev.