1V tem gradivu najprej predstavimo osnove korpusnega jezikoslovja in korpusne analize, čemur sledi uvod v značilnosti specializiranih korpusov parlamentarnih razprav in jedrnat pregled raziskav s področja jezika in spola. Drugi del učnega gradiva je namenjen praktičnemu prikazu najbolj razširjenih tehnik korpusne analize, kot so konkordančni nizi, frekvenčni seznami, ključne besede in kolokacije. Predstavljene tehnike uporabimo za raziskovanje zastopanosti žensk v slovenskem parlamentu, njihovih interesnih področij in govora o ženskah, pri čemer v analizo vključimo primerjavo z značilnostmi, ki veljajo za poslance in skozi čas.
2Vsi viri in orodja, uporabljeni v tem gradivu, so brezplačno na voljo v spletu. Za iskanje po korpusu uporabljamo NoSketch Engine, za dodatne ročne analize in predstavitve rezultatov pa enega od urejevalnikov preglednic (npr. Google Spreadsheet ali MS Excel).
1Besedila v modrih okvirčkih vsebujejo razlago uporabljenih funkcij in povezavo do videoposnetka, ki prikazuje, kako relevantno funkcijo poženemo v konkordančniku. Poleg tega so v okvirčkih tudi povezave do rezultatov v konkordančniku, kar bralkam in bralcem omogoča, da ponovijo analizo na svojem računalniku.
3Iskanje po korpusu siParl 2.0 je mogoče prek konkordančnikov NoSketch Engine in KonText na spletnem mestu CLARIN.SI – slovenski center v okviru Evropske raziskovalne infrastrukture za jezikovne vire in tehnologije CLARIN ERIC. Prek repozitorija CLARIN.SI je korpus siParl 2.0 mogoče tudi prenesti v računalnik in ga nato analizirati z drugimi korpusnimi orodji ali orodji za rudarjenje besedil, npr. z orodjem za korpusno analizo Antconc ali s postopki za osnovno obdelavo besedil v jeziku R.
4To gradivo je posodobljena različica izvirnega učnega gradiva, v katerem je bila uporabljena prva različica korpusa siParl. Korpus siParl 2.0 v primerjavi s korpusom siParl 1.0 vsebuje bogatejše metapodatke o govorkah in govorcih ter sejah, kar omogoča razlikovanje med poslankami in poslanci ter drugimi govorkami in govorci v parlamentu. Poleg tega govori vsebujejo oznake parlamentarnih mandatov, kar omogoča lažjo primerjalno analizo elementov med posameznimi parlamentarnimi sklici. Druga različica korpusa vsebuje tudi dodatne ravni jezikoslovnih oznak, kot so skladenjske oznake in imenske identitete, ki pa jih v naši analizi ne bomo uporabljali, zato jih v gradivu ne obravnavamo.
5Če želite tehnike korpusne analize takoj preizkusiti na praktičnih primerih, nadaljujte z nalogami v 6. razdelku. Naslednji trije razdelki (3, 4 in 5) so namreč namenjeni poljudnemu pregledu teoretičnih osnov in najpomembnejše terminologije. Čeprav nalogam v 6. razdelku lahko sledite brez predhodnega branja omenjenih treh razdelkov, vas spodbujamo, da se z njihovo vsebino na neki točki seznanite, saj predstavljene osnove zagotavljajo celovito razumevanje in samostojno rabo analitičnih postopkov ter ustrezno interpretacijo rezultatov.