1V demokratičnih državah parlament deluje kot osrednje predstavniško in zakonodajno telo. To pomeni, da ga sestavljajo izvoljeni predstavniki državljanov1, ki v njihovem imenu sodelujejo pri oblikovanju in sprejemanju zakonov ter tako urejajo vsa področja življenja in delovanja v družbi. Parlament pogosto nadzoruje tudi delo izvršilne oblasti (Norton, 2002). Zaradi ključne vloge, ki jo ima parlament pri razvoju in življenju družbe, je delovanje parlamenta vedno znova pomemben in aktualen predmet humanističnih in družboslovnih raziskav.
2V zadnjih dveh desetletjih so zaradi napredka tehnologije, povečanega zanimanja medijev in državljanov za delo parlamenta ter želje po večji transparentnosti podatki o dogajanju v parlamentu, vključno z zapisi parlamentarnih sej, postali bolj dostopni (Norton, 2002). Zapisi sej so edinstven raziskovalni vir, saj parlamentarne razprave odsevajo politično, družbeno in kulturno vzdušje določenega časa (Ilie, 2010). Zaradi ustaljenosti parlamentarnega diskurza in digitalnega formata pa so zapisi parlamentarnih sej tudi priročen vir za izdelavo parlamentarnih korpusov. Pri tem gre za časovno zamejene in strukturirane nabore zapisov sej, ki so dodatno opremljeni z metapodatki o govorcih in govorih ter jezikoslovnimi oznakami (Truan in Romary, 2021).
3Parlamentarni korpusi običajno vsebujejo velike količine podatkov, ki jih je v razumnem času nemogoče obdelati ročno. Eno od priljubljenih orodij za analizo korpusov so konkordančniki, s katerimi se lahko spoznate v sorodnem učnem gradivu (gl. Fišer in Pahor de Maiti, 2021), druga orodja, npr. Orange (Demšar idr., 2013), ki ga bomo uporabljali v tem učnem gradivu, pa omogočajo uporabo naprednih avtomatskih analitičnih tehnik oz. t. i. rudarjenje besedil, na podlagi katerega je iz velikih količin podatkov mogoče izluščiti vzorce in informacije, ki na prvi pogled niso razvidni iz besedila (Wiedemann, 2016).
4Tehnike rudarjenja besedil so raznovrstne in se jih med drugim uporablja za analizo čustvene zaznamovanosti parlamentarnih razprav (Rheault idr., 2016; Rudkowsky idr., n.d.), prepoznavo politične opredelitve (Bergmann idr., 2018) ali stališča poslancev (Abercrombie in Batista-Navarro, 2020), modeliranje argumentacije v parlamentarnih razpravah (Petukhova idr., 2015) in podobno. Ena od njih je tudi tematsko modeliranje (Meeks in Weingart, 2012), ki sodi med najbolj razširjene tehnike s področja besedilnega rudarjenja v digitalni humanistiki in ki se ji bomo posvetili v tem učnem gradivu.
5Namen učnega gradiva je raziskovalce s področja humanistike in družboslovja vpeljati v svet rudarjenja besedil ter prikazati vrednost tovrstnih pristopov za družboslovne in humanistične raziskave. Učno gradivo razlaga posebnosti parlamentarnega diskurza in uporabo tematskega modeliranja za reševanje konkretnih raziskovalnih vprašanj. Analiza temelji na prosto dostopnem korpusu slovenskih parlamentarnih razprav ParlaMint (Erjavec idr., 2021) ter na orodju Orange (Demšar idr., 2013), ki uporabniku brez znanja programiranja omogoča uporabo naprednih metod rudarjenja besedil.
1. V učnem gradivu uporabljamo generični moški spol.