Korpusa analīze
Studiju kursa īstenotājs
Dzirciema iela 16, Rīga, szf@rsu.lv
Par studiju kursu
Mērķis
Priekšzināšanas
Studiju rezultāti
Zināšanas
1.Spēj atpazīt nozīmes rašanos principus un nozīmes paradigmu pamata atšķirības, pārzinās valodas korpusa veidošanas un lietošanas principus.
Prasmes
1.Prot strādāt ar Sketch Engine korpusu programmu, noteikt vārdu biežumus, atrast konkordances un kolokācijas, iegūt un analizēt valodas lietojuma statistisku, interpretēt datus kvalitatīvi un kvantitatīvi.
Kompetences
1.Formulē nozares problēmu kā valodas lietojuma problēmu, izvirza hipotēzi, iegūst un interpretē kvalitatīvos un kvantitatīvos datus, izdara secinājumus un izvirza rekomendācijas.
Vērtēšana
Patstāvīgais darbs
|
Virsraksts
|
% no gala vērtējuma
|
Vērtējums
|
|---|---|---|
|
1.
Patstāvīgais darbs |
-
|
-
|
|
Studenta specializācijas nozares būtiski apstrīdamo konceptu nozīmes interpretācija, izmantojot latviešu valodas korpusus.
Lai izvērtētu studiju kursa kvalitāti kopumā, studentam jāaizpilda studiju kursa novērtēšanas anketa Studējošo portālā.
|
||
Pārbaudījums
|
Virsraksts
|
% no gala vērtējuma
|
Vērtējums
|
|---|---|---|
|
1.
Pārbaudījums |
-
|
-
|
|
Sociālo zinātņu terminu un/vai studenta specializācijas nozares atslēgas vārdu lietojums politiskajā, juridiskajā, mediju un ikdienas publiskajā diskursā.
Referāts iekļauj šādas sadaļas:
- pētniecības problēmas formulējums saistībā ar valodas lietojumu kādā sabiedrības dzīves jomā (tieslietas, žurnālistika, politika, veselības aprūpe, ekonomika, sabiedriskas attiecības, izglītība) (1/2 lpp.);
- atslēgas vārdu (jēdzienu, terminu, konceptu) saraksts un to izvēles pamatojums (1-3 vārdi);
- statistiskās hipotēzes par atslēgas vārdu lietošanu korpusos un subkorpusos (3-5 hipotēzes);
- pētījumam izvēlēto korpusu apraksts un izvēles pamatojums (1/2 lpp.);
- Sketch Engine vaicājumu apraksts (vienam atslēgas vārdam, ja citu vārdu vaicājumi ir līdzīgi) (1/2 lpp.);
- statistisko datu apkopojums tabulās (biežums, normalizētais biežums, relatīvais biežums, t-vērtība, MI-vērtība, logDice, statistiskais nozīmīgums z testā, statistiskais nozīmīgums Pīrsona testā χ2, Cramer's V - atkarībā no petījuma vajadzībām), lietoto formulu apraksts;
- konkordances interpretācija (līdz 1 lpp.) ar vaicājuma rezultātu piemēriem;
- statistisko datu interpretācija (līdz 1/2 lpp.);
- kvalitatītvo un kvantitatīvo datu integrācija secinājumos (1/2 lpp.).
Referāta apjoms: 4-5 lpp. teksts; 1-3 lpp. tabulas un konkordanču piemēri.
|
||
|
2.
Pārbaudījums |
-
|
-
|
|
Pārzina korpusus, identificē pētījuma problēmu, formulē hipotēzi, atlasa atslēgas vārdus, atrod un interpretē kolokācijas un konkordances, iegūst un apstrādā statistiskas datus, izdara secinājumus. Patstāvīgais darbs, piedalīšanās nodarbībās, eksāmens.
|
||
Studiju kursa tēmu plāns
-
Video lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
2
|
Tēmas
|
Korpusa jēdziens. Valodas lietojuma statistiskās likumsakarības. Sketch Engine meklētājs.
|
-
Video lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
2
|
Tēmas
|
Vārdu biežums. Datu normalizācija un relatīvais biežums.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Valodas lietojuma problēmas formulējums, atslēgas vārdu atlase.
|
-
Video lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
2
|
Tēmas
|
Vārdu biežums (turp.). Konkordance.
|
-
Video lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
2
|
Tēmas
|
Kolokācija. Statistiskā analīze (MI-, MS-, t-vērtības)
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Vārdu nozīmes definīcija: vārdnīcas un korpuss.
|
-
Video lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
2
|
Tēmas
|
Kolokācija (trup.). Statistiskā analīze (logDice).
|
-
Video lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
2
|
Tēmas
|
Korpusa statistika (Pīrsona tests hi kvadrātā, Cramer's V, Atlikumi)
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Pētāmo vārdu kolokācijas: kvalitatīvā un kvantitatīvā analīze.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Pētījuma prezentācija un apspriešana.
|
Bibliogrāfija
Obligātā literatūra
Kruks, S., I. Skulte. (2016). „Politikas izzušana Saeimas diskursā”. Latvijas Zinātņu akadēmijas Vēstis: 49-56.
Kruks, S. (2020). “Uzticības, sadarbības un vienotības konceptu izpratne Nacionālajā attīstības plānā 2021.-2027. gadam”. Akadēmiskā Dzīve 56: 131-147.
McEnery, Tony and Andrew Hardie. (2012). Corpus Linguistics. Method, Theory and Practice. Oxford: Oxford University Press.
Paquot, M. and S. Gries. (2020). Practical Handbook of Corpus Linguistics. Springer.
Papildu literatūra
Barczewska, Shala. (2017). Corpus-Based Analysis of US Press Discourse. Cambridge Scholars Publisher.
Cunningham, Clark D. and Jesse Egbert. (2020). Analyzing legal discourse in the United States. Pp. 462-480 in Friginal E., Hardy J. (eds) The Routledge Handbook of Corpus Approaches to Discourse Analysis. London: Routledge.
Darģis, R., G. Rābante-Buša, I. Auziņa, S. Kruks. (2016). „ParliSearch – a system for large text corpus discourse analysis”. Pp. 115-121 in I. Skadiņa, R. Rozis (eds) Human Language Technologies – The Baltic Perspective. IOS Press.
Gerring, J. (1999). "What Makes a Concept Good? A Criterial Framework for Understanding Concept Formation in the Social Sciences". Polity, Vol.31, No.3, (Spring), pp. 357–393.
Kaal, B., I. Maks and A. van Elfrinkhof. (2014). From Text to Political Positions. Amsterdam: John Benjamins.
Marmor, Andrei and Scott Soames. (2011). Philosophical Foundations of Language and Law. Oxford: Oxford University Press.