Kategoriju datu analīze
Studiju kursa īstenotājs
Baložu iela 14, A korpuss, Rīga, statistika@rsu.lv, +371 67060897
Par studiju kursu
Mērķis
Priekšzināšanas
Studiju rezultāti
Zināšanas
1.• Pēc sekmīgas kursa apgūšanas studējošie pārzinās statistiskās analīzes metodoloģijas klāstu, kas pieejams kategoriāliem datiem. Viņi pārzinās un interpretēs lielās, kā arī mazās izlases pārbaudes. • Noteiks kategoriālo datu raksturu; kā izmērīt atkarību starp kategoriskajiem mainīgajiem, pamatojoties uz pētījuma veidu un mainīgo veidu (nominālais vai ordināls). • Studējošie parādīs, kā modelēt binārā iznākuma mainīgo, izmantojot nepārtrauktus vai kategoriskus mainīgos.
Prasmes
1.• Studējošie saprot un paskaidro dažāda veida datu vākšanas metožu ietekmi uz biežumtabulas nejaušību. Interpretē biežumtabulas, tās rindu un kolonnu sadalījuma modeļus. • Izskaidro atkarības mērījumus, kas definēti 2 kategorisku mainīgo (relatīvais risks, izredžu attiecība utt.) kopējā sadalījumā, spēj tos interpretēt un aprēķināt. • Prot pārbaudīt datu piemērotību ar pieņemto sadalījuma modeli, prot pārbaudīt kategorisko mainīgo neatkarību. • Prot modelēt kategorisko mainīgo (īpaši bināro) ar citiem mainīgajiem. • Prot patstāvīgi pielietot savas zināšanas darbā ar reāliem datiem.
Kompetences
1.• Pēc sekmīgas kursa apgūšanas studējošais būs kompetents lasīt un kritiski novērtēt zinātniskās publikācijas, kuru analīzē izmantoti kategoriāli dati. • Studējošais būs kompetents plānot kategoriālu datu analīzi un analizēt šādus datus.
Vērtēšana
Patstāvīgais darbs
|
Virsraksts
|
% no gala vērtējuma
|
Vērtējums
|
|---|---|---|
|
1.
Patstāvīgais darbs |
-
|
-
|
|
1. Patstāvīgais darbs ar kursa materiālu, gatavojoties lekcijām pēc plāna.
2. Patstāvīga mājasdarbu izpilde, praktizējot kursā apgūtās koncepcijas.
Lai novērtētu studiju kursa kvalitāti kopumā, studentam jāaizpilda studiju kursa novērtēšanas anketa Studējošo portālā.
|
||
Pārbaudījums
|
Virsraksts
|
% no gala vērtējuma
|
Vērtējums
|
|---|---|---|
|
1.
Pārbaudījums |
-
|
-
|
|
Novērtējums 10 ballu skalā saskaņā ar RSU Studiju reglamentu:
• 2 Patstāvīgi izpildīti mājasdarbi – 50%.
• Apmeklētība un aktīva iesaiste praktisko nodarbību laikā – 25%.
• Rakstisks gala eksāmens – 25%.
|
||
Studiju kursa tēmu plāns
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
2
|
Tēmas
|
Kategoriālu datu būtība. Klasifikācija pēc mērķa un skalas. Pētījumu veidi. Varbūtību sadalījumi. Overdispersion.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
2
|
Tēmas
|
Kategorisku mainīgo kopējais sadalījums. Nosacītais un marginālais sadalījums. Maksimālās ticamības novērtējumi varbūtībām.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
2
|
Tēmas
|
Neatkarība. Atkarības mērs, relatīvais risks, izredzes, izredžu attiecība. 2x2 biežumtabulas. Novērtējumi no biežumtabulas. Nosacītās varbūtības – jutīgums, specifiskums. Patiesi negatīvs, nepatiesi pozitīvs.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Ievads "Jamovi". Kategoriālu datu vizualizēšana. Sadalījumu salīdzināšana. Biežumtabulas. Nosacītie biežumi. Atkarības mērījumu aprēķināšana.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
2
|
Tēmas
|
Tabulas, kas lielākas par 2 x 2. Ordinālu un nominālu datu atkarības mērījumi. Hipotēze par iedzīvotāju sadalījumu. Hī kvadrāta kritērijs.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Ordinālu un nominālu datu atkarības mērījumi. Hipotēze par neatkarību un nosacīto neatkarību.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
2
|
Tēmas
|
Lielas izlases gadījums, hipotēze par neatkarību. Hī kvadrāta un iespējamības attiecības kritērijs. Mazas izlases gadījums, Fišera kritērijs.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Hipotēze par neatkarību un nosacīto neatkarību.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
2
|
Tēmas
|
Multinomiālu biežumu asimptotiskais sadalījums. Ticamības intervāli izredžu attiecībai un relatīvajam riskam. Marginālā sadalījuma viendabīguma pārbaude sapārotu novērojumu gadījumā.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Atkarības mērījumu intervāla aprēķināšana. Maknemāra tests.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
2
|
Tēmas
|
Binārā iznākuma mainīgā modeļi – loģistiskās regresijas un log lineārie modeļi. Retrospektīvo pētījumu modeļi. Lēmumu koki klasifikācijai.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Kategoriālu datu modelēšana. Klasificēti dati un neapstrādāti dati. Modelēšana un lēmumu pieņemšanas shēmas. Klasifikācijas kļūda.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
1
|
Tēmas
|
Kategoriālu datu būtība. Klasifikācija pēc mērķa un skalas. Pētījumu veidi. Varbūtību sadalījumi. Overdispersion.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
1
|
Tēmas
|
Kategorisku mainīgo kopējais sadalījums. Nosacītais un marginālais sadalījums. Maksimālās ticamības novērtējumi varbūtībām.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
1
|
Tēmas
|
Neatkarība. Atkarības mērs, relatīvais risks, izredzes, izredžu attiecība. 2x2 biežumtabulas. Novērtējumi no biežumtabulas. Nosacītās varbūtības – jutīgums, specifiskums. Patiesi negatīvs, nepatiesi pozitīvs.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Ievads "Jamovi". Kategoriālu datu vizualizēšana. Sadalījumu salīdzināšana. Biežumtabulas. Nosacītie biežumi. Atkarības mērījumu aprēķināšana.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
1
|
Tēmas
|
Tabulas, kas lielākas par 2 x 2. Ordinālu un nominālu datu atkarības mērījumi. Hipotēze par iedzīvotāju sadalījumu. Hī kvadrāta kritērijs.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Baseins
|
2
|
Tēmas
|
Ordinālu un nominālu datu atkarības mērījumi. Hipotēze par neatkarību un nosacīto neatkarību.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
1
|
Tēmas
|
Lielas izlases gadījums, hipotēze par neatkarību. Hī kvadrāta un iespējamības attiecības kritērijs. Mazas izlases gadījums, Fišera kritērijs.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Hipotēze par neatkarību un nosacīto neatkarību.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
1
|
Tēmas
|
Multinomiālu biežumu asimptotiskais sadalījums. Ticamības intervāli izredžu attiecībai un relatīvajam riskam. Marginālā sadalījuma viendabīguma pārbaude sapārotu novērojumu gadījumā.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Atkarības mērījumu intervāla aprēķināšana. Maknemāra tests.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
1
|
Tēmas
|
Binārā iznākuma mainīgā modeļi – loģistiskās regresijas un log lineārie modeļi. Retrospektīvo pētījumu modeļi. Lēmumu koki klasifikācijai.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Kategoriālu datu modelēšana. Klasificēti dati un neapstrādāti dati. Modelēšana un lēmumu pieņemšanas shēmas. Klasifikācijas kļūda.
|
Bibliogrāfija
Obligātā literatūra
Agresti, Alan. Categorical Data Analysis. Wiley, 2012 (or 1990, 2002 editions).
Papildu literatūra
Agresti, Alan. An Introduction to Categorical Data Analysis. Wiley, 2019 (or 1996, 2007 editions).