Veidlapa Nr. M-3 (8)
Studiju kursa apraksts

Kategoriju datu analīze

Studiju kursa pamatinformācija

Kursa kods
SL_117
Zinātnes nozare
Matemātika; Varbūtību teorija un matemātiskā statistika
Kredītpunkti (ECTS)
3,00
Mērķauditorija
Dzīvās dabas zinātnes
LKI
7. līmenis
Studiju veids un forma
Pilna laika; Nepilna laika

Studiju kursa īstenotājs

Kursa vadītājs
Struktūrvienības vadītājs
Struktūrvienība
Statistikas mācību laboratorija
Kontaktinformācija

Baložu iela 14, A korpuss, Rīga, statistika@rsu.lv, +371 67060897

Par studiju kursu

Mērķis

Ņemot vērā, ka lielākā daļa statistikas datu ir kategoriāli, kursa mērķis ir norādīt uz šādu datu īpašajām iezīmēm un iemācīt atbilstošās statistiskās analīzes metodes. Kurss galvenokārt koncentrēsies uz metodēm un pielietojumu, zināmā mērā apskatot matemātisko pamatu un metodoloģijas pamatojumu. Statistikas programmatūra „Jamovi” tiks izmantota datorklasēs, kur studenti analizēs lekcijās apskatītās reālās datu kopas, lai savienotu teoriju un praksi un studenti spētu pārliecināti pielietot metodoloģiju praktiskā datu analīzē.

Priekšzināšanas

• Pārzina varbūtību teoriju un matemātisko statistiku. • Pamatzināšanas „Jamovi” programmatūrā. • Pamatzināšanas datu analīzē.

Studiju rezultāti

Zināšanas

1.• Pēc sekmīgas kursa apgūšanas studējošie pārzinās statistiskās analīzes metodoloģijas klāstu, kas pieejams kategoriāliem datiem. Viņi pārzinās un interpretēs lielās, kā arī mazās izlases pārbaudes. • Noteiks kategoriālo datu raksturu; kā izmērīt atkarību starp kategoriskajiem mainīgajiem, pamatojoties uz pētījuma veidu un mainīgo veidu (nominālais vai ordināls). • Studējošie parādīs, kā modelēt binārā iznākuma mainīgo, izmantojot nepārtrauktus vai kategoriskus mainīgos.

Prasmes

1.• Studējošie saprot un paskaidro dažāda veida datu vākšanas metožu ietekmi uz biežumtabulas nejaušību. Interpretē biežumtabulas, tās rindu un kolonnu sadalījuma modeļus. • Izskaidro atkarības mērījumus, kas definēti 2 kategorisku mainīgo (relatīvais risks, izredžu attiecība utt.) kopējā sadalījumā, spēj tos interpretēt un aprēķināt. • Prot pārbaudīt datu piemērotību ar pieņemto sadalījuma modeli, prot pārbaudīt kategorisko mainīgo neatkarību. • Prot modelēt kategorisko mainīgo (īpaši bināro) ar citiem mainīgajiem. • Prot patstāvīgi pielietot savas zināšanas darbā ar reāliem datiem.

Kompetences

1.• Pēc sekmīgas kursa apgūšanas studējošais būs kompetents lasīt un kritiski novērtēt zinātniskās publikācijas, kuru analīzē izmantoti kategoriāli dati. • Studējošais būs kompetents plānot kategoriālu datu analīzi un analizēt šādus datus.

Vērtēšana

Patstāvīgais darbs

Virsraksts
% no gala vērtējuma
Vērtējums
1.

Patstāvīgais darbs

-
-
1. Patstāvīgais darbs ar kursa materiālu, gatavojoties lekcijām pēc plāna. 2. Patstāvīga mājasdarbu izpilde, praktizējot kursā apgūtās koncepcijas. Lai novērtētu studiju kursa kvalitāti kopumā, studentam jāaizpilda studiju kursa novērtēšanas anketa Studējošo portālā.

Pārbaudījums

Virsraksts
% no gala vērtējuma
Vērtējums
1.

Pārbaudījums

-
-
Novērtējums 10 ballu skalā saskaņā ar RSU Studiju reglamentu: • 2 Patstāvīgi izpildīti mājasdarbi – 50%. • Apmeklētība un aktīva iesaiste praktisko nodarbību laikā – 25%. • Rakstisks gala eksāmens – 25%.

Studiju kursa tēmu plāns

PILNA LAIKA
1. daļa
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Kategoriālu datu būtība. Klasifikācija pēc mērķa un skalas. Pētījumu veidi. Varbūtību sadalījumi. Overdispersion.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Kategorisku mainīgo kopējais sadalījums. Nosacītais un marginālais sadalījums. Maksimālās ticamības novērtējumi varbūtībām.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Neatkarība. Atkarības mērs, relatīvais risks, izredzes, izredžu attiecība. 2x2 biežumtabulas. Novērtējumi no biežumtabulas. Nosacītās varbūtības – jutīgums, specifiskums. Patiesi negatīvs, nepatiesi pozitīvs.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Ievads "Jamovi". Kategoriālu datu vizualizēšana. Sadalījumu salīdzināšana. Biežumtabulas. Nosacītie biežumi. Atkarības mērījumu aprēķināšana.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Tabulas, kas lielākas par 2 x 2. Ordinālu un nominālu datu atkarības mērījumi. Hipotēze par iedzīvotāju sadalījumu. Hī kvadrāta kritērijs.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Ordinālu un nominālu datu atkarības mērījumi. Hipotēze par neatkarību un nosacīto neatkarību.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Lielas izlases gadījums, hipotēze par neatkarību. Hī kvadrāta un iespējamības attiecības kritērijs. Mazas izlases gadījums, Fišera kritērijs.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Hipotēze par neatkarību un nosacīto neatkarību.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Multinomiālu biežumu asimptotiskais sadalījums. Ticamības intervāli izredžu attiecībai un relatīvajam riskam. Marginālā sadalījuma viendabīguma pārbaude sapārotu novērojumu gadījumā.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Atkarības mērījumu intervāla aprēķināšana. Maknemāra tests.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Binārā iznākuma mainīgā modeļi – loģistiskās regresijas un log lineārie modeļi. Retrospektīvo pētījumu modeļi. Lēmumu koki klasifikācijai.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Kategoriālu datu modelēšana. Klasificēti dati un neapstrādāti dati. Modelēšana un lēmumu pieņemšanas shēmas. Klasifikācijas kļūda.
Kopā kredītpunkti (ECTS):
3,00
Kontaktstundas:
24 ak. st.
Gala pārbaudījums:
Eksāmens (Rakstisks)
NEPILNA LAIKA
1. daļa
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Kategoriālu datu būtība. Klasifikācija pēc mērķa un skalas. Pētījumu veidi. Varbūtību sadalījumi. Overdispersion.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Kategorisku mainīgo kopējais sadalījums. Nosacītais un marginālais sadalījums. Maksimālās ticamības novērtējumi varbūtībām.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Neatkarība. Atkarības mērs, relatīvais risks, izredzes, izredžu attiecība. 2x2 biežumtabulas. Novērtējumi no biežumtabulas. Nosacītās varbūtības – jutīgums, specifiskums. Patiesi negatīvs, nepatiesi pozitīvs.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Ievads "Jamovi". Kategoriālu datu vizualizēšana. Sadalījumu salīdzināšana. Biežumtabulas. Nosacītie biežumi. Atkarības mērījumu aprēķināšana.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Tabulas, kas lielākas par 2 x 2. Ordinālu un nominālu datu atkarības mērījumi. Hipotēze par iedzīvotāju sadalījumu. Hī kvadrāta kritērijs.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Baseins
2

Tēmas

Ordinālu un nominālu datu atkarības mērījumi. Hipotēze par neatkarību un nosacīto neatkarību.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Lielas izlases gadījums, hipotēze par neatkarību. Hī kvadrāta un iespējamības attiecības kritērijs. Mazas izlases gadījums, Fišera kritērijs.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Hipotēze par neatkarību un nosacīto neatkarību.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Multinomiālu biežumu asimptotiskais sadalījums. Ticamības intervāli izredžu attiecībai un relatīvajam riskam. Marginālā sadalījuma viendabīguma pārbaude sapārotu novērojumu gadījumā.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Atkarības mērījumu intervāla aprēķināšana. Maknemāra tests.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Binārā iznākuma mainīgā modeļi – loģistiskās regresijas un log lineārie modeļi. Retrospektīvo pētījumu modeļi. Lēmumu koki klasifikācijai.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Kategoriālu datu modelēšana. Klasificēti dati un neapstrādāti dati. Modelēšana un lēmumu pieņemšanas shēmas. Klasifikācijas kļūda.
Kopā kredītpunkti (ECTS):
3,00
Kontaktstundas:
17 ak. st.
Gala pārbaudījums:
Eksāmens (Rakstisks)

Bibliogrāfija

Obligātā literatūra

1.

Agresti, Alan. Categorical Data Analysis. Wiley, 2012 (or 1990, 2002 editions).

Papildu literatūra

1.

Agresti, Alan. An Introduction to Categorical Data Analysis. Wiley, 2019 (or 1996, 2007 editions).