Veidlapa Nr. M-3 (8)
Studiju kursa apraksts

Datu analītika, mašīnmācīšanās un to pielietojumi veselības aprūpē

Studiju kursa pamatinformācija

Kursa kods
SVI_002
Zinātnes nozare
Matemātika; Varbūtību teorija un matemātiskā statistika
Kredītpunkti (ECTS)
5,00
Mērķauditorija
Sabiedrības veselība; Veselības vadība
LKI
7. līmenis
Studiju veids un forma
Pilna laika

Studiju kursa īstenotājs

Kursa vadītājs
Struktūrvienības vadītājs
Struktūrvienība
Veselības vadības docētāju grupa
Kontaktinformācija

Rīga, Kronvalda bulvāris 9, +371 67338307

Par studiju kursu

Mērķis

Iegūt padziļinātas zināšanas, iemaņas un prasmes specifiskās matemātiskās statistikas un jaunākās datu zinātnes metodēs studiju nolūkiem; darbam sabiedrības veselības specialitātē; kā arī veicināt datu zinātnes terminoloģijas apguvi un tās praktisko pielietošanu.

Priekšzināšanas

Pētniecības metodoloģija, statistikas pamatprincipi, matemātika (vēlams) – logaritmi, diferenciāļi, prasmes darbā ar datoru, veselības datu tipi un elementi.

Studiju rezultāti

Zināšanas

1.Veiksmīga studiju kursa apguves rezultātā studenti: Atpazīs laikrindu analīzes terminoloģiju un tās izmantošanu; Pārzinās Oxmetrics programmas piedāvāto funckionalitāti laikrindu analīzē; Iemācīsies kā formulēt, attīstīt un ieviest regresijas un klasifikācijas modeļus, izmantojot KNIME platformu.

Prasmes

1.Veiksmīgas studiju kursa apguves rezultātā studenti pratīs: - Atvērt, izveidot un rediģēt laikrindu datus Oxmetrics programmā; - Izmantojot Oxmetrics platformu, korekti sagatavot vienas laikrindas aprakstošu modeli; - Izmantojot Oxmetrics platformu, korekti sagatavot daudzfaktoru laikrindas aprakstošu modeli; - Izmantojot KNIME platformu, atvērt un sagatavot datus regresijas un klasifikācijas modeļu attīstīšanai; - KNIME platformā uzstādīt regresijas un klasifikācijas modeļu procedūras un tās izpildīt; - Izmantojot KNIME platformu, izvērtēt modeļu derīgumu; - KNIME platformā identificēt modeļa galvenos faktorus un to ietekmes formu; - Izskaidrot modeļa ieviešanas un monitoringa praksi; - Izveidot izmantoto metožu un rezultātu aprakstu.

Kompetences

1.Veiksmīgas studiju kursa apguves rezultātā, studenti spēs: Pareizi interpretēt un izvērtēt laikrindu modeļu pielietojumus sabiedrības veselības specialitātē; Izmantojot veselības aprūpes datus, izplānot, uzstādīt un izvērtēt regresijas un klasifikācijas modeļus.

Vērtēšana

Patstāvīgais darbs

Virsraksts
% no gala vērtējuma
Vērtējums
1.

Patstāvīgais darbs

-
-
Individuālais darbs ar kursa materiāliem – gatavošanās nodarbībai, atbilstoši tematiskajam plānojumam; mājas uzdevumu izpilde.

Pārbaudījums

Virsraksts
% no gala vērtējuma
Vērtējums
1.

Pārbaudījums

-
-
Aktīva līdzdalība lekcijās un praktiskajās nodarbībās. Iesniegto mājas darbu pārbaude. Studiju kursa noslēgumā eksāmens, kurā tiek pārbaudītas terminoloģijas un metožu zināšanas un to praktiskais pielietojums - 40%; Praktiskie uzdevumi - 30%; Kontroldarbi - 30%. Par katru kavēto nodarbību – tēmas kopsavilkums, izmantojot norādīto literatūru (min. viena A4 lapa).

Studiju kursa tēmu plāns

PILNA LAIKA
1. daļa
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Laikrindu datu specifika. Piemēri. Vienas laikrindas analīze: tendence, stabilitāte, sezonalitāte, ekstrēmas vērtības. Vienas laikrindas prognozēšanas modeļi. Tendences un sezonalitātes faktori. Diferencēšana. Vienreizējie faktori. Autoregresija. Modeļa kvalitātes kritēriji. Notācija. Prognozēšanas intervālis.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Laikrindu datu specifika. Piemēri. Vienas laikrindas analīze: tendence, stabilitāte, sezonalitāte, ekstrēmas vērtības. Vienas laikrindas prognozēšanas modeļi. Tendences un sezonalitātes faktori. Diferencēšana. Vienreizējie faktori. Autoregresija. Modeļa kvalitātes kritēriji. Notācija. Prognozēšanas intervālis.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Daudzfaktoru laikrindu datu modeļi. Strukturālie un prognozējošie modeļi. Simultānie efekti. Efekti ar laika nobīdi. Iztrūkstošie efekti. Viltus korelācija. Logaritmiskais formulējums.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Daudzfaktoru laikrindu datu modeļi. Strukturālie un prognozējošie modeļi. Simultānie efekti. Efekti ar laika nobīdi. Iztrūkstošie efekti. Viltus korelācija. Logaritmiskais formulējums.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Daudzfaktoru laikrindu datu modelis kā simulācijas platforma. Laikrindu modeļi salīdzinājumā ar tradicionālajiem SIR tipa epidemioloģiskiem modeļiem.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Daudzfaktoru laikrindu datu modelis kā simulācijas platforma. Laikrindu modeļi salīdzinājumā ar tradicionālajiem SIR tipa epidemioloģiskiem modeļiem.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Tradicionālais regresijas modelis salīdzinājumā ar datu zinātnes algoritmu nejaušinātais mežs. Lēmumu koka struktūra. Datu sagatavošana. Modeļa parametri. Modeļu salīdzinošā diagnostika.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Tradicionālais regresijas modelis salīdzinājumā ar datu zinātnes algoritmu nejaušinātais mežs. Lēmumu koka struktūra. Datu sagatavošana. Modeļa parametri. Modeļu salīdzinošā diagnostika.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Klasifikācijas modeļi: sinhronā un diahroniskā klasifikācija. Lēmumu koki un lēmumu koku ansambļi. GBM un XGBoost algoritmi. Klasifikācijas modeļu diagnostika un izskaidrošana.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Klasifikācijas modeļi: sinhronā un diahroniskā klasifikācija. Lēmumu koki un lēmumu koku ansambļi. GBM un XGBoost algoritmi. Klasifikācijas modeļu diagnostika un izskaidrošana.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Klasifikācijas modeļi: sinhronā un diahroniskā klasifikācija. Lēmumu koki un lēmumu koku ansambļi. GBM un XGBoost algoritmi. Klasifikācijas modeļu diagnostika un izskaidrošana.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Klasifikācijas modeļi: sinhronā un diahroniskā klasifikācija. Lēmumu koki un lēmumu koku ansambļi. GBM un XGBoost algoritmi. Klasifikācijas modeļu diagnostika un izskaidrošana.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Prognozējošo modeļu ieviešana praksē. Datu strukturēšana. Nākotnes informācijas problēma un tās novēršana. Datu un modeļu monitorings. Modeļu korekcijas.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Prognozējošo modeļu ieviešana praksē. Datu strukturēšana. Nākotnes informācijas problēma un tās novēršana. Datu un modeļu monitorings. Modeļu korekcijas.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Modeļu inženierēšana. Iztrūkstošo vērtību problēma un tās labošana. Jaunu mainīgo atvasināšana. Potenciālo prognozētāju filtrēšana un modeļa parametru optimizācija. AutoML procedūra.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Modeļu inženierēšana. Iztrūkstošo vērtību problēma un tās labošana. Jaunu mainīgo atvasināšana. Potenciālo prognozētāju filtrēšana un modeļa parametru optimizācija. AutoML procedūra.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Modeļu pienesuma pierādīšana praksē. Eksperimentālās metodes un lauka eksperimentu specifika, plānošana un statistiskā analīze. Kauzālu uzlabojuma faktoru konstatēšana.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Modeļu pienesuma pierādīšana praksē. Eksperimentālās metodes un lauka eksperimentu specifika, plānošana un statistiskā analīze. Kauzālu uzlabojuma faktoru konstatēšana.
Kopā kredītpunkti (ECTS):
5,00
Kontaktstundas:
36 ak. st.
Gala pārbaudījums:
Eksāmens (Rakstisks)

Bibliogrāfija

Obligātā literatūra

1.

Timothy L. Wiemken and Robert R. Kelley: Machine Learning in Epidemiology and Health Outcomes Research. Annual Review of Public Health 2020 41:1, 21-36.Piemērots angļu valodas plūsmai

2.

Uģis Sprūdžs. Sirds un asinsrites slimību mirstības riska prognoze nākamajam gadam no anonimizētiem Latvijas veselības aprūpes sistēmas datiem: XGBoost mašīnmācīšanās algoritma iespējamības pārbaude. Akadēmiskā Dzīve (lu.lv) 2023 59, 88-94Piemērots angļu valodas plūsmai

3.

KNIMEPiemērots angļu valodas plūsmai

Papildu literatūra

1.

Bradley Efron, Trevor Hastie. Computer Age Statistical Inference, Student Edition Algorithms, Evidence, and Data Science. Cambridge University Press, 2021.Piemērots angļu valodas plūsmai

2.

Jurgen Doornik. An Introduction to OxMetrics 9. Timberlake Press, 2021.Piemērots angļu valodas plūsmai