Datu analītika, mašīnmācīšanās un to pielietojumi veselības aprūpē
Studiju kursa īstenotājs
Rīga, Kronvalda bulvāris 9, +371 67338307
Par studiju kursu
Mērķis
Iegūt padziļinātas zināšanas, iemaņas un prasmes specifiskās matemātiskās statistikas un jaunākās datu zinātnes metodēs studiju nolūkiem; darbam sabiedrības veselības specialitātē; kā arī veicināt datu zinātnes terminoloģijas apguvi un tās praktisko pielietošanu.
Priekšzināšanas
Pētniecības metodoloģija, statistikas pamatprincipi, matemātika (vēlams) – logaritmi, diferenciāļi, prasmes darbā ar datoru, veselības datu tipi un elementi.
Studiju rezultāti
Zināšanas
1.Veiksmīga studiju kursa apguves rezultātā studenti: Atpazīs laikrindu analīzes terminoloģiju un tās izmantošanu; Pārzinās Oxmetrics programmas piedāvāto funckionalitāti laikrindu analīzē; Iemācīsies kā formulēt, attīstīt un ieviest regresijas un klasifikācijas modeļus, izmantojot KNIME platformu.
Prasmes
1.Veiksmīgas studiju kursa apguves rezultātā studenti pratīs: - Atvērt, izveidot un rediģēt laikrindu datus Oxmetrics programmā; - Izmantojot Oxmetrics platformu, korekti sagatavot vienas laikrindas aprakstošu modeli; - Izmantojot Oxmetrics platformu, korekti sagatavot daudzfaktoru laikrindas aprakstošu modeli; - Izmantojot KNIME platformu, atvērt un sagatavot datus regresijas un klasifikācijas modeļu attīstīšanai; - KNIME platformā uzstādīt regresijas un klasifikācijas modeļu procedūras un tās izpildīt; - Izmantojot KNIME platformu, izvērtēt modeļu derīgumu; - KNIME platformā identificēt modeļa galvenos faktorus un to ietekmes formu; - Izskaidrot modeļa ieviešanas un monitoringa praksi; - Izveidot izmantoto metožu un rezultātu aprakstu.
Kompetences
1.Veiksmīgas studiju kursa apguves rezultātā, studenti spēs: Pareizi interpretēt un izvērtēt laikrindu modeļu pielietojumus sabiedrības veselības specialitātē; Izmantojot veselības aprūpes datus, izplānot, uzstādīt un izvērtēt regresijas un klasifikācijas modeļus.
Vērtēšana
Patstāvīgais darbs
|
Virsraksts
|
% no gala vērtējuma
|
Vērtējums
|
|---|---|---|
|
1.
Patstāvīgais darbs |
-
|
-
|
|
Individuālais darbs ar kursa materiāliem – gatavošanās nodarbībai, atbilstoši tematiskajam plānojumam; mājas uzdevumu izpilde.
|
||
Pārbaudījums
|
Virsraksts
|
% no gala vērtējuma
|
Vērtējums
|
|---|---|---|
|
1.
Pārbaudījums |
-
|
-
|
|
Aktīva līdzdalība lekcijās un praktiskajās nodarbībās.
Iesniegto mājas darbu pārbaude.
Studiju kursa noslēgumā eksāmens, kurā tiek pārbaudītas terminoloģijas un metožu zināšanas un to praktiskais pielietojums - 40%;
Praktiskie uzdevumi - 30%;
Kontroldarbi - 30%.
Par katru kavēto nodarbību – tēmas kopsavilkums, izmantojot norādīto literatūru (min. viena A4 lapa).
|
||
Studiju kursa tēmu plāns
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Laikrindu datu specifika. Piemēri. Vienas laikrindas analīze: tendence, stabilitāte, sezonalitāte, ekstrēmas vērtības.
Vienas laikrindas prognozēšanas modeļi. Tendences un sezonalitātes faktori. Diferencēšana. Vienreizējie faktori. Autoregresija. Modeļa kvalitātes kritēriji. Notācija. Prognozēšanas intervālis.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Laikrindu datu specifika. Piemēri. Vienas laikrindas analīze: tendence, stabilitāte, sezonalitāte, ekstrēmas vērtības.
Vienas laikrindas prognozēšanas modeļi. Tendences un sezonalitātes faktori. Diferencēšana. Vienreizējie faktori. Autoregresija. Modeļa kvalitātes kritēriji. Notācija. Prognozēšanas intervālis.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Daudzfaktoru laikrindu datu modeļi. Strukturālie un prognozējošie modeļi. Simultānie efekti. Efekti ar laika nobīdi. Iztrūkstošie efekti. Viltus korelācija. Logaritmiskais formulējums.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Daudzfaktoru laikrindu datu modeļi. Strukturālie un prognozējošie modeļi. Simultānie efekti. Efekti ar laika nobīdi. Iztrūkstošie efekti. Viltus korelācija. Logaritmiskais formulējums.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Daudzfaktoru laikrindu datu modelis kā simulācijas platforma.
Laikrindu modeļi salīdzinājumā ar tradicionālajiem SIR tipa epidemioloģiskiem modeļiem.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Daudzfaktoru laikrindu datu modelis kā simulācijas platforma.
Laikrindu modeļi salīdzinājumā ar tradicionālajiem SIR tipa epidemioloģiskiem modeļiem.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Tradicionālais regresijas modelis salīdzinājumā ar datu zinātnes algoritmu nejaušinātais mežs. Lēmumu koka struktūra. Datu sagatavošana. Modeļa parametri. Modeļu salīdzinošā diagnostika.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Tradicionālais regresijas modelis salīdzinājumā ar datu zinātnes algoritmu nejaušinātais mežs. Lēmumu koka struktūra. Datu sagatavošana. Modeļa parametri. Modeļu salīdzinošā diagnostika.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Klasifikācijas modeļi: sinhronā un diahroniskā klasifikācija. Lēmumu koki un lēmumu koku ansambļi. GBM un XGBoost algoritmi. Klasifikācijas modeļu diagnostika un izskaidrošana.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Klasifikācijas modeļi: sinhronā un diahroniskā klasifikācija. Lēmumu koki un lēmumu koku ansambļi. GBM un XGBoost algoritmi. Klasifikācijas modeļu diagnostika un izskaidrošana.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Klasifikācijas modeļi: sinhronā un diahroniskā klasifikācija. Lēmumu koki un lēmumu koku ansambļi. GBM un XGBoost algoritmi. Klasifikācijas modeļu diagnostika un izskaidrošana.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Klasifikācijas modeļi: sinhronā un diahroniskā klasifikācija. Lēmumu koki un lēmumu koku ansambļi. GBM un XGBoost algoritmi. Klasifikācijas modeļu diagnostika un izskaidrošana.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Prognozējošo modeļu ieviešana praksē. Datu strukturēšana. Nākotnes informācijas problēma un tās novēršana. Datu un modeļu monitorings. Modeļu korekcijas.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Prognozējošo modeļu ieviešana praksē. Datu strukturēšana. Nākotnes informācijas problēma un tās novēršana. Datu un modeļu monitorings. Modeļu korekcijas.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Modeļu inženierēšana. Iztrūkstošo vērtību problēma un tās labošana. Jaunu mainīgo atvasināšana. Potenciālo prognozētāju filtrēšana un modeļa parametru optimizācija. AutoML procedūra.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Modeļu inženierēšana. Iztrūkstošo vērtību problēma un tās labošana. Jaunu mainīgo atvasināšana. Potenciālo prognozētāju filtrēšana un modeļa parametru optimizācija. AutoML procedūra.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Modeļu pienesuma pierādīšana praksē. Eksperimentālās metodes un lauka eksperimentu specifika, plānošana un statistiskā analīze. Kauzālu uzlabojuma faktoru konstatēšana.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Modeļu pienesuma pierādīšana praksē. Eksperimentālās metodes un lauka eksperimentu specifika, plānošana un statistiskā analīze. Kauzālu uzlabojuma faktoru konstatēšana.
|
Bibliogrāfija
Obligātā literatūra
Timothy L. Wiemken and Robert R. Kelley: Machine Learning in Epidemiology and Health Outcomes Research. Annual Review of Public Health 2020 41:1, 21-36.Piemērots angļu valodas plūsmai
Uģis Sprūdžs. Sirds un asinsrites slimību mirstības riska prognoze nākamajam gadam no anonimizētiem Latvijas veselības aprūpes sistēmas datiem: XGBoost mašīnmācīšanās algoritma iespējamības pārbaude. Akadēmiskā Dzīve (lu.lv) 2023 59, 88-94Piemērots angļu valodas plūsmai
Papildu literatūra
Bradley Efron, Trevor Hastie. Computer Age Statistical Inference, Student Edition Algorithms, Evidence, and Data Science. Cambridge University Press, 2021.Piemērots angļu valodas plūsmai