Statistiskā programmēšana un datu pārvaldība
Studiju kursa īstenotājs
Kapseļu iela 23, 2.stāvs, Rīga, statistika@rsu.lv, +371 67060897
Par studiju kursu
Mērķis
Datu analīzes un pārvaldības prasmes ir ļoti svarīgas mūsdienu lietišķajos statistikas pētījumos. Kursa mērķis ir iepazīstināt studentus ar statistikas programmatūras rīkiem, ko izmanto biostatistikas pētījumos: „R”. Tādējādi kursa mērķi ir: • iepazīstināt studējošos ar statistisko programmēšanu un datu pārvaldību, izmantojot „R” statistikas programmatūru; • sagatavot studējošos darbam ar datoru citos studiju programmas „Biostatistika” kursos.
Priekšzināšanas
Īpašas priekšzināšanas netiek prasītas, taču kursā būs nepieciešamas datorprasmes un vidusskolas līmeņa algebras zināšanas un tiks izmantoti statistikas jēdzieni.
Studiju rezultāti
Zināšanas
1.• Pārzināt, atlasīt, patstāvīgi izmantot „R” programmēšanas pamatprincipus. • Lietot „R” datu bāzu pārvaldības principus. • Apgūt un izmantot padziļinātus programmēšanas elementus, piemēram, izpildi ar nosacījumiem, ciklus un pielāgotas funkcijas.
Prasmes
1.Pēc kursa pabeigšanas studenti spēs: • pārbaudīt dažāda veida datus programmatūrā un organizēt tos analīzes nolūkos; • veikt datu pilnīgu transformāciju un vizualizāciju ar „R”; • uzrakstīt un izmantot paši savas R funkcijas, lai automatizētu bieži pildāmus uzdevumus.
Kompetences
1.Studenti spēs: • kvalitatīvi izmantot „R” programmatūru statistiskai analīzei citos biostatistikas kursos; • saprast atšķirības starp „R” un citām programmām un izvēlēties piemērotāko konkrētai analīzei; • patstāvīgi uzlabot savas statistiskās programmēšanas prasmes, lai veiktu pētniecisku darbību vai analizētu ar veselību saistītos datus.
Vērtēšana
Patstāvīgais darbs
|
Virsraksts
|
% no gala vērtējuma
|
Vērtējums
|
|---|---|---|
|
1.
Patstāvīgais darbs |
-
|
-
|
|
• Patstāvīgais darbs ar lekciju materiālu, gatavojoties visām studiju kursa lekcijām.
• Patstāvīgi sagatavot piešķirtos 2 datorprojektus, praktizējot kursā apgūtās koncepcijas.
Lai izvērtētu studiju kursa kvalitāti kopumā, studentam jāaizpilda studiju kursa novērtēšanas anketa Studējošo portālā.
|
||
Pārbaudījums
|
Virsraksts
|
% no gala vērtējuma
|
Vērtējums
|
|---|---|---|
|
1.
Pārbaudījums |
-
|
10 balles
|
|
Novērtējums 10 ballu skalā saskaņā ar RSU Studiju reglamentu: • Divi datoru projekti: 50% × 2 = 100% |
||
Studiju kursa tēmu plāns
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Ievads „R” valodā un „R Studio”. Saskarne, darbplūsma, skripti un kodēšanas pamati.
Ievads datu vizualizācijā ar „ggplot”: estētiskās attēlošanas, ģeometriskie objekti un statistiskās transformācijas.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Praktisks darbs ar „R” saskarni. Atbildes uz vienkāršiem jautājumiem par datiem, veidojot iebūvēto „R” datu kopu „ggplot2” vizualizācijas.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Ievads datu konvertēšanā (pārveidē) ar „dplyr” pakotni: filtrēšana, kārtošana, atlase,
jaunu mainīgo izveide un apkopošana. Iepazīstināšana ar „R” projektu darbplūsmu.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Dažādas datu transformācijas ar „R” „dplyr” pakotni „R” iebūvētajās datu kopās.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Pētnieciskā datu analīze: variācijas un kovariācijas novērtēšana. Statistiskie kopsavilkumi ar kastveida diagrammām. Dažāda veida datu nolasīšana „R”.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Praktiska pētnieciskā datu analīze „R”: datu variācija (joslu diagrammas, histogrammas, kastveida diagrammas) un kovariācija (vizualizējot divu mainīgo attiecības). Praktisks darbs ar „readr” pakotni datu lasīšanai.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Datu konsekventas organizēšanas principi „R” ar „tidyr” pakotni: datu kopu vākšana un izplatīšana, darbs ar trūkstošām vērtībām. Iepazīšanās ar „R Markdown” atskaišu sistēmu, dažādiem „Markdown” formātiem un matemātisko simbolu rakstīšanas principiem.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Reālas datu kopas importēšana un kārtošana. „R Markdown” pārskata sagatavošana.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Ievads datu pārvaldībā „R”. Relāciju datu principi: relācijas, atslēgas, savienojumi un piešķiršanas operācijas. Daži izplatīti neskaitlisku mainīgo veidi „R”. Vienlaicīgu operāciju organizēšana ar programmkanāliem.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Relāciju datu (t.i., multiplu tabulu) pārvaldība ar „dplyr”. Praktisks darbs ar neskaitlisku mainīgo tipiem „R”: koeficienti, virknes, datumi.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Padziļināta „R” programmēšana: savu „R” funkciju rakstīšana, funkciju vektorizācija, izpilde ar nosacījumiem (ja / citādi priekšraksti), cikliem un kartes funkcijām.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Funkciju rakstīšanas un programmēšanas elementu vingrinājumi.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Aprakstošā statistika R vidē.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Datu vizualizēšana R vidē.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Kvalitatīvā datu analīze R vidē.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Aprakstošā statistika
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Kvalitatīvā datu analīze
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Parametriskie testi
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Parametriskie testi R vidē.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Neparametriskie testi.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Neparametriskie testi R vidē.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Korelācija un lineārā regresija.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Korelācija un lineārā regresija R vidē.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Binārā loģistiskā regresija R vidē.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
1
|
Tēmas
|
Ievads „R” valodā un „R Studio”. Saskarne, darbplūsma, skripti un kodēšanas pamati.
Ievads datu vizualizācijā ar „ggplot”: estētiskās attēlošanas, ģeometriskie objekti un statistiskās transformācijas.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Praktisks darbs ar „R” saskarni. Atbildes uz vienkāršiem jautājumiem par datiem, veidojot iebūvēto „R” datu kopu „ggplot2” vizualizācijas.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
1
|
Tēmas
|
Ievads datu konvertēšanā (pārveidē) ar „dplyr” pakotni: filtrēšana, kārtošana, atlase,
jaunu mainīgo izveide un apkopošana. Iepazīstināšana ar „R” projektu darbplūsmu.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Dažādas datu transformācijas ar „R” „dplyr” pakotni „R” iebūvētajās datu kopās.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
1
|
Tēmas
|
Pētnieciskā datu analīze: variācijas un kovariācijas novērtēšana. Statistiskie kopsavilkumi ar kastveida diagrammām. Dažāda veida datu nolasīšana „R”.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Praktiska pētnieciskā datu analīze „R”: datu variācija (joslu diagrammas, histogrammas, kastveida diagrammas) un kovariācija (vizualizējot divu mainīgo attiecības). Praktisks darbs ar „readr” pakotni datu lasīšanai.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
1
|
Tēmas
|
Datu konsekventas organizēšanas principi „R” ar „tidyr” pakotni: datu kopu vākšana un izplatīšana, darbs ar trūkstošām vērtībām. Iepazīšanās ar „R Markdown” atskaišu sistēmu, dažādiem „Markdown” formātiem un matemātisko simbolu rakstīšanas principiem.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Reālas datu kopas importēšana un kārtošana. „R Markdown” pārskata sagatavošana.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
1
|
Tēmas
|
Ievads datu pārvaldībā „R”. Relāciju datu principi: relācijas, atslēgas, savienojumi un piešķiršanas operācijas. Daži izplatīti neskaitlisku mainīgo veidi „R”. Vienlaicīgu operāciju organizēšana ar programmkanāliem.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Relāciju datu (t.i., multiplu tabulu) pārvaldība ar „dplyr”. Praktisks darbs ar neskaitlisku mainīgo tipiem „R”: koeficienti, virknes, datumi.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
1
|
Tēmas
|
Padziļināta „R” programmēšana: savu „R” funkciju rakstīšana, funkciju vektorizācija, izpilde ar nosacījumiem (ja / citādi priekšraksti), cikliem un kartes funkcijām.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Funkciju rakstīšanas un programmēšanas elementu vingrinājumi.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
1
|
Tēmas
|
Aprakstošā statistika R vidē.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Datu vizualizēšana R vidē.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
1
|
Tēmas
|
Kvalitatīvā datu analīze R vidē.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Aprakstošā statistika
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
1
|
Tēmas
|
Kvalitatīvā datu analīze
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Parametriskie testi
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
1
|
Tēmas
|
Parametriskie testi R vidē.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Neparametriskie testi.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
1
|
Tēmas
|
Neparametriskie testi R vidē.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Korelācija un lineārā regresija.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
1
|
Tēmas
|
Korelācija un lineārā regresija R vidē.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Binārā loģistiskā regresija R vidē.
|
Bibliogrāfija
Obligātā literatūra
Wickham, H. and Grolemund, G. 2016. R for Data Science. Import, Tidy, Transform, Visualize, and Model Data. O'Reilly.Piemērots angļu valodas plūsmai
Navarro, D. J. and Foxcroft, D. R. 2022. learning statistics with jamovi: a tutorial for psychology students and other beginners. (Version 0.75).Piemērots angļu valodas plūsmai