Veidlapa Nr. M-3 (8)
Studiju kursa apraksts

Statistiskā programmēšana un datu pārvaldība

Studiju kursa pamatinformācija

Kursa kods
SL_108
Zinātnes nozare
Matemātika
Kredītpunkti (ECTS)
6,00
Mērķauditorija
Dzīvās dabas zinātnes
LKI
7. līmenis
Studiju veids un forma
Pilna laika; Nepilna laika

Studiju kursa īstenotājs

Kursa vadītājs
Struktūrvienības vadītājs
Struktūrvienība
Statistikas mācību laboratorija
Kontaktinformācija

Kapseļu iela 23, 2.stāvs, Rīga, statistika@rsu.lv, +371 67060897

Par studiju kursu

Mērķis

Datu analīzes un pārvaldības prasmes ir ļoti svarīgas mūsdienu lietišķajos statistikas pētījumos. Kursa mērķis ir iepazīstināt studentus ar statistikas programmatūras rīkiem, ko izmanto biostatistikas pētījumos: „R”. Tādējādi kursa mērķi ir: • iepazīstināt studējošos ar statistisko programmēšanu un datu pārvaldību, izmantojot „R” statistikas programmatūru; • sagatavot studējošos darbam ar datoru citos studiju programmas „Biostatistika” kursos.

Priekšzināšanas

Īpašas priekšzināšanas netiek prasītas, taču kursā būs nepieciešamas datorprasmes un vidusskolas līmeņa algebras zināšanas un tiks izmantoti statistikas jēdzieni.

Studiju rezultāti

Zināšanas

1.• Pārzināt, atlasīt, patstāvīgi izmantot „R” programmēšanas pamatprincipus. • Lietot „R” datu bāzu pārvaldības principus. • Apgūt un izmantot padziļinātus programmēšanas elementus, piemēram, izpildi ar nosacījumiem, ciklus un pielāgotas funkcijas.

Prasmes

1.Pēc kursa pabeigšanas studenti spēs: • pārbaudīt dažāda veida datus programmatūrā un organizēt tos analīzes nolūkos; • veikt datu pilnīgu transformāciju un vizualizāciju ar „R”; • uzrakstīt un izmantot paši savas R funkcijas, lai automatizētu bieži pildāmus uzdevumus.

Kompetences

1.Studenti spēs: • kvalitatīvi izmantot „R” programmatūru statistiskai analīzei citos biostatistikas kursos; • saprast atšķirības starp „R” un citām programmām un izvēlēties piemērotāko konkrētai analīzei; • patstāvīgi uzlabot savas statistiskās programmēšanas prasmes, lai veiktu pētniecisku darbību vai analizētu ar veselību saistītos datus.

Vērtēšana

Patstāvīgais darbs

Virsraksts
% no gala vērtējuma
Vērtējums
1.

Patstāvīgais darbs

-
-
• Patstāvīgais darbs ar lekciju materiālu, gatavojoties visām studiju kursa lekcijām. • Patstāvīgi sagatavot piešķirtos 2 datorprojektus, praktizējot kursā apgūtās koncepcijas. Lai izvērtētu studiju kursa kvalitāti kopumā, studentam jāaizpilda studiju kursa novērtēšanas anketa Studējošo portālā.

Pārbaudījums

Virsraksts
% no gala vērtējuma
Vērtējums
1.

Pārbaudījums

-
10 balles

Novērtējums 10 ballu skalā saskaņā ar RSU Studiju reglamentu: • Divi datoru projekti: 50% × 2 = 100%

Studiju kursa tēmu plāns

PILNA LAIKA
1. daļa
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Ievads „R” valodā un „R Studio”. Saskarne, darbplūsma, skripti un kodēšanas pamati. Ievads datu vizualizācijā ar „ggplot”: estētiskās attēlošanas, ģeometriskie objekti un statistiskās transformācijas.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Praktisks darbs ar „R” saskarni. Atbildes uz vienkāršiem jautājumiem par datiem, veidojot iebūvēto „R” datu kopu „ggplot2” vizualizācijas.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Ievads datu konvertēšanā (pārveidē) ar „dplyr” pakotni: filtrēšana, kārtošana, atlase, jaunu mainīgo izveide un apkopošana. Iepazīstināšana ar „R” projektu darbplūsmu.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Dažādas datu transformācijas ar „R” „dplyr” pakotni „R” iebūvētajās datu kopās.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Pētnieciskā datu analīze: variācijas un kovariācijas novērtēšana. Statistiskie kopsavilkumi ar kastveida diagrammām. Dažāda veida datu nolasīšana „R”.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Praktiska pētnieciskā datu analīze „R”: datu variācija (joslu diagrammas, histogrammas, kastveida diagrammas) un kovariācija (vizualizējot divu mainīgo attiecības). Praktisks darbs ar „readr” pakotni datu lasīšanai.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Datu konsekventas organizēšanas principi „R” ar „tidyr” pakotni: datu kopu vākšana un izplatīšana, darbs ar trūkstošām vērtībām. Iepazīšanās ar „R Markdown” atskaišu sistēmu, dažādiem „Markdown” formātiem un matemātisko simbolu rakstīšanas principiem.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Reālas datu kopas importēšana un kārtošana. „R Markdown” pārskata sagatavošana.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Ievads datu pārvaldībā „R”. Relāciju datu principi: relācijas, atslēgas, savienojumi un piešķiršanas operācijas. Daži izplatīti neskaitlisku mainīgo veidi „R”. Vienlaicīgu operāciju organizēšana ar programmkanāliem.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Relāciju datu (t.i., multiplu tabulu) pārvaldība ar „dplyr”. Praktisks darbs ar neskaitlisku mainīgo tipiem „R”: koeficienti, virknes, datumi.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Padziļināta „R” programmēšana: savu „R” funkciju rakstīšana, funkciju vektorizācija, izpilde ar nosacījumiem (ja / citādi priekšraksti), cikliem un kartes funkcijām.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Funkciju rakstīšanas un programmēšanas elementu vingrinājumi.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Aprakstošā statistika R vidē.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Datu vizualizēšana R vidē.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Kvalitatīvā datu analīze R vidē.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Aprakstošā statistika
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Kvalitatīvā datu analīze
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Parametriskie testi
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Parametriskie testi R vidē.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Neparametriskie testi.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Neparametriskie testi R vidē.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Korelācija un lineārā regresija.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Korelācija un lineārā regresija R vidē.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Binārā loģistiskā regresija R vidē.
Kopā kredītpunkti (ECTS):
6,00
Kontaktstundas:
48 ak. st.
Gala pārbaudījums:
Eksāmens (Rakstisks)
NEPILNA LAIKA
1. daļa
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
1

Tēmas

Ievads „R” valodā un „R Studio”. Saskarne, darbplūsma, skripti un kodēšanas pamati. Ievads datu vizualizācijā ar „ggplot”: estētiskās attēlošanas, ģeometriskie objekti un statistiskās transformācijas.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Praktisks darbs ar „R” saskarni. Atbildes uz vienkāršiem jautājumiem par datiem, veidojot iebūvēto „R” datu kopu „ggplot2” vizualizācijas.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
1

Tēmas

Ievads datu konvertēšanā (pārveidē) ar „dplyr” pakotni: filtrēšana, kārtošana, atlase, jaunu mainīgo izveide un apkopošana. Iepazīstināšana ar „R” projektu darbplūsmu.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Dažādas datu transformācijas ar „R” „dplyr” pakotni „R” iebūvētajās datu kopās.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
1

Tēmas

Pētnieciskā datu analīze: variācijas un kovariācijas novērtēšana. Statistiskie kopsavilkumi ar kastveida diagrammām. Dažāda veida datu nolasīšana „R”.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Praktiska pētnieciskā datu analīze „R”: datu variācija (joslu diagrammas, histogrammas, kastveida diagrammas) un kovariācija (vizualizējot divu mainīgo attiecības). Praktisks darbs ar „readr” pakotni datu lasīšanai.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
1

Tēmas

Datu konsekventas organizēšanas principi „R” ar „tidyr” pakotni: datu kopu vākšana un izplatīšana, darbs ar trūkstošām vērtībām. Iepazīšanās ar „R Markdown” atskaišu sistēmu, dažādiem „Markdown” formātiem un matemātisko simbolu rakstīšanas principiem.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Reālas datu kopas importēšana un kārtošana. „R Markdown” pārskata sagatavošana.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
1

Tēmas

Ievads datu pārvaldībā „R”. Relāciju datu principi: relācijas, atslēgas, savienojumi un piešķiršanas operācijas. Daži izplatīti neskaitlisku mainīgo veidi „R”. Vienlaicīgu operāciju organizēšana ar programmkanāliem.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Relāciju datu (t.i., multiplu tabulu) pārvaldība ar „dplyr”. Praktisks darbs ar neskaitlisku mainīgo tipiem „R”: koeficienti, virknes, datumi.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
1

Tēmas

Padziļināta „R” programmēšana: savu „R” funkciju rakstīšana, funkciju vektorizācija, izpilde ar nosacījumiem (ja / citādi priekšraksti), cikliem un kartes funkcijām.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Funkciju rakstīšanas un programmēšanas elementu vingrinājumi.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
1

Tēmas

Aprakstošā statistika R vidē.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Datu vizualizēšana R vidē.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
1

Tēmas

Kvalitatīvā datu analīze R vidē.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Aprakstošā statistika
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
1

Tēmas

Kvalitatīvā datu analīze
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Parametriskie testi
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
1

Tēmas

Parametriskie testi R vidē.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Neparametriskie testi.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
1

Tēmas

Neparametriskie testi R vidē.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Korelācija un lineārā regresija.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
1

Tēmas

Korelācija un lineārā regresija R vidē.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Binārā loģistiskā regresija R vidē.
Kopā kredītpunkti (ECTS):
6,00
Kontaktstundas:
36 ak. st.
Gala pārbaudījums:
Eksāmens (Rakstisks)

Bibliogrāfija

Obligātā literatūra

1.

Wickham, H. and Grolemund, G. 2016. R for Data Science. Import, Tidy, Transform, Visualize, and Model Data. O'Reilly.Piemērots angļu valodas plūsmai

2.

Navarro, D. J. and Foxcroft, D. R. 2022. learning statistics with jamovi: a tutorial for psychology students and other beginners. (Version 0.75).Piemērots angļu valodas plūsmai

Citi informācijas avoti

1.

StatmethodsPiemērots angļu valodas plūsmai

2.

Cheatsheets

3.

ggplot2.Piemērots angļu valodas plūsmai