Veidlapa Nr. M-3 (8)
Studiju kursa apraksts

Neparametriskās un robustās statistikas metodes

Studiju kursa pamatinformācija

Kursa kods
SL_116
Zinātnes nozare
Matemātika; Varbūtību teorija un matemātiskā statistika
Kredītpunkti (ECTS)
6,00
Mērķauditorija
Dzīvās dabas zinātnes
LKI
7. līmenis
Studiju veids un forma
Pilna laika; Nepilna laika

Studiju kursa īstenotājs

Kursa vadītājs
Struktūrvienības vadītājs
Struktūrvienība
Statistikas mācību laboratorija
Kontaktinformācija

Kapseļu iela 23, 2.stāvs, Rīga, statistika@rsu.lv, +371 67060897

Par studiju kursu

Mērķis

Kursa mērķis ir sniegt studējošajiem padziļinātas zināšanas par matemātiskās statistikas neparametriskajām un robustajām metodēm. Biostatistikā ir ierasts, ka izlases ir mazas un datu normalitāte ir apšaubāma. Turklāt klasiskajā t-testā un dispersijas analīzē papildus ir nepieciešami homogenitātes nosacījums, kas bieži netiek ievērots. Šajās situācijās bieži izmanto neparametriskas un robustas procedūras. Arī klasiskajai lineārajai regresijai ir nepieciešams pieņēmums par normalitāti, un tā aprobežojas tikai ar lineārās atkarības aprakstīšanu. Neparametriski izlīdzināšanas paņēmieni ļauj ļoti vispārīgi novērtēt regresijas funkciju. Atlases atkārtošanas metodes ir populāras, jo īpaši ticamības intervālu noteikšanai. Aprēķiniem un gadījumu izpētei tiks izmantota „R” programmatūras pakotne.

Priekšzināšanas

• Pārzina varbūtību teoriju un matemātisko statistiku. • Nepieciešamas pamatzināšanas „R”.

Studiju rezultāti

Zināšanas

1.• izprot neparametrisku un robustu statistiskas procedūru jēdzienus un procedūras un spēj tās definēt; • pārzina un prot „R” programmā izvēlēties neparametriskas un robustas statistiskas procedūras.

Prasmes

1.• veic neparametrisku testēšanu „R” un interpretē rezultātus; • izmanto un pielieto gludināšānas paņēmienus blīvuma un regresijas funkcijas novērtēšanai; • prot pielietot atkārtotas izlases veidošanas metodes; • izmanto robustas procedūras dažādu statistikas datu problēmu risināšanai.

Kompetences

1.• izprot un atbalsta standarta statistikas metodēs izdarīto pieņēmumu nozīmi; • spēj pamatoti izvēlēties parametriskas, neparametriskas un robustas procedūras praktiskai datu analīzei, parādīt izpratni un ētisko atbildību par zinātnes rezultātu iespējamo ietekmi uz vidi un sabiedrību; • patstāvīgi izstrādā pareizu statistisko modeli, kritiski interpretē un prezentē iegūtos rezultātus, ja nepiecešams, veic papildu analīzi.

Vērtēšana

Patstāvīgais darbs

Virsraksts
% no gala vērtējuma
Vērtējums
1.

Patstāvīgais darbs

-
-
1. Literatūras izpēte atbilstoši katras lekcijas tēmai pēc kursa plāna. 2. Patstāvīgi izpildīt mājasdarbus pēc katras nodarbības, praktizējot kursā apgūtās koncepcijas.

Pārbaudījums

Virsraksts
% no gala vērtējuma
Vērtējums
1.

Pārbaudījums

-
-
Novērtējums 10 ballu skalā saskaņā ar RSU Studiju reglamentu: • Praktisko nodarbību mājasdarbi – 50%. • Rakstisks gala eksāmens – 50%.

Studiju kursa tēmu plāns

PILNA LAIKA
1. daļa
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Neparametriskās statistikas pamatjēdzieni: definīcijas un piemēri. Normalitātes un citu pieņēmumu pārbaude klasiskajām parametriskajām procedūrām. Datu transformācijas.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Normalitātes, homogenitātes un citu pieņēmumu pārbaude klasiskās statistikas procedūrās, izmantojot simulētas un reālas datu kopas „R”.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Klasiskie neparametriskie testi: pamatjēdzieni. Zīmju tests un Vilkoksona tests vienas izlases gadījumam.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

T-testa, zīmju testa un Vilkoksona testa salīdzinājums vienas izlases gadījumam „R”. Ticamības procedūras un jaudas modelēšana.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Vilkoksona rangu summas tests un Vilkoksona rangu zīmju tests divu izlašu gadījumā.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Vilkoksona rangu summas tests un Vilkoksona rangu zīmju testi „R”.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Neparametriskas vienfaktoa un divfaktoru dispersijas analīzes. Frīdmana un Kruskala–Volisa testi. Aposteriorās procedūras.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Datu kopas analīze „R” programmā, izmantojot gan parametriskas, gan neparametriskas dispersijas analīzes procedūras.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Vispārīgi gludināšanas jēdzieni. Histogrammas un intervāla platuma parametru izvēle.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Histogrammas un intervāla platuma parametru izvēle „R”.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Neparametriskais blīvuma funkcijas novērtējums. Joslas platuma parametru izvēle, izmantojot savstarpēju validāciju.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Neparametriskais blīvuma funkcijas novērtējums „R”.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Neparametriskā regresija: Nadaraja-Vatsona kodola regresija, lokālā polinomu regresija.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Neparametriska regresija „R”.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Vispārinātie aditīvie modeļi (GAM).
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Vispārinātie aditīvie modeļi „R”.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Ievads atlases atkārtošanas metodēs: Džeknaifa un būtstrepa metodes. Būtstrepa metode ticamības intervāliem. Permutācijas testi.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Atlases atkārtošanas metodes „R”. Būtstrepa metode ticamības intervāliem un permutācijas testu piemēri „R”.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Robusti secinājumi. Pamatdefinīcija un piemēri. M novērtējumi. Robusts lokācijas un mēroga novērtējums.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Robusts lokācijas un mēroga novērtējums „R”.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Robusti ticamības intervāli un statistiskā testēšana.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Robusti ticamības intervāli un testi „R”. Salīdzinājums ar klasiskajām metodēm.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Robustas dispersijas analīzes metodes vienkāršā vienvirziena un divvirzienu modelēšanā.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Robustas dispersijas analīzes metodes „R”. Salīdzinājums ar parametriskām procedūrām.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Robusta regresija.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Robusta regresija „R”. Salīdzinājums ar lineārajām un neparametriskajām regresijām.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Ieskats neparametriskās un robustās procedūrās dažādās statistikas lietojumu jomās.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Dažādas „R” pakotnes citām neparametriskām un robustām metodēm.
Kopā kredītpunkti (ECTS):
6,00
Kontaktstundas:
56 ak. st.
Gala pārbaudījums:
Eksāmens (Rakstisks)
NEPILNA LAIKA
1. daļa
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Neparametriskās statistikas pamatjēdzieni: definīcijas un piemēri. Normalitātes un citu pieņēmumu pārbaude klasiskajām parametriskajām procedūrām. Datu transformācijas.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Normalitātes, homogenitātes un citu pieņēmumu pārbaude klasiskās statistikas procedūrās, izmantojot simulētas un reālas datu kopas „R”.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Klasiskie neparametriskie testi: pamatjēdzieni. Zīmju tests un Vilkoksona tests vienas izlases gadījumam.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

T-testa, zīmju testa un Vilkoksona testa salīdzinājums vienas izlases gadījumam „R”. Ticamības procedūras un jaudas modelēšana.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Vilkoksona rangu summas tests un Vilkoksona rangu zīmju tests divu izlašu gadījumā.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Vilkoksona rangu summas tests un Vilkoksona rangu zīmju testi „R”.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Neparametriskas vienfaktoa un divfaktoru dispersijas analīzes. Frīdmana un Kruskala–Volisa testi. Aposteriorās procedūras.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Datu kopas analīze „R” programmā, izmantojot gan parametriskas, gan neparametriskas dispersijas analīzes procedūras.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Vispārīgi gludināšanas jēdzieni. Histogrammas un intervāla platuma parametru izvēle.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Histogrammas un intervāla platuma parametru izvēle „R”.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Neparametriskais blīvuma funkcijas novērtējums. Joslas platuma parametru izvēle, izmantojot savstarpēju validāciju.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Neparametriskais blīvuma funkcijas novērtējums „R”.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Neparametriskā regresija: Nadaraja-Vatsona kodola regresija, lokālā polinomu regresija.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Neparametriska regresija „R”.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Vispārinātie aditīvie modeļi (GAM).
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Vispārinātie aditīvie modeļi „R”.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Ievads atlases atkārtošanas metodēs: Džeknaifa un būtstrepa metodes. Būtstrepa metode ticamības intervāliem. Permutācijas testi.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Atlases atkārtošanas metodes „R”. Būtstrepa metode ticamības intervāliem un permutācijas testu piemēri „R”.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Robusti secinājumi. Pamatdefinīcija un piemēri. M novērtējumi. Robusts lokācijas un mēroga novērtējums.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Robusts lokācijas un mēroga novērtējums „R”.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Robusti ticamības intervāli un statistiskā testēšana.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Robusti ticamības intervāli un testi „R”. Salīdzinājums ar klasiskajām metodēm.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Robustas dispersijas analīzes metodes vienkāršā vienvirziena un divvirzienu modelēšanā.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Robustas dispersijas analīzes metodes „R”. Salīdzinājums ar parametriskām procedūrām.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Robusta regresija.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Robusta regresija „R”. Salīdzinājums ar lineārajām un neparametriskajām regresijām.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Ieskats neparametriskās un robustās procedūrās dažādās statistikas lietojumu jomās.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Dažādas „R” pakotnes citām neparametriskām un robustām metodēm.
Kopā kredītpunkti (ECTS):
6,00
Kontaktstundas:
42 ak. st.
Gala pārbaudījums:
Eksāmens (Rakstisks)

Bibliogrāfija

Obligātā literatūra

1.

Lehmann, Erich Leo, and Howard J. D'Abrera. Nonparametrics: statistical methods based on ranks. Holden-Day. 1975.

2.

Wasserman, Larry. All of nonparametric statistics. Springer Science & Business Media. 2006.

3.

Maronna, R. A., Martin, R. D., Yohai, V. J., & Salibián-Barrera, M. Robust statistics: theory and methods (with R). John Wiley & Sons. 2019.

Papildu literatūra

1.

Agresti, A., Franklin, C. A. Statistics: The Art and Science of Learning from Data (3rd ed.), Pearson Education. 2013

2.

Chan, Bertram KC. Biostatistics for epidemiology and public health using R. Springer Publishing Company. 2015.

3.

DasGupta, Anirban. Asymptotic theory of statistics and probability. Springer Science & Business Media. 2008.