Veidlapa Nr. M-3 (8)
Studiju kursa apraksts

Daudzdimensiju statistiskā analīze

Studiju kursa pamatinformācija

Kursa kods
SL_119
Zinātnes nozare
Citas medicīnas un veselības zinātnes, tai skaitā tiesu medicīniskā ekspertīze; Citas medicīnas zinātņu apakšnozares
Kredītpunkti (ECTS)
3,00
Mērķauditorija
Dzīvās dabas zinātnes
LKI
7. līmenis
Studiju veids un forma
Pilna laika; Nepilna laika

Studiju kursa īstenotājs

Kursa vadītājs
Struktūrvienības vadītājs
Struktūrvienība
Statistikas mācību laboratorija
Kontaktinformācija

Baložu iela 14, A kurpuss, Rīga, +371 67060897, statistika@rsu.lv, www.rsu.lv/statlab

Par studiju kursu

Mērķis

Kursa mērķis ir iepazīstināt ar daudzdimensiju datu analīzes rīkiem un koncepcijām, īpašu uzmanību pievēršot lietojumiem ar „R” programmu.

Priekšzināšanas

Augstākā matemātika, varbūtība, statistika, lineārie modeļi, pamatzināšanas par „R” programmēšanu.

Studiju rezultāti

Zināšanas

1.Studējošais: • ir ieguvis padziļinātas zināšanas par teorētiskajiem varbūtības jēdzieniem, kas saistīti ar daudzdimensiju analīzi; • ilustrē vizualizācijas paņēmienus, aprakstot daudzdimensiju datus; • novērtē svarīgākās daudzdimensiju metodes, piemēram, galveno komponentu analīzi, faktoranalīzi, klasteranalīzi un diskriminantu analīzi.

Prasmes

1.• „R” programmā ievieš atbilstošas daudzdimensiju datu vizualizācijas; • prot patstāvīgi izmantot daudzdimensiju datu analīzes metodes „R” programmā, lai veiktu pētniecisku darbību, vai augsti kvalificētas profesionālas funkcijas.

Kompetences

1.• Prot salīdzināt un izprast dažādu daudzdimensiju datu analīzes metožu mērķus un izvēlēties piemērotāko datu kopas analīzei; • Spēj izvirzīt hipotēzes un pieņemt uz analīzi balstītus lēmumus, kas saistīti ar daudzdimensiju datiem.

Vērtēšana

Patstāvīgais darbs

Virsraksts
% no gala vērtējuma
Vērtējums
1.

Patstāvīgais darbs

-
-
1. Obligātās un papildliteratūras izpēte, lekcijās un nodarbībās apgūto zināšanu paplašināšanai un nostiprināšanai 2. Studējošajiem jāizpilda pieci „R” balstīti mājasdarbi, kas saistīti ar katru no šīm tēmām: a. Galveno komponentu analīze (2. praktiskā nodarbība). b. Faktoranalīze (3. praktiskā nodarbība). c. Diskriminantu analīze (4. praktiskā nodarbība). d. Klasteranalīze (5. praktiskā nodarbība). e. Daudzdimensiju lineārā regresija (6. praktiskā nodarbība).

Pārbaudījums

Virsraksts
% no gala vērtējuma
Vērtējums
1.

Pārbaudījums

-
-
Novērtējums 10 ballu skalā saskaņā ar RSU Studiju reglamentu: • 5 iesniedzamie mājasdarbi – 70%. • rakstisks eksāmens – 30%.

Studiju kursa tēmu plāns

PILNA LAIKA
1. daļa
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Ievads daudzdimensiju analīzē, daudzdimensiju datu kopu piemēri, kovariācija, korelācija, daudzdimensiju normālais sadalījums. Lineārās algebras pamatelementu atkārtošana: determinanti, inversija, īpašvērtības un īpašvektori, dekompozīcijas un kvadrātiskās formas.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Daudzdimensiju datu vizualizācija ar „R”. Praktiski matricu algebras aprēķini „R”.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Galveno komponentu (PC) analīze. Ģeometriska pieeja datu matricas izmēra samazināšanai. Galveno komponentu definīcija, interpretācija un secinājumi par tiem. Normalizēti galvenie komponenti.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Reālu datu piemēra analīze „R”: galveno komponentu aprēķināšana, statistiskās nozīmības noteikšana, grafiku sastādīšana galveno komponentu interpretācijai.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Faktoranalīze. Ortogonālais faktoru modelis. Faktoru interpretācija. Kopīgo faktoru skaita pārbaude. Salīdzinājums ar galveno komponentu analīzi.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Faktoru analīze „R”: faktoru modeļa novērtēšana, faktoru skaita pārbaude, diagrammu sastādīšana faktoru interpretācijai.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Diskriminantu analīze. Klases, iezīmes un klasifikācijas precizitātes mēri. Lineārā un kvadrātiskā diskriminantu analīze.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Diskriminantu analīze „R”: metožu novērtēšana, interpretācija, salīdzināšana.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Klasteranalīze. Objektu tuvums, attāluma funkcijas. Dažādi klasterizācijas algoritmi.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Klasteranalīze „R”: dažādu klasterizācijas algoritmu īstenošana un salīdzināšana. Optimālā klasteru skaita noteikšana.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Daudzdimensiju lineārā regresija. Daudzdimensiju normālā sadalījuma pārbaude.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Daudzdimensiju lineārā regresija „R”: novērtēšana, pārbaude un interpretācija.
Kopā kredītpunkti (ECTS):
3,00
Kontaktstundas:
24 ak. st.
Gala pārbaudījums:
Eksāmens (Rakstisks)
NEPILNA LAIKA
1. daļa
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Ievads daudzdimensiju analīzē, daudzdimensiju datu kopu piemēri, kovariācija, korelācija, daudzdimensiju normālais sadalījums. Lineārās algebras pamatelementu atkārtošana: determinanti, inversija, īpašvērtības un īpašvektori, dekompozīcijas un kvadrātiskās formas.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Daudzdimensiju datu vizualizācija ar „R”. Praktiski matricu algebras aprēķini „R”.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Galveno komponentu (PC) analīze. Ģeometriska pieeja datu matricas izmēra samazināšanai. Galveno komponentu definīcija, interpretācija un secinājumi par tiem. Normalizēti galvenie komponenti.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Reālu datu piemēra analīze „R”: galveno komponentu aprēķināšana, statistiskās nozīmības noteikšana, grafiku sastādīšana galveno komponentu interpretācijai.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Faktoranalīze. Ortogonālais faktoru modelis. Faktoru interpretācija. Kopīgo faktoru skaita pārbaude. Salīdzinājums ar galveno komponentu analīzi.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Faktoru analīze „R”: faktoru modeļa novērtēšana, faktoru skaita pārbaude, diagrammu sastādīšana faktoru interpretācijai.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Diskriminantu analīze. Klases, iezīmes un klasifikācijas precizitātes mēri. Lineārā un kvadrātiskā diskriminantu analīze.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Diskriminantu analīze „R”: metožu novērtēšana, interpretācija, salīdzināšana.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Klasteranalīze. Objektu tuvums, attāluma funkcijas. Dažādi klasterizācijas algoritmi.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Klasteranalīze „R”: dažādu klasterizācijas algoritmu īstenošana un salīdzināšana. Optimālā klasteru skaita noteikšana.
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
1

Tēmas

Daudzdimensiju lineārā regresija. Daudzdimensiju normālā sadalījuma pārbaude.
  1. Nodarbība/Seminārs

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Datorklase
2

Tēmas

Daudzdimensiju lineārā regresija „R”: novērtēšana, pārbaude un interpretācija.
Kopā kredītpunkti (ECTS):
3,00
Kontaktstundas:
18 ak. st.
Gala pārbaudījums:
Eksāmens (Rakstisks)

Bibliogrāfija

Obligātā literatūra

1.

W. K. Haerdle Härdle, L. Simar, Applied Multivariate Statistical Analysis. Springer. 2015Piemērots angļu valodas plūsmai

2.

D. Zelterman. Applied Multivariate Statistics with R. Springer, Statistics for biology and health series, 2015Piemērots angļu valodas plūsmai

Papildu literatūra

1.

R. A. Johnson, D.W. Wickern, Applied Multivariate Statistical Analysis, 6th edition. Prentice & Hall, 2007Piemērots angļu valodas plūsmai

2.

T. Hothorn, B. Everitt, An Introduction to Applied Multivariate Analysis with R. Springer, Use R! series, 2011Piemērots angļu valodas plūsmai