Daudzdimensiju statistiskā analīze
Studiju kursa īstenotājs
Baložu iela 14, A kurpuss, Rīga, +371 67060897, statistika@rsu.lv, www.rsu.lv/statlab
Par studiju kursu
Mērķis
Kursa mērķis ir iepazīstināt ar daudzdimensiju datu analīzes rīkiem un koncepcijām, īpašu uzmanību pievēršot lietojumiem ar „R” programmu.
Priekšzināšanas
Augstākā matemātika, varbūtība, statistika, lineārie modeļi, pamatzināšanas par „R” programmēšanu.
Studiju rezultāti
Zināšanas
1.Studējošais: • ir ieguvis padziļinātas zināšanas par teorētiskajiem varbūtības jēdzieniem, kas saistīti ar daudzdimensiju analīzi; • ilustrē vizualizācijas paņēmienus, aprakstot daudzdimensiju datus; • novērtē svarīgākās daudzdimensiju metodes, piemēram, galveno komponentu analīzi, faktoranalīzi, klasteranalīzi un diskriminantu analīzi.
Prasmes
1.• „R” programmā ievieš atbilstošas daudzdimensiju datu vizualizācijas; • prot patstāvīgi izmantot daudzdimensiju datu analīzes metodes „R” programmā, lai veiktu pētniecisku darbību, vai augsti kvalificētas profesionālas funkcijas.
Kompetences
1.• Prot salīdzināt un izprast dažādu daudzdimensiju datu analīzes metožu mērķus un izvēlēties piemērotāko datu kopas analīzei; • Spēj izvirzīt hipotēzes un pieņemt uz analīzi balstītus lēmumus, kas saistīti ar daudzdimensiju datiem.
Vērtēšana
Patstāvīgais darbs
|
Virsraksts
|
% no gala vērtējuma
|
Vērtējums
|
|---|---|---|
|
1.
Patstāvīgais darbs |
-
|
-
|
|
1. Obligātās un papildliteratūras izpēte, lekcijās un nodarbībās apgūto zināšanu paplašināšanai un nostiprināšanai
2. Studējošajiem jāizpilda pieci „R” balstīti mājasdarbi, kas saistīti ar katru no šīm tēmām:
a. Galveno komponentu analīze (2. praktiskā nodarbība).
b. Faktoranalīze (3. praktiskā nodarbība).
c. Diskriminantu analīze (4. praktiskā nodarbība).
d. Klasteranalīze (5. praktiskā nodarbība).
e. Daudzdimensiju lineārā regresija (6. praktiskā nodarbība).
|
||
Pārbaudījums
|
Virsraksts
|
% no gala vērtējuma
|
Vērtējums
|
|---|---|---|
|
1.
Pārbaudījums |
-
|
-
|
|
Novērtējums 10 ballu skalā saskaņā ar RSU Studiju reglamentu:
• 5 iesniedzamie mājasdarbi – 70%.
• rakstisks eksāmens – 30%.
|
||
Studiju kursa tēmu plāns
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
2
|
Tēmas
|
Ievads daudzdimensiju analīzē, daudzdimensiju datu kopu piemēri, kovariācija, korelācija, daudzdimensiju normālais sadalījums. Lineārās algebras pamatelementu atkārtošana: determinanti, inversija, īpašvērtības un īpašvektori, dekompozīcijas un kvadrātiskās formas.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Daudzdimensiju datu vizualizācija ar „R”. Praktiski matricu algebras aprēķini „R”.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
2
|
Tēmas
|
Galveno komponentu (PC) analīze. Ģeometriska pieeja datu matricas izmēra samazināšanai. Galveno komponentu definīcija, interpretācija un secinājumi par tiem. Normalizēti galvenie komponenti.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Reālu datu piemēra analīze „R”: galveno komponentu aprēķināšana, statistiskās nozīmības noteikšana, grafiku sastādīšana galveno komponentu interpretācijai.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
2
|
Tēmas
|
Faktoranalīze. Ortogonālais faktoru modelis. Faktoru interpretācija. Kopīgo faktoru skaita pārbaude. Salīdzinājums ar galveno komponentu analīzi.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Faktoru analīze „R”: faktoru modeļa novērtēšana, faktoru skaita pārbaude, diagrammu sastādīšana faktoru interpretācijai.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
2
|
Tēmas
|
Diskriminantu analīze. Klases, iezīmes un klasifikācijas precizitātes mēri. Lineārā un kvadrātiskā diskriminantu analīze.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Diskriminantu analīze „R”: metožu novērtēšana, interpretācija, salīdzināšana.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
2
|
Tēmas
|
Klasteranalīze. Objektu tuvums, attāluma funkcijas. Dažādi klasterizācijas algoritmi.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Klasteranalīze „R”: dažādu klasterizācijas algoritmu īstenošana un salīdzināšana. Optimālā klasteru skaita noteikšana.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
2
|
Tēmas
|
Daudzdimensiju lineārā regresija. Daudzdimensiju normālā sadalījuma pārbaude.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Daudzdimensiju lineārā regresija „R”: novērtēšana, pārbaude un interpretācija.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
1
|
Tēmas
|
Ievads daudzdimensiju analīzē, daudzdimensiju datu kopu piemēri, kovariācija, korelācija, daudzdimensiju normālais sadalījums. Lineārās algebras pamatelementu atkārtošana: determinanti, inversija, īpašvērtības un īpašvektori, dekompozīcijas un kvadrātiskās formas.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Daudzdimensiju datu vizualizācija ar „R”. Praktiski matricu algebras aprēķini „R”.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
1
|
Tēmas
|
Galveno komponentu (PC) analīze. Ģeometriska pieeja datu matricas izmēra samazināšanai. Galveno komponentu definīcija, interpretācija un secinājumi par tiem. Normalizēti galvenie komponenti.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Reālu datu piemēra analīze „R”: galveno komponentu aprēķināšana, statistiskās nozīmības noteikšana, grafiku sastādīšana galveno komponentu interpretācijai.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
1
|
Tēmas
|
Faktoranalīze. Ortogonālais faktoru modelis. Faktoru interpretācija. Kopīgo faktoru skaita pārbaude. Salīdzinājums ar galveno komponentu analīzi.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Faktoru analīze „R”: faktoru modeļa novērtēšana, faktoru skaita pārbaude, diagrammu sastādīšana faktoru interpretācijai.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
1
|
Tēmas
|
Diskriminantu analīze. Klases, iezīmes un klasifikācijas precizitātes mēri. Lineārā un kvadrātiskā diskriminantu analīze.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Diskriminantu analīze „R”: metožu novērtēšana, interpretācija, salīdzināšana.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
1
|
Tēmas
|
Klasteranalīze. Objektu tuvums, attāluma funkcijas. Dažādi klasterizācijas algoritmi.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Klasteranalīze „R”: dažādu klasterizācijas algoritmu īstenošana un salīdzināšana. Optimālā klasteru skaita noteikšana.
|
-
Lekcija
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Auditorija
|
1
|
Tēmas
|
Daudzdimensiju lineārā regresija. Daudzdimensiju normālā sadalījuma pārbaude.
|
-
Nodarbība/Seminārs
|
Modalitāte
|
Norises vieta
|
Kontaktstundas
|
|---|---|---|
|
Klātiene
|
Datorklase
|
2
|
Tēmas
|
Daudzdimensiju lineārā regresija „R”: novērtēšana, pārbaude un interpretācija.
|
Bibliogrāfija
Obligātā literatūra
W. K. Haerdle Härdle, L. Simar, Applied Multivariate Statistical Analysis. Springer. 2015Piemērots angļu valodas plūsmai
D. Zelterman. Applied Multivariate Statistics with R. Springer, Statistics for biology and health series, 2015Piemērots angļu valodas plūsmai
Papildu literatūra
R. A. Johnson, D.W. Wickern, Applied Multivariate Statistical Analysis, 6th edition. Prentice & Hall, 2007Piemērots angļu valodas plūsmai
T. Hothorn, B. Everitt, An Introduction to Applied Multivariate Analysis with R. Springer, Use R! series, 2011Piemērots angļu valodas plūsmai