Veidlapa Nr. M-3 (8)
Studiju kursa apraksts

Datu inženierija

Studiju kursa pamatinformācija

Kursa kods
SZF_174
Zinātnes nozare
Citas sociālās zinātnes, tai skaitā starpnozaru sociālās zinātnes un militārā zinātne
Kredītpunkti (ECTS)
6,00
Mērķauditorija
Informācijas un komunikācijas zinātne; Uzņēmējdarbības vadība; Vadībzinātne
LKI
7. līmenis
Studiju veids un forma
Pilna laika

Studiju kursa īstenotājs

Kursa vadītājs
Struktūrvienības vadītājs
Struktūrvienība
Sociālo zinātņu fakultāte
Kontaktinformācija

Dzirciema iela 16, Rīga, szf@rsu.lv

Par studiju kursu

Mērķis

Šī kursa mērķis ir sniegt uzņēmumu un projektu vadītājiem izpratni par datu inženierijas pamatiem un tās nozīmi mūsdienu uzņēmējdarbībā. Kursa ietvaros dalībnieki iegūs zināšanas par datu plūsmas un datu apstrādes procesiem, kas palīdzēs veiksmīgāk plānot un vadīt projektus, kuros izmantoti dati, kā arī izprast prasības un izaicinājumus datu infrastruktūras izveidē un uzturēšanā.

Priekšzināšanas

Lai sekmīgi piedalītos šajā datu inženierijas kursā, dalībniekiem ir vēlama pamatizpratne par datorzinātnēm un IT infrastruktūru, kā arī pamatzināšanas par datu bāzēm un datu analīzi. Būtu noderīga arī izpratne par biznesa procesiem un to, kā dati tiek izmantoti lēmumu pieņemšanā. Priekšrocība būs zināšanas projektu vadībā, lai veiksmīgāk pārraudzītu un koordinētu datu projektus no biznesa perspektīvas.

Studiju rezultāti

Zināšanas

1.Apraksta datu inženiera lomu un pienākumus, kā arī analizē sadarbības aspektus ar IT speciālistiem un uzņēmējdarbības vienībām.

2.Izskaidro datu plūsmu struktūru un salīdzina ETL un ELT procesus, izvērtējot to priekšrocības un ierobežojumus dažādos kontekstos.

3.Analizē datu uzglabāšanas sistēmu struktūras un salīdzina SQL un NoSQL datubāzu piemērotību dažādiem apstrādes scenārijiem.

4.Paskaidro partiju un straumējošās datu apstrādes pamatprincipus un izvērtē to pielietojamību IoT datu apstrādes un telemetrijas analīzes situācijās.

Patstāvīgais darbs un pārbaudījumi

Prezentācija par izpētīto tēmu

5.Demonstrē izpratni par izplatīto skaitļošanas sistēmu darbību (Spark, Hadoop) un analizē to pielietojumu liela apjoma datu apstrādē.

6.Salīdzina galveno mākoņpakalpojumu (AWS, GCP, Azure) funkcionalitāti un novērtē to pielietojamību dažādos datu inženierijas kontekstos.

Patstāvīgais darbs un pārbaudījumi

Prezentācija par izpētīto tēmu

7.Apraksta datu integrācijas procesus un identificē labākās prakses datu kvalitātes nodrošināšanā, lai saglabātu precizitāti un konsekvenci.

8.Identificē datu apstrādes ekosistēmas galvenos rīkus un tehnoloģijas un izskaidro to lomu dažādās vidēs (vietējā, mākoņa u.c.).

Patstāvīgais darbs un pārbaudījumi

Prezentācija par izpētīto tēmu

9.Analizē datu noliktavu arhitektūru, apraksta dimensiālo modelēšanu un paskaidro OLAP procesu nozīmi datu analīzē.

10.Paskaidro datu ezeru arhitektūru un novērtē labākās prakses datu uzglabāšanā un piekļuvē datu ezeros.

11.Demonstrē zināšanas par reāllaika datu apstrādes tehnoloģijām (Apache Kafka, Flink) un izskaidro to piemērotību telemetrijas datu analīzei.

12.Izskaidro datu inženierijas projektu plānošanas, uzraudzības un īstenošanas posmus un analizē komunikācijas lomu to sekmīgā izpildē.

Prasmes

1.Prasmes strādāt ar datu plūsmām, datu apstrādes un integrācijas rīkiem (Apache Spark, Hadoop, Apache Kafka, Airflow, etc.) un datubāzēm (MySQL, PostgreSQL, MongoDB).

2.Prasmes strādāt ar mākoņpakalpojumu platformām un izmantot mākoņinfrastruktūras risinājumus datu glabāšanai, apstrādei un analīzei.

3.Prasmes izstrādāt un īstenot datu kvalitātes nodrošināšanas plānus, piemēram, validācijas un attīrīšanas procesus.

4.Prasmes optimizēt datu plūsmas, uzlabojot veiktspēju un efektivitāti.

Kompetences

1.Spēja identificēt problēmas datu integrācijā, uzglabāšanā un apstrādē, kā arī spēja piedāvāt efektīvus risinājumus, izmantojot piemērotas tehnoloģijas.

2.Spēja efektīvi sadarboties ar citiem datu inženieriem, analītiķiem, izstrādātājiem un projektu vadītājiem, lai sasniegtu kopējos mērķus.

3.Kompetence pārvaldīt datu infrastruktūru, nodrošinot tās efektīvu darbību, atbilstību prasībām un drošību.

4.Spēja izmantot jaunākās tehnoloģijas un metodes, piemēram, mākslīgo intelektu un mašīnmācīšanos, lai uzlabotu datu apstrādes procesus.

Vērtēšana

Patstāvīgais darbs

Virsraksts
% no gala vērtējuma
Vērtējums
1.

Prezentācija par izpētīto tēmu

-
Ieskaite

Katram no studentiem tiks izdalīta tēma, kas jāapgūst patstāvīgi un jāspēj prezentēt.

Pārbaudījums

Virsraksts
% no gala vērtējuma
Vērtējums
1.

Eksāmens

-
10 balles

Studiju kursa tēmu plāns

PILNA LAIKA
1. daļa
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Reāllaika datu apstrāde
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Data pipelines – kā tos veidot un uzturēt. ETL (extract, transform, load) un ELT procesi, priekšrocības un trūkumi
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Datu noliktavu dizains un arhitektūra
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Lielo datu apstrāde, distributed computing (Spark, Hadoop)
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Datu apstrādes ekosistēma
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Datu uzglabāšanas sistēmas un datubāzes
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Datu inženierijas projektu vadība
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Batch VS Streaming datu apstrāde, telemetrija un IoT dati
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Lielo datu apstrāde, distributed computing (Spark, Hadoop)
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Datu ezeru struktūras un labākās prakses
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Datu uzglabāšanas sistēmas un datubāzes
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Lielo datu apstrāde, distributed computing (Spark, Hadoop)
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Batch VS Streaming datu apstrāde, telemetrija un IoT dati
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Datu ezeru struktūras un labākās prakses
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Datu noliktavu dizains un arhitektūra
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Datu inženierijas projektu vadība
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Mākoņinfrastruktūras pamati (AWS, Google Cloud, Azure)
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Batch VS Streaming datu apstrāde, telemetrija un IoT dati
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Mākoņinfrastruktūras pamati (AWS, Google Cloud, Azure)
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Datu inženiera loma un atbildības
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Data pipelines – kā tos veidot un uzturēt. ETL (extract, transform, load) un ELT procesi, priekšrocības un trūkumi
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Datu uzglabāšanas sistēmas un datubāzes
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Datu integrācija un datu kvalitātes nodrošināšana
  1. Lekcija

Modalitāte
Norises vieta
Kontaktstundas
Klātiene
Auditorija
2

Tēmas

Datu integrācija un datu kvalitātes nodrošināšana
Kopā kredītpunkti (ECTS):
6,00
Kontaktstundas:
48 ak. st.
Gala pārbaudījums:
Eksāmens

Bibliogrāfija

Obligātā literatūra

1.

Kleppmann M. 2017. Designing Data-Intensive Applications: The Big Ideas Behind Reliable, Scalable, and Maintainable SystemsPiemērots angļu valodas plūsmai

2.

Akidau T., Chernyak S., Lax R. 2018. Streaming Systems: The What, Where, When, and How of Large-Scale Data ProcessingPiemērots angļu valodas plūsmai

3.

Dutt D.G. 2019. Cloud Native Data Center NetworkingPiemērots angļu valodas plūsmai

4.

Akerkar R. 2014. Big Data: Principles and Paradigms (akceptējams izdevums)Piemērots angļu valodas plūsmai

5.

Krishnan K. 2013. Data Warehousing in the Age of Big Data (akceptējams izdevums)Piemērots angļu valodas plūsmai

Papildu literatūra

1.

Glass R., Callahan S. 2014. The Big Data-Driven Business: How to Use Big Data to Win Customers, Beat Competitors, and Boost ProfitsPiemērots angļu valodas plūsmai

2.

Shalender K., Singla B., Singh N., Singla R. 2025. Integrating AI with Data Science: Realising Full Potential of Data-driven Decision Making. Navigating Data Science in the Age of AI: Exploring Possibilities of Generative Intelligence, pp. 1 - 11Piemērots angļu valodas plūsmai