EPN-V2

ACIT4530 Data Mining at Scale: Algorithms and Systems Course description

Course name in Norwegian
Data Mining at Scale: Algorithms and Systems
Study programme
Master's Programme in Applied Computer and Information Technology
Weight
10.0 ECTS
Year of study
2022/2023
Curriculum
SPRING 2023
Schedule
Course history

Introduction

We are witnessing the era of Big Data where data is generated, collected, and processed at an unprecedented scale and data-driven decisions influence many aspects of modern life.

Data mining is the process of discovering patterns in large data sets involving methods in statistics and database systems. A large number of applications such IoT sensors generate large amounts of data streams. The necessity of data stream mining and learning from the data is increasingly becoming more prevalent and urgent.

Extracting knowledge from data sets requires not only computational power but also programming abstractions as well as analytical skills. In this course, the students will be exposed to the different approaches for data mining and stream processing such as association rules learning, anomaly detection, data clustering, visualizations, and extracting statistical features on the fly from large data streams. The students will be exposed to concrete data mining and neural network architectures including deep learning models for handling large data streams such as convolutional neural networks, recurrent neural networks, autoencoders, transformers and attentions. In this course, the student will also be exposed to different data mining systems, working end-to-end pipelines including performance evaluation, detecting overfitting, underfitting, and data defects. With a focus on data mining applications, we will study some powerful numerical linear algebra methods.

Recommended preliminary courses

Arbeidskrav og obligatoriske aktiviteter må være innfridd og være vurdert til godkjent før studentene kan fremstille seg til eksamen.

  • Dokumentasjon av ett praktisk/teoretisk arbeid, presentert og faglig drøftet i plenum.
  • Minimum 80% oppmøte ved obligatorisk undervisning og læringsaktiviteter.   

Required preliminary courses

No formal requirements over and above the admission requirements.

Learning outcomes

The student should have the following outcomes upon completing the course:

Knowledge

Upon successful completion of the course, the student:

  • has a deep understanding of how data mining can be used to extract knowledge from data sets.
  • has advanced knowledge of the different data mining algorithms

Skills

Upon successful completion of the course, the student:

  • can design and implement data mining algorithms
  • can deploy different data mining systems and configure them
  • can utilize a specialized library for data mining

General competence

Upon successful completion of the course, the student:

  • can use data mining systems to mine data
  • can analyse data mining solutions with regard to robustness and in relation to his/her intended tasks
  • can explain how data mining can be used in different applications areas such as business analytics

Content

Eksamen er et praktisk, skapende prosjekt med tilhørende skriftlig refleksjon og gjennomføres individuelt. Arbeidet og den skriftlige refleksjonen vurderes samlet. Begge deler av eksamen må være vurdert til bestått for at eksamen skal være bestått. 

1. Praktisk skapende arbeid

Et ferdigstilt praktisk skapende arbeid med digitale skisser og undersøkelser som vedlegg.

2. Skriftlig oppgave

Den skriftlige refleksjonen skal omhandle det praktiske prosjektet og fagteori og fagdidaktikk skal inngå. Omfang på 1000-1500 ord. Se undervisningsplanene for nærmere informasjon om eksamen.

Eksamensresultat kan påklages. 

Fravær - ikke bestått

Studenter som på grunn av gyldig fravær ikke avlegger eksamen, eller som får vurderingen Ikke bestått, kan melde seg opp til ny/utsatt eksamen. Ved framstilling til ny/utsatt eksamen kan enten en bearbeidet versjon av samme eksamensprosjekt leveres på nytt, eller ny eksamensbesvarelse leveres. 

Teaching and learning methods

This course is divided into two parts. The first part with focus on covering the principles of data mining and stream processing. Different seminars will be given on the different methodological aspects of data mining and stream processing as well as the programming paradigms and software tools that enable them.

The second part will focus on the students completing a programming project. The project can be chosen from a portfolio of available problems. The student will work in a group on the project and submit a final code-base with a report.

During this part, there may be lectures if needed, but most of the time will be spent on individual supervision of students in lab-sessions.

Practical training

Lab sessions.

Course requirements

None.

Assessment

Group project (2-4 students) (15 000 - 17 500 words)

The exam can be appealed.

 

New/postponed exam

In case of failed exam or legal absence, the student may apply for a new or postponed exam. New or postponed exams are offered within a reasonable time span following the regular exam. The student is responsible for applying for a new/postponed exam within the time limits set by OsloMet. The Regulations for new or postponed examinations are available in Regulations relating to studies and examinations at OsloMet.

Permitted exam materials and equipment

All aids are permitted.

Grading scale

Etter å ha gjennomført dette emnet har studenten følgende læringsutbytte definert i form av kunnskap, ferdigheter og generell kompetanse:

Kunnskap

Studenten

  • Har grunnleggende kunnskap om digitale verktøy, medier og aktuell programvare.
  • Har kunnskap om algoritmisk tenkning, programmering, ideutvikling og kreative prosesser i arbeid med digitale uttrykk og produkter.
  • Har kunnskap om visuelle virkemidler og uttrykksformer i digital bildeproduksjon og digital formidling.
  • Har kunnskap om barn og unges digitale vaner og innsikt i aktuelle problemstillinger knyttet til mediekultur.
  • Har kjennskap til grunnleggende kildekritikk og opphavsrettslige forhold i digitale medier.  

Ferdigheter

Studenten

  • Kan anvende egnede digitale verktøy for å redigere og manipulere bilder og illustrasjoner.
  • Kan ta i bruk programmering og bruke ulike digitale verktøy i skapende arbeid og formidling.
  • Kan dokumentere, reflektere over og formidle egen prosess ved hjelp av digitale prosesser og dokumentasjonsformer.
  • Kan finne fram til relevant faglitteratur og anvende fagspråk i arbeidet med digitale medier.
  • Kan reflektere over barn- og ungdomskultur og drøfte aktuelle problemstillinger knyttet til medier, digitalisering og etikk.

Generell kompetanse

Studenten

  • Kan utveksle synspunkter og erfaringer med andre innen fagområdet og bidra til utvikling av god digital praksis.
  • Innehar digital dømmekraft og kan vurdere ulike ytringer, meningsinnhold og kommunikasjon i digitale medier.
  • Kan bruke fagterminologi, både skriftlig og muntlig.

Examiners

Two internal examiners. External examiner is used periodically.

Course contact person

I emnet vektlegges praktisk erfaring fra verkstedsarbeid, teoretiske studier individuelt og i gruppe. Fagteori i emnet legger vekt på forståelse for og anvendelse av begreper og arbeidsformer. HMS relateres til praktiske erfaringer i verkstedet. Fagdidaktikk inngår i emnet og skal bidra til å kontekstualisere eget praktisk arbeid og teoristudier, samt reise sentrale spørsmål om skolens oppgave og fagets egenart.

Emnet må sees i sammenheng med øvrige emner. Forståelse for prinsipp innen akademisk skriving er gjennomgående i studiet. Alle aspekter i emnet behandles ikke nødvendigvis i undervisningen, men skal dekkes av studenten selv gjennom lesning av pensumlitteratur, deltagelse i kollokviegrupper og praktisk, utforskende arbeid.