EPN-V2

DATA3800 Introduction to Data Science with Scripting Emneplan

Engelsk emnenavn
Introduction to Data Science with Scripting
Studieprogram
Bachelorstudium i anvendt datateknologi
Bachelorstudium i ingeniørfag - data
Bachelorstudium i ingeniørfag – matematisk modellering og datavitenskap
Bachelorstudium i informasjonsteknologi
Omfang
10.0 stp.
Studieår
2025/2026
Timeplan
Emnehistorikk

Innledning

Data is the new oil, powering industries, putting into motion trillion Euro companies and supporting governments to take decisions that affect the lives and the well fare of bilions of people around the world. But to do so, data must be refined, properly analized, and presented so relevant decision makers can make sense of it, and use it in a manner that delivers value to society. Data Science is the field of study that focus on collecting, organizing, cleaning, understanding, transforming, using and presenting data so it becomes useful.

In this course you are going to learn what is Data Science, and how do we approach problems in Data Science so it can contribute towards a sustainable future. We will briefly question some common ideas we may have about what science is and how we do scientific research. We will address what makes a research method suitable or not focusing on specific cases to learn from successes and disasters in the history of Data Science.

You will learn the methods, potentials and limits of Data Science as well as how to apply them to real world challenges using a scripting language (Python, Matlab or R). The course is designed to provide a solid theoretical introduction to the subject and build the foundational skill through hands-on experience. To achieve that, you will use open data-sources to develop a data science project from data-collection to insight presentation.

Anbefalte forkunnskaper

Emner innen programmering, for eksempel DAPE1400 Programmering eller DATA1300 Hurtig utvikling med scripting-språk. Grunnleggende matematikk, for eksempel DAFE1000 Matematikk 1000, vil være en fordel.

Læringsutbytte

After completing this course, the student should have the following learning outcome:

Knowledge

Upon successful completion of the course, the candidate will have the knowledge of:

  • the most commonly used methods in data science to clean, imputate, analyse and present data;
  • the context in which these methods should be applied;
  • the specific cautions and pitfalls that should be taken into account through the entire research process, particularly when using tools from statistical analysis.
  • practical data problems in different fields of science, ranging from fundamental and natural sciences to social sciences and engineering.
  • how statistical analysis can be used for uncovering the features and properties of a specific set of data.
  • the main features and techniques one should be aware of for data collection.
  • programming languages applicable to data analysis and modelling.

Skills

Upon successful completion of the course, the candidate will be able to:

  • use a scpriting programming language to perform basic data science operations
  • translate problems into research questions and evaluate it is soundness
  • propose a first design of experiments to approach specific research questions.
  • have a critical insight about the quantitative analysis presented in a research question, approaching authors’ interpretation about the presented results, e.g. in what concerns the correlation between different variables, their possible functional relations and the statistical significance of the overall results.
  • develop a computer framework to generate surrogate data sets with particular statistical features, as numerical experiments for testing specific data models.
  • apply statistical analysis and mathematical modelling techniques on data from their field of study.

General competences

Upon successful completion of the course, the student

  • will be able to construct and establish a research plan
  • will be able to create a data analysis pipeline where data is refined and transformed through scripts
  • will be able to carry out the basic quantitative analysis of its results

will have a critical understanding of the limitations and possibilities in big datasets and statistical analysis

Arbeids- og undervisningsformer

Etter å ha gjennomført dette emnet har studenten følgende læringsutbytte, definert i kunnskap, ferdigheter og generell kompetanse:

Kunnskap

Studenten har:

  • en grunnleggende forståelse av nøkkelbegreper innen kvanteberegning og kvantefysikk.
  • en grunnleggende forståelse av kvanteinformasjonsteknologier.
  • en forståelse av prinsippene og anvendelsene av kvanteberegning og beregningskvantemetoder (inkludert kvantekjemi).
  • en forståelse av potensialet kvanteinformasjonsteknologier har for fremtiden til databehandling og informasjonsprosessering.

Ferdigheter

Studenten kan:

  • bruke og programmere dagens kvantedatamaskiner via skybaserte plattformer.
  • anvende kvanteberegning for å løse komplekse, virkelighetsnære problemer.
  • orientere seg innen akademia, forskningsinstitusjoner og ledende teknologiselskaper som fokuserer på kvanteteknologier.

Generell kompetanse

Studenten kan:

  • bruke sin forståelse av nye kvantekonsepter og teknologier og være tilpasningsdyktige og fremtidsrettede IT-profesjonelle.
  • anvende tverrfaglige metoder som kombinerer konsepter fra fysikk, informatikk og matematikk for å løse komplekse problemer.
  • kommunisere faglige problemstillinger innen kvanteinformasjonsteknologier tydelig, både skriftlig og muntlig.

Arbeidskrav og obligatoriske aktiviteter

Veiledningsmøter med en intern og/eller ekstern veileder. Studentene kan gjennomføre prosjektet individuelt eller i grupper på opptil fem studenter.

Prosjektene velges/tildeles ved semesterstart.

Vurdering og eksamen

Følgende arbeidskrav er obligatoriske og må være godkjente for å kunne gå opp til eksamen:

  • En prosjektbeskrivelse, 1000-2000 ord, som beskriver hvordan gruppen skal organisere arbeidet med prosjektet.
  • En standard læringsavtale som må inngås mellom prosjektleverandør/veileder og studenten(e), og denne må godkjennes av emneansvarlig før prosjektet kan starte.
  • Tre referater fra veiledningsmøter i løpet av prosjektperioden.
  • En muntlig midtveispresentasjon, individuelt eller i grupper (maks 5 studenter), 10 minutter + 5 minutter spørsmål og svar.

Fristene for innlevering av prosjektbeskrivelse og referater fra møter vil bli presentert i undervisningsplanen, som gjøres tilgjengelig ved semesterstart.

Hjelpemidler ved eksamen

Skriftlig prosjektrapport (100 % av sluttkarakteren). En skriftlig prosjektrapport leveres ved slutten av semesteret, individuelt eller i grupper (maks 5 studenter), maks 5000 ord.

For gruppeprosjekter får alle medlemmene i gruppen samme karakter.

Eksamensresultatet kan påklages.

Vurderingsuttrykk

Alle hjelpemidler er tillatt, så lenge reglene for kildehenvisning overholdes.

Sensorordning

Grade skala A-F.

Emneoverlapp

Overlaps 9 ECTS with STKD6060