Kursplan

Spara favorit Skriv ut

Hämta kursplan
Kursplan för:

Datateknik AV, Datamining, 7,5 hp

Computer Engineering MA, Data mining, 7.5 Credits


Allmänna data om kursen

Kurskod: DT044A
Ämne huvudområde: Datateknik
Nivå: Avancerad
Namn (inriktning): Datamining
Högskolepoäng: 7,5
Fördjupning vs. Examen: A1N - Kursen ligger på avancerad nivå och har endast kurs(er) på grundnivå som förkunskapskrav.
Utbildningsområde: Teknik 100%
Ansvarig avdelning: Avdelningen för informations- och kommunikationssystem
Ansvarig fakultet: Fakulteten för naturvetenskap, teknik och medier
Inrättad: 2014-03-17
Fastställd: 2014-11-24
Senast ändrad: 2014-11-24
Giltig fr.o.m: 2014-07-01

Syfte

Studenten ska utveckla en grundläggande förståelse för aktuella maskininlärningsmetoder för informationsutvinning (datamining) ur stora mängder data. Studenten ska utveckla färdigheter i att hitta intressanta mönster och bygga prediktionsmodeller genom explorativ dataanalys med hjälp av dataanalysverktyg som R, Weka eller Orange och kunna förbereda data, tolka resultat och kritiskt utvärdera resultat. Studenten ska visa förmåga att tillämpa kunskaperna i ett verkligt projekt inom områden såsom big data-visualisering, affärsdata för omvärldsanalys, beslutsstödssystem, dataanalys av text, webbsidor, sensor-/positionsdata, kontextmedvetna applikationer, intelligenta agenter eller kognitiv radio.

Lärandemål

Studenten ska kunna:
• Diskutera vilka verkliga tillämpningar av datamining som är realistiska och etiska
• Utvinna information med hjälp av ett verktyg som t.ex. skriptspråket R, Python-biblioteket Orange, Java-baserade verktyg Weka eller egna implementationer av algoritmer
• Förbereda data, tolka data och utvärdera resultat
• Identifiera variabler av betydelse i en multivariat datauppsättning
• Utvinna associationsregler och utvärdera deras reliabilitet
• Utveckla och validera prediktionsmodeller
• Följa en standardiserad arbetsprocess för tillförlitlig problemanalys, modellering och utvärdering
• Tillämpa datamining-tekniker på ett litet problem från verkliga livet

Innehåll

• Användningsområden för data mining
• Data och kunskapsrepresentation (relationer, attribut, glesa matriser, tabeller, beslutsträd, regler)
• Bayesiansk statistik
• Associativa och sekventiella mönster
• Grundläggande algoritmer
• Dataklustring
• Datakategorisering
• Datarengöring
• Datavisualisering
• Associationsregler
• Dataprediktering
• Laboration på verktyget R, Orange eller Weka
• Projekt

Behörighet

Tidigare studier 120 hp inkluderande:
- 30 hp matematik inklusive kurserna Matematisk statistik, 6 hp samt Matematisk modellering, 6 hp
- Java, 6 hp
- Databaser, modellering och implementering, 6 hp

Urvalsregler

Urval sker i enlighet med Högskoleförordningen och den lokala antagningsordningen.

Undervisning

Kursen kan komma att erbjudas som campuskurs eller som webbaserad distanskurs. Studieinsatsen uppskattas till cirka 400 timmar.

Examination

0,0 hp, I101: Projektval
Betyg: Godkänd eller underkänd

0,5 hp, L101: Laboration
Betyg: Godkänd eller underkänd

3,5 hp, T101: Tentamen
Betyg: A, B, C, D, E, Fx och F

3,5 hp, P101: Projektpresentation
Betyg: Godkänd eller underkänd

Slutbetyget baseras på en sammanvägt tentamens- och projektresultat.
Betyg: A, B, C, D, E, Fx och F. A-E är godkända betyg, Fx och F underkända.

Ämnets betygskriterier hittas på www.miun.se/betygskriterier.

Betygsskala

På kursen ges något av betygen A, B, C, D, E, Fx och F. A - E är Godkänt, Fx och F är underkänt.

Litteratur


Obligatorisk litteratur

Författare/red: Witten, Frank, Hall
Titel: Datamining - Pratical Machine Learning Tolls and Techinques
Upplaga: Third edition 2011 or later
Förlag: Elsivier

Referenslitteratur

Författare/red: Ganguly et al
Titel: Knowledge discovery from sensor data
Upplaga: 2009 or later