UPPSALA UNIVERSITET : Inst. f. lingvistik och filologi : STP
Uppsala universitet
Hoppa över länkar


Schema
Innehåll
Examination
Inlämningsuppgifter
Referat
Litteratur
Kursvärderingar


Grundläggande textanalys

Poäng: 7,5 hp
Kursplan: 5LN443
Teachers: Marie Dubremetz, Eva Pettersson

Nyheter 

Schema


Datum Tid Sal Innehåll Litteratur
F1
1/4
10-12
Turing
Introduktion (MD)

F2
1/4
13-15
Turing
Textsegmentering (MD)
Mikheev
F3
7/4
10-12
7-0015
Morfologisk analys (MD)
J&M 3
L4
9/4
10-12
Chomsky
Lab 1

F5
14/4
10-12
Turing
N-gram-modeller (MD)
J&M 4
F6
16/4
10-12
Turing
Ordklasstaggning (MD)
J&M 5
F7
21/4
10-12
Turing
Markov-modeller (MD) J&M 6
L8
23/4
10-12
Chomsky
Lab 2

F9
5/5
10-12
Turing
Språkgranskning 1 (EP)
DB&M
F10
7/5
10-12
Turing
Språkgranskning 2 (EP)
Knutsson, Birn
L11
7/5
14-16
9-1070
Lab 3

F12
19/5
10-12
Turing
Textanalys med XML + Management (MD) Myer
S13
21/5
10-12
Turing
CANCELLED

S15
28/5
10-12
Turing
Redovisningar

S16
28/5
13-15
Turing
Redovisningar

OBS: Chomsky = 9-2043, Turing = 9-2042

Innehåll

Kursen behandlar metoder för grundläggande textanalys upp till ordnivå, inklusive tokenisering, meningssegmentering, morfologisk analys och ordklasstaggning. Kursen tar också upp språkgranskning med tonvikt på stavningskontroll.

Examination

Kursen examineras genom inlämingsuppgifter med både praktiska och teoretiska uppgifter samt ett muntligt och skriftligt referat. För betyget godkänt (G) krävs godkänt på samtliga uppgifter. För betyget väl godkänt (VG) krävs väl godkänt på minst två inlämningsuppgifter samt det skriftliga referatet.

Inlämingsuppgifter

  1. Textsegmentering
  2. Ordklasstaggning
  3. Språkgranskning

Referat

Referatuppgiften består i att sammanfatta en vetenskaplig artikel muntligt på 5-10 minuter och skriftligt på 1-2 sidor. Artikeln väljs bland de förslag som finns under litteratur nedan. Det skriftliga referatet skickas som PDF till  eva.pettersson@lingfil.uu.se senast den 5 juni.

Schema för muntlig redovisning:

Frågor att beakta i såväl det muntliga som det skriftliga referatet:

  1. Vilket språkteknologiskt problem behandlas i artikeln?
  2. Vilken metod används för att tackla detta problem?
  3. Hur förhåller sig metoden till tidigare arbeten på området?
  4. Hur visar författarna att metoden fungerar?
  5. Vad lärde du dig av att läsa artikeln?
  6. Skulle du rekommendera andra att läsa artikeln/använda metoden?

Litteratur

Gemensam litteratur: Artiklar för referatuppgiften:

Kursvärderingar

Mittkursvärdering

Slutkursvärdering