Nazwa przedmiotu: Przetwarzanie języka naturalnego
Typ przedmiotu: specjalnościowy (podstawowa)
Katedra/sekcja: Katedra Inteligentnych Systemów Interaktywnych
wykład
Liczba godzin: 1
Prowadzący: dr inż. Jan Daciuk
Prowadzony na: stopień: 2 (mgr), Inteligentne Systemy Interaktywne, sem. 3
projekt
Liczba godzin: 1
Prowadzący: dr inż. Jan Daciuk
Prowadzony na: stopień: 2 (mgr), Inteligentne Systemy Interaktywne, sem. 3
wykład
Wykład prowadzony będzie w oparciu o książki:
  1. Daniel Jurafsky and James H. Martin, Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, drugie wydanie, Prentice-Hall, Upper Saddle River, New Jersey, 2009.
  2. Christopher D. Manning and Hinrich Schütze, Foundations of Statistical Natural Language Processing , the MIT Press, Cambridge, Massachusets, London, England, third printing, 2000.
  3. Emmanuel Roche and Yves Schabes, Finite-State Language Processing, MIT Press, 1997.
Ponadto wykorzystywane będą inne źródła, jak np.: W zrozumieniu gramatyki języka polskiego przydać mogą się następujące książki:
  • Alicja Nagórko, Zarys gramatyki polskiej, Wydawnictwo Naukowe PWN, Warszawa, 1996.
  • Zygmunt Saloni, Włodzimierz Gruszczyński, Marcin Woliński, Słownik gramatyczny języka polskiego. Podstawy teoretyczne. Instrukcja użytkowania, Wiedza powszechna, 2007.
  • Gramatyka współczesnego języka polskiego. Morfologia, pod redakcją Renaty Grzegorczykowej, Romana Laskowskiego i Henryka Wróbla, tom 1 i 2, Wydawnictwo Naukowe PWN, Warszawa, 1998.
  • Mirosław Bańko, Wykłady z polskiej fleksji, Wydawnictwo naukowe PWN, Warszawa, 2002.
  • Zygmunt Saloni, Czasownik polski. Odmiana. Słownik, Wiedza Powszechna, Warszawa, 2001.
  • Stanisław Mędak, Słownik form koniugacyjnych czasowników polskich, Universitas, Kraków, 2004.
  • Stanisław Mędak, Słownik odmiany rzeczowników polskich, Universitas, Kraków, 2003.
W szczególności zawierają one wiadomości dotyczące morfologii języka polskiego, które mogą okazać się nieocenione na laboratorium.
Folie z wykładu:
Data 25 II 4 III 11 III 18 III 25 III 1 IV 8 IV 15 IV 22 IV 29 IV 6   V 13 V 20 V 27 V 3  VI
PDF w1 w2 w3 w4 w5 w6 w7 w8 w9 w10 w11 w12 w13 w14 w15
Stron 14 17 35 13 75 22 10 15 22 25 14 10 12 19 15

Harmonogram może ulec zmianie.

Zasady zaliczenia: jest jedna ocena za cały przedmiot, obejmujący wykład i ćwiczenia laboratoryjne. Obie części wnoszą po 50% punktów.

Wykład: egzamin testowy, każdy otrzymuje indywidualny, losowo wybrany zestaw, 4 możliwe odpowiedzi, jedna prawidłowa, brak punktów ujemnych za odpowiedzi nieprawidłowe, można korzystać z dodatkowych materiałów (książki, notatki z wykładu itp.), nie można korzystać z pomocy innych osób. Większość pytań ma postać krótkich zadań. Wszystkie pytania wymagają rozumienia materiału, a nie tylko jego opanowania pamięciowego. 5pkt za obecności na wykładzie
 

Laboratorium: suma punktów za poszczególne ćwiczenia, przeskalowana na 50 punktów. Za ćwiczenie dostaje się zwykłą, tradycyjną ocenę. Zaliczenie następuje na zajęciach; w przypadku opóźnienia odejmowane jest pół stopnia za każdy rozpoczęty tydzień, w którym odbywają się zajęcia.
 
pkt ocena
96-100 5,5
90-95 5
80-89 4,5
70-79 4
60-69 3,5
50-59 3
0-49 2
Obecności i oceny z 17.06.2015. Kolokwium/egzamin odbędzie się w środę 17 VI o 11:15 w sali 110 NE. Kolokwium poprawkowe odbyło się w piątek 11 IX o 11:15 w sali 104 NE. Ostateczne wyniki.
projekt
Laboratorium odbywać się będzie po dwie godziny co dwa tygodnie. Wykorzystywany będzie system operacyjny Linux i dostępne w nim narzędzia. Wskazane jest przypomnienie sobie umiejętności posługiwania się tym oprogramowaniem. Niektóre ćwiczenia będą też wymagały wiadomości z morfologii języka polskiego - patrz materiały wymienione w części dotyczącej wykładu. Do zajęć laboratoryjnych należy się przygotowywać! Brak przygotowania powoduje narastające opóźnienia w zaliczaniu ćwiczeń i kłopoty z uzyskaniem pozytywnej oceny z przedmiotu!
 
Studenci będą wykonywać zajęcia w grupach dwuosobowych. Ponieważ praca w grupie może rodzić wątpliwości odnośnie oceniania (jedna osoba pracuje, druga się obija, a dostają wspólną ocenę), osoby, którym nie odpowiada praca w grupie, mogą pracować samodzielnie. Z doświadczeń prowadzącego wynika, że dyskusja w grupie przyczynia się do lepszego zrozumienia zadań.
 
Data Temat Powiązanie z wykładem
  25 II Narzędzia systemu Linux/Unix do przetwarzania tekstu -
11 III
25 III Morfologia w2, w3, w4, w5
8 IV
22 IV Segmentacja w1
6 V Wyszukiwanie dokumentów w8
20 V Składnia i znaczenie w10, w11, w12, w13
3 VI

Komunikaty

Zajęcia laboratoryjne/projektowe zostały przeniesione do EA 36.