Jezikovne in spletne tehnologije

Študij: Filozofska fakulteta
Stopnja: I bolonjska stopnja
Vrsta: Izbirni
Kreditne točke: 5 točk

Predavatelj: izr. prof. dr. Vitomir Štruc


Opis predmeta

Osnovni cilj predmeta je seznanitev z možnostmi, ki jih pri vsakdanjem delu z računalnikom humanističnemu uporabniku nudijo jezikovne in spletne tehnologije; ko računalnik ni samo malo boljši pisalni stroj ampak vsestranski in učinkovit osebni pomočnik. Cilj je študentu tudi skrajšati pot do aktivnega vstopa na svetovni splet.

Specifične kompetence, pridobljene s predmetom so: razumevanje osnov teorije informacij, vpogled v kvantitativni del informacijske vsebine sporočila, sposobnost ocene velikosti besednega zaklada besedila ter zmožnost njegove izdelave in uporabe, pregled nad prostodostopnimi jezikovnimi viri in orodji, razumevanje notranje strukture spletnih dokumentov, obvladanje osnov spletnega označevalnega jezika, zmožnost priprave dokumentov za objavo na svetovnem spletu na racionalen in učinkovit način, razumevanje poti pri prenosu elektronskih besedil med različnimi okolji in platformami.

Vsebina

Osnove teorije informacij. Entropija. Kvantitativni modeli jezika. Statistični opis besedila. Gradniki besedila kot elementi podatkovne zbirke in njihove porazdelitve. Pogostnostni slovar polnopomenskih besednih vrst izbranega besedila.

Leksikalne podatkovne zbirke. Označevanje besedila, razdvoumljanje naborov oblikoslovnih oznak, lematizacija. Uporaba prostodostopnih jezikovnih virov ter orodij, spletni viri za strojno prevajanje.

Razvoj in pomen interneta svetovnega spleta. Označevalni jezik spletnih dokumentov. Prenos jezikovnih virov med različnimi platformami in relevantni standardi. Prostorsko učinkovito in človeško razumljivo (angl. human readable) kodiranje spletnih strani.

Literatura

  • V. Štruc: Jezikovne in spletne tehnologije: zbirka nalog (e-gradivo), 1. izdaja, Univerza v Ljubljani, 2014.
  • D. Jurafsky, J. H. Martin, 2009. Speech and language processing, 2. izdaja, Prentice Hall, 1024 str.
  • V. Gorjanc, 2005. Uvod v korpusno jezikoslovje. Izolit, Domžale, 163 str.
  • C.F. Sabourin, Computational morphology – morphological analysis and generation. – Montreal, 1994.
  • M. Oakes, Statistics for Corpus Linguistics. – Edinburgh, 1997.
  • P. Jakopin, 2002. Entropija v slovenskih leposlovnih besedilih. Založba ZRC, Ljubljana, 208 str.

E-učilnica

Več vsebin lahko študentje najdejo v e-učilnici.