Latviešu valodas skaitļojamo leksisko resursu attīstīšana dabiskās valodas sapratnei un tekstradei
Sākums: 01/2022 Noslēgums: 12/2024
-
Projekta numurs
-
lzp-2022/1-0443
-
-
Finansējums
-
299 955 EUR
-
-
Projekta vadītājs
-
Ilze Lokmane, e-pasts: ilze.lokmane@lu.lv
-
-
Projektu īsteno
-
Latvijas Universitātes Matemātikas un informātikas institūts
-
Zinātnes nozare
-
Valodniecība un literatūrzinātne
-
Datorzinātne un informātika
Kopsavilkums
Projekta mērķis ir attīstīt latviešu valodas skaitļojamos leksiskos resursus un valodas sapratnei un tekstradei nepieciešamos programmrīkus. Plānots paplašināt “Latviešu valodas leksisko tīklu” (Latvian WordNet) līdz plaša pārklājuma resursam, izveidot atvasinājumu un stabilu vārdu savienojumu semantikas sistēmu lielākajā atvērtajā latviešu valodas skaidrojošajā vārdnīcā Tezaurs.lv, kā arī izveidot skaitļojamu resursu daudzvalodu “Grammatical Framework” ietvarā. Izstrādāto skaitļojamo rersursu izmantošanas iespējas tiks demonstrētas ar lietojumpiemēru dabiskās valodas ģenerēšanā medicīnas nozarei. Valodnieciskā aspektā projekts iekļauj fundamentālu pētījumu par atvasinājumu semantiku un stabilu vārdu savienojumu struktūru un semantiku, savukārt datorlingvistiskā aspektā tiek attīstīta dabiskās valodas sapratne un ģenerēšana, izmantojot projekta gaitā izveidotos leksiskos resursus.
Projektu konkurss:
Fundamentālo un lietišķo pētījumu projektu 2022. gada atklātais konkurss