Latviešu valodas morfēmu un vārddarināšanas modeļu datubāze
Sākums: 01/2022 Noslēgums: 12/2024
-
Projekta numurs
-
lzp-2022/1-0013
-
-
Finansējums
-
300 000 EUR
-
-
Projekta vadītājs
-
Andra Kalnača, e-pasts: andra.kalnaca@lu.lv
-
-
Projektu īsteno
-
Latvijas Universitāte
-
Zinātnes nozare
- Valodniecība un literatūrzinātne
Kopsavilkums
Projekta mērķis ir izveidot digitālu pamatresursu (datubāzi) ar vispusīgiem strukturētiem datiem par mūsdienu latviešu valodas vārddarināšanas sistēmas likumībām. Datubāze, tās veidošanā izmantojot kvalitatīvas un kvantitatīvas metodes, būs 1) apjomīgs teorētisks un praktisks pētījums mūsdienu latviešu valodas vārddarināšanas jomā, 2) pamats turpmākiem zinātniskiem pētījumiem vārddarināšanas jomā, kurā šobrīd trūkst digitālu lingvistisko resursu, kā arī noderīgs instruments automatizētas valodas apstrādes risinājumu izstrādātājiem, latviešu valodas skolotājiem un valodas apguvējiem. Projekts dos arī būtisku ieguldījumu latviešu valodas pētniecībā kopumā, jo bez vispusīga vārddarināšanas sistēmas modeļa nav iespējama pilnvērtīga izpratne par pārējām valodas apakšsistēmām (gramatiku, leksiku, pragmatiku, semantiku).
Datubāzei paredzētas divas sadaļas: 1) anotēts latviešu valodas vārddarināšanas morfēmu (sakņu, afiksu un klasiskās cilmes vārddaļu) saraksts, 2) alfabētiski pēc saknēm sakārtotas radniecīgu vārdu grupas, kur katram sekundāram un/vai saliktam vārdam fiksēta tā morfēmiskā un vārddarināšanas struktūra. Datubāzes kodols (radniecīgu vārdu grupu saraksts) tiks veidots, balstoties uz Līdzsvarotajā mūsdienu latviešu valodas tekstu korpusā iekļautajiem vārdiem.
Paredzamie projekta rezultāti: internetā (repozitorijā) publicēta brīvpieejas datubāze; latviešu valodas vārddarināšanas modeļu un morfēmu vārdnīca; zinātniski raksti (SCOPUS/WOS), rakstu krājums (SCOPUS).
Projektu konkurss:
Fundamentālo un lietišķo pētījumu projektu 2022. gada atklātais konkurss