Automatická morfologická analýza staročeských apelativ

Hlavní řešitel: Mgr. Pavlína Jínová (pavlina.jinova@ff.cuni.cz)

Cílem projektu je vytvoření podkladů pro automatickou morfologickou analýzu staročeských obecných jmen (tedy obecných jmen (apelativ) vyskytujících se v česky psaných textech z období zhruba 1300–1500). Teoretický přínos projektu spočívá zejména ve vytvoření systematizovaného a detailního přehledu tvarosloví staročeských apelativ, který dosud chybí. Z praktického hlediska představuje projekt první krok k přeměně Staročeské textové banky na korpus, tj. přeměně současné „pouhé“ kolekce textů na kvalitativně vyšší nástroj jazykovědného výzkumu obsahující i možnosti abstraktního vyhledávání (např. najít všechny tvary určitého slova najednou, najít všechny výskyty s daným morfologických významem apod.)

Jako podklad automatické morfologické analýzy je zapotřebí vytvořit dva zdroje. Prvním je slovník apelativ, druhým je gramatika, která popíše, jakých tvarů tato apelativa mohou nabývat. Slovník apelativ bude vytvořen na základě hesláře excerpčního materiálu ke Staročeskému slovníku (rozsah cca 118 000 položek, zdrojem byly česky psané literární památky z období cca 1300–1500). Gramatická část podkladů (východiskem bude především Historická mluvnice jazyka českého Jana Gebauera) musí kromě systému koncovek zachytit také všechny alternace, které nastávají v kmeni slova při deklinaci (např. vlk > vlc-i, pes > ps-i). Zároveň je třeba počítat s hláskoslovnými změnami, které jsou důsledkem vývoje jazykového systému češtiny ve sledovaném období (např. změna ó>uo>ů).Očekáváme tři hlavní výstupy projektu: a) formalizovaný popis staročeské apelativní deklinace, b) slovník apelativ se specifikovanými deklinačními vlastnostmi a c) popis zásad vytváření těchto podkladů pro automatickou morfologickou analýzu. Tento text bude publikován, počítá se s představením na mezinárodní konferenci.

Úvod > Věda a výzkum > Granty > VG FF UK > Automatická morfologická analýza staročeských apelativ