Index  |  Карта сайта  |  ЛМУ Мюнхен  | Войти

ENGLISH |  РУССКИЙ |  DEUTSCH

Текстовый корпус

Текстовый корпус включает выборку репрезентативных текстов на различных обско-угорских диалектах: северном, восточном и западном (пелымском, северовагильском и среднелозьвинском) диалектах мансийского языка, казымском и сургутском диалектах хантыйского языка, а также на юганском говоре сургутского диалекта.

Источники текстов различны. С одной стороны, это тексты, которые уже были изданы в качестве различных публикаций, на основе различных систем транскрипции, с переводами на разные языки (в первую очередь речь идёт о текстах, которые ранее были практически недоступны в Европе). С другой стороны, корпус содержит неопубликованные архивные материалы, а также тексты, собранные в ходе полевых исследований участниками проекта. В ходе нашей работы, таким образом, были обработаны важные старые публикации таких авторов как Мункачи, Кальман, Каннисто и Лиимола (по мансийскому языку), а также Паасонен и Редеи (по хантыйскому языку), и, кроме того, опубликованы и проанализированы полевые архивы Чернецова по мансийскому языку (1930-е гг.) и наши собственные материалы.

Все тексты представлены в унифицированной транскрипции на основе Международного фонетического алфавита; глоссирование выполнено в соответствии с правилами, принятыми в нашем проекте (см. FLEx Preliminaries и Glossing Rules, FLEx Template OUDB). Все тексты переведены на английский язык, что было основной задачей как проекта OUL, так и проекта OUDB. Большинство текстов, обработанных в рамках проекта OUL, имеют переводы на русский и немецкий языки, которые были взяты из текстовых источников или же выполнены заново. В случаях, когда были доступны переводы на венгерский язык, они также были включены в корпус. Более детальная информация доступна в метаданных конкретных текстов. Дополнительно к некоторым текстам имеется анализ функциональных, семантических и прагматических ролей (более подробную информацию см. в аннотации). По возможности предоставляется доступ к аудиозаписям текстов.

Доступ к корпусу возможен через начальную страницу с маской для поиска (здесь). Кроме того, есть несколько предустановленных поисковых шаблонов для обоих языков, а также для каждого (суб)диалекта. Каждый текст открывается в новой вкладке, которая содержит все релевантные метаданные. Строка меню показывает, анализ какого рода (к прим. глоссирование, аннотация или аудиозапись) доступен для соответствующего текста.