Index  |  Карта сайта  |  ЛМУ Мюнхен  | Войти

ENGLISH |  РУССКИЙ |  DEUTSCH

О проекте OUDB

Проект «Обско-угорская база данных: анализ текстовых корпусов и словари наименее описанных обско-угорских диалектов» является преемником проекта OUL. Он был начат 1 июля 2014 г., работа в его рамках будет продолжаться до 30 июня 2017 г. Данный проект финансируется DFG (Немецкое научно-исследовательское общество) и FWF (австрийский Фонд поддержки научных исследований).

Целью данного проекта является продолжение исследовательской работы, начатой проектом EUROBABEL, а также её расширение посредством систематизации, оцифровки и анализа ещё двух обско-угорских диалектов, данные по которым станут доступными в формате онлайн: западный диалект мансийского (в его пелымском, северовагильском и лозьвинском вариантах) и юганский диалект хантыйского языков. В то время как западномансийский является вымершим диалектом, и в распоряжении исследователей есть лишь текстовый материал 19 столетия, юганский диалект хантыйского языка является живым, однако находится под угрозой исчезновения; до сего дня он не был описан как самостоятельный субдиалект (восточного) сургутского диалекта хантыйского языка. Юганско-хантыйская исследовательская группа работает не только с материалами актуальных полевых исследований, но и с текстами начала 20 в. из собрания Хейкки Паасонена.

В течение трёх лет работы над проектом будут созданы и включены в уже существующее виртуальное исследовательское пространство два новых модуля базы данных для двух наименее описанных диалектов. В соответствии с параметрами OUL описание и анализ будет охватывать следующие области: (a) фонологический анализ в форме IPA (за место традиционных идиосинкразических систем транскрипции), (b) определение морфологических категорий и алломорфов в данных диалектах, а также парадигмы и модели позиций для частей речи, установленных в результате анализа алломорфов. Результаты будут представлены (c) грамматическими описаниями, отсутствовавшими до настоящего времени и (d) грамматически анализированными и (e) переведёнными на все известные метаязыки (английский, частично немецкий) текстами.
Одним из результатов полевых исследований на Югане стал фотоматериал для архива полевых исследований.
Одновременно с этим уже имеющиеся данные и результаты проекта OUL будут расширены и дополнены новыми сведениями, базирующимися на двух вышеназванных диалектах:

С помощью систематизации фонологических и морфологических категорий исследуемых диалектов расширятся возможности их описания; это будет способствовать более точному описанию грамматических категорий обско-угорских диалектов. Будет переработана и расширена система принципов и символов (сокращений) глоссирования. Кроме того, посредством включения новых диалектов будет увеличено количество диалектологических словарей / указателей, базирующихся на текстовом корпусе, при том что во внимание будут приняты все доступные лексикографические источники и интервью с информантами. Дополнительно в рамках данного проекта будут выполнены некоторые новые задачи, которые связаны с аннотацией / анализом и их презентацией: Пользовательский интерфейс уже существующей базы данных будет снабжён дополнительными опциями для фильтрации данных лексикона и для осуществления запросов конкордации в глоссированных текстах. Как словарь, так и корпус будут расширены за счёт новых функций поиска и экспорта. Значение базы существенно возрастёт благодаря дополнительным функциям фильтрации, с помощью которых будет возможен поиск по частям речи, типам морфем, сложным формам, алломорфам, диалектическим вариантам и вариантам написания. Подобная система фильтрации является основой для учёта базирующихся на корпусе статистических данных, важнейшей предпосылкой корпусно-лингвистических работ по обско-угорским языкам.

На юганском диалекте хантыйского языка, являющемся единственным рассматриваемым в проекте живым диалектом, в ходе полевого исследования должны быть записаны дополнительные тексты. С разрешения информантов данные аудиоматериалы путём фонетического тегирования в аннотационной программе ELAN должны пополнить базу данных юганско-хантыйских текстов. Таким образом могут быть более детально описаны фонетические характеристики юганского диалекта, а также установлены его морфофонологические правила. Сопоставительный анализ собственно сургутского диалекта и юганского (суб)диалекта покажет, является ли оправданной классификация последнего в качестве самостоятельного диалекта.

Кроме того, многостороннюю лингвистическую информацию даст функциональный и прагматический анализ на основе принципов текстового конструирования. Принципы и количество категорий для синтаксического, семантического и информационно-структурного (IS) анализа были разработаны в проекте OUL и протестированы на нескольких текстах корпуса. Одной из насущных потребностей исследования является внедрение технического воплощения этой дифференцированной системы аннотаций в наш корпус. Эта система будет содержать (полу)автоматическую аннотацию синтаксических, семантических и прагматических ролей. Тем самым база данных сможет дать информацию по специфическим функциям морфологических категорий в текстовом корпусе.

Дополнительной целью является дальнейшее расширение портала OUL как совместной платформы для поиска всех возможных видов информации о вышеназванных языках и культурах. Ожидаемые результаты будут значимыми не только для лингвистов, интересующихся уральскими языками и типологией, но и для представителей других гуманитарных наук, в первую очередь для культурных антропологов. Кроме того, материалы, презентуемые базой данных, могут в будущем служить целям языковой ревитализации.
Более того, доступ к данным проекта был предоставлен Языковому Архиву (TLA) Института психолингвистики Общества Макса Планка (Неймеген, Нидерланды). Данные нашего проекта являются теперь частью одного из значительнейших собраний языковых ресурсов в мире и для более лёгкого доступа и возможности дальнейшего использования интегрированы в инфраструктурный проект CLARIN-D (Common Language Resources and Technology Infrastructure).



«Обско-угорская база данных: анализ текстовых корпусов и словари наименее описанных обско-угорских диалектов»

Интернациональный исследовательский проект
1 июля 2014 –
30 июня 2017

Руководитель проекта:
Профессор доктор Елена Скрибник

Координация: Университет им. Людвига-Максимилиана, Мюнхен, Германия