Самарина Ирина Владимировна

Об опыте создания базы данных «Языки России: социолингвистический портрет»

Самарина Ирина Владимировна

БД «Языки России: социолингвистический портрет» [1] содержит информацию по функционированию 86 языков РФ, среди которых и исчезающие языки Сибири. В сообщении будут затронуты вопросы информационного наполнения, программного обеспечения БД, возможности и перспективы ее развития.

Источниками социолингвистических данных послужили:

  1. публикации (преимущественно последних 20 лет);
  2. полевые социолингвистические обследования;
  3. данные, предоставленные учеными, занимающимися исследованием соответствующих языков;
  4. информация, размещаемая на сайтах субъектов РФ.

Основу информационного наполнения системы составил коллективный труд «Письменные языки мира. Языки Российской Федерации. Социолингвистическая энциклопедия», который был выполнен в рамках международного проекта «Письменные языки мира: степень и способы использования» (WLW 1988–1998) [2] коллективом НИЦ НЯО ИЯз РАН совместно с исследователями из республик и регионов РФ [3] (Михальченко 2000; Михальченко 2003) [4]. Описания языков представляют собой ответы на вопросы «Карты описания языка» (Михальченко 2003: XL–L). Это обусловило сопоставимость материалов и их трансформируемость в БД.

Рассматриваемая БД обладает большими функциональными возможностями и представляет собой инструмент для

  1. проведения научных исследований, требующих привлечения больших информационных массивов,
  2. создания функциональной классификации языков,
  3. разработки решений актуальных практических вопросов языковой политики в РФ и т.д.

БД включает более 20 основных информационных блоков, в том числе названия языков и этносов; статистические и географические данные; краткие лингвистические сведения; сведения о письменности и орфографии, статусе языка; данные по истории развития литературы и по публикациям; сведения об использовании языка в религиозной практике, в периодической печати, в образовании, в СМИ, в правительственных и административных учреждениях, в суде, в органах законодательной власти, в производственной сфере, данные об источниках информации. Общее количество пунктов рубрикатора достигает нескольких сотен.

При разработке программной системы использовалась Visual Studio .NET 2003 и SQL Server 2000 как механизм СУБД. В инсталляцию системы вошел файл в формате Access полученный экспортом из SQL Server.

Основное окно пользовательского интерфейса состоит из панели управления навигацией, рубрикатора и панели данных. Следует отметить «дружественность» элементов пользовательского интерфейса, что обеспечивается их схожестью с элементами широко распространенных программ.

Панель управления навигацией позволяет указать основной критерий запросов (язык или группу языков), перемещаться между результатами запросов, осуществлять полнотекстовый поиск по БД, сохранять результаты выполнения запросов и выводить эти результаты на печать. Выбор запросов осуществляется с помощью панели рубрикатора. Его пункты представляют собой модифицированный вариант «карты описания языка» (Михальченко 2003: XL–L). Результаты запросов отображаются на панели данных. В зависимости от выбранного пункта рубрикатора данные принимают вид таблицы или html-документа.

В настоящее время осуществляется модификация и пополнение созданной БД а) результатами переписи 2002 г.; б) новыми материалами по функционированию языков коренных народов, а также диаспор; в) картографическими и графическими данными; г) данными полевых социолингвистических обследований; д) аудио- и видеоматериалами; е) образцами текстов [6].

Примечания

  1. Грант РГНФ № 01-04-12025в «База данных «Языки России: социолингвистический портрет». Демоверсию БД см. на сайте http://instling.narod.ru. В БД вошел банк данных «Языки малочисленных народов России (ЯМАЛ)» (Грант РГНФ № 96-04-12679 «Создание банка данных: Языки малочисленных народов России (ЯМАЛ)», содержащий информацию о 54 языках коренных малочисленных народов РФ (Аношкина и др. 1995: 7–26). Англоязычная версия этого банка данных, при подготовке которой НИЦ НЯО ИЯз РАН сотрудничал с Токийским университетом, стала частью Всемирной базы данных «Исчезающие языки мира», создаваемой при поддержке Совета Европы и ЮНЕСКО. [ назад ]
  2. Инициатором этого проекта по изучению функционирования письменных языков мира в различных коммуникативных сферах был Международный центр исследований по языковому планированию Университета им. Лаваля (Квебек, Канада) под руководством Гранта Д. МакКоннелла. [ назад ]
  3. Грант РГНФ № 93–06–11039 «Письменные языки России: социолингвистический портрет». [ назад ]
  4. Гранты РГНФ № 99-04-16158д и № 02-04-16059д. [ назад ]
  5. Грант РГНФ № 96-04-12679 «Языки малочисленных народов России (ЯМАЛ)». [ назад ]
  6. Грант РГНФ № 05-04-12425в База данных «Языки России: динамика функционирования». [ назад ]

Литература

  1. Аношкина и др. 1995 – Аношкина Ж.Г., Казакевич О.А. Банк социолингвистических данных «Языки малочисленных народов России (ЯМАЛ)» // Методы социолингвистических исследований. М., 1995. С. 7–26.
  2. Михальченко 2000 – Письменные языки мира. Языки Российской Федерации. Социолингвистическая энциклопедия. Книга 1 / Отв. ред. В.Ю.Михальченко. М.: Academia, 2000. 656 с.
  3. Михальченко 2003 – Письменные языки мира. Языки Российской Федерации. Социолингвистическая энциклопедия. Книга 2 / Отв. ред. В.Ю.Михальченко. М.: Academia, 2003. 848 с.
  4. WLW 1988–1998 – The Written Languages of the World: A Survey of the Degree and Modes of Use. 1988–1998. Vol. I–V.
Google
WWW lingsib.iea.ras.ru
© ИЭА РАН, 2005 г.
Сайт создан при поддержке Бюро ЮНЕСКО в Москве