WWW.LIBRUS.DOBROTA.BIZ
БЕСПЛАТНАЯ  ИНТЕРНЕТ  БИБЛИОТЕКА - собрание публикаций
 

Pages:     | 1 ||

«русского языка, отражавший состояние Машинного фонда на конец 2000 года. Позднее некоторые его разделы перерабатывались для публикации на сайте Машинного фонда. Так, написанный ...»

-- [ Страница 2 ] --

Были подготовлены два варианта текста с SGML-разметкой (см. описание А. Я. Шайкевича поанглийски выше). Для второго варианта была сделана полуавтоматизированная вставка маркеров реплик и авторов реплик (с ручной доразметкой А. Я. Шайкевичем). В обоих вариантах было сделано ручное постредактирование для различения типов кавычек .

Для разметки корпуса газетных текстов Н. А. Ребецкой был создан программный пакет ELA.BAT (платформа MS DOS, язык С) в соответствии с методикой SGML/PAROLE. В задачи проекта входил этап разметки текстов на 1-ом уровне, включающем абзацы. Программа выделяет абзацы по формальным признакам (знакам переноса строки (\n)) и расставляет в нужном месте символы начала и конца абзаца (p, /p). Кроме того, программа размечает заголовки текстов по специфическим кодам заголовков, заданным составителями текстового корпуса (head — /head). И, наконец, программный модуль перекодирует все кавычки в текстах на знаки q и /q — открывающая и закрывающая кавычка. Из-за невозможности автоматически добавлять вложенные кавычки включается этап постредактирования текстов для поиска вложенных кавычек и добавления нужного символа (открывающей или закрывающей кавычки) вручную. Дополнительно создан модуль, позволяющий размечать текст на 2-м уровне (уровне предложений (s,/s)), который при необходимости может быть добавлен в базовый пакет .

На входе программы в интерактивном режиме задается имя исходного текста с расширением.txt. На выходе задается имя выходного текста — под этим именем будет записан размеченный на уровне абзацев текстовой файл. Программные модули: ELPRE2, ELANMOD, ELANM2 .

–  –  –

Сотрудниками научно-исследовательского сектора (НИС) и преподавателями, а также аспирантами и студентами филологического факультета Сыктывкарского государственного университета был подготовлен и реализуется проект Словарного подфонда (СпФ) Диалектологического фонда русского языка. Этот подфонд создается в виде гипертекстового словаря из следующих источников:

1. Словарь русских народных говоров (33 выпуска СРНГ имеются как в полностью отсканированном, так и фрагментами в текстовом вариантах);

2. Архангельский (10 тт),

3. Вологодский (5 тт) и

4. Новгородский (12 тт) областные словари;

5. Словарь русских говоров Карелии и сопредельных областей (4 тт),

6. Словарь с. Лойма Прилузского района Республики Коми (от А до Я) и

7. Словарь русских говоров Республики Коми (от А до Г);

8. Словарь говоров Подмосковья,

9. Словарь брянских говоров (4 тт),

10. Словарь говора деревни Акчим Красновишерского района Пермской области (2 тт),

11. Словарь современного русского народного говора (д. Деулино Рязанского района Рязанской обл.),

12. Мотивационный диалектный словарь: говоры Среднего Приобья (2 тт) и

13. Толковый словарь живого великорусского языка В. И. Даля (несколько вариантов) объемом свыше 250 тысяч словарных статей .

Кроме того имеются:

компьютерные версии некоторых словарей и энциклопедий (Даля, Ушакова, Ожегова, синонимов, Грамматический, Синтаксический, Орфографический, Иностранных слов, Сводный, БСЭ, Энциклопедии Брокгауза и Эфрона, Словаря Пушкина, отраслевые словари (медицинский, туристический и др.);

текстовые источники (объемом более 2 Гб, 25 тыс. наименований);

• текущая периодика в Интернете .

• Проект поддержан РФФИ грантом № 96-06-80691 “Гипертекстовый диалектный словарь” .





Адреса в Интернет:

http://www.komitex.ru/gowor, http://gowor95.chat.ru/, http://lesnikow.chat.ru/, http://glossa.chat.ru/, http://www.komi.com/Gowor, http://www.online.ru/~gowor, http://lsw.chat.ru, http://vault.agava.ru, http://subscribe.ru/catalog/science.humanity.hypervault (рассылка) В интернетовской рассылке предполагается интерактивное объединение данных о русских словарях (ХIХ–ХХ вв) в виде гипертекстовой библиографической системы (с размещением в Интернет и на компакт-диске). Проект поддержан РФФИ грантом 2000-06-80176 (научный руководитель С. В. Лесников. Одной из целей проекта является анализ энциклопедий и словарей русского языка для гипертекстовой интеграции этих словарей в нелинейной форме с учетом реляционных, иерархических и сетевых парадигматических связей посредством реализации синтагматических связей в интерактивном режиме на ЭВМ оцифрованных лексикографических материалов, что позволит на основе новых информационных технологий объединить лексикографические материалы, обеспечить их оперативный ввод в научный оборот — с целью оптимизации научных исследований в современной лексикографии .

Литература

Машинный фонд русского языка: идеи и суждения, М.: Наука, 1986 .

1 .

Лингвистические задачи и обработка данных на ЭВМ, Институт русского языка РАН, М., 2 .

1987 .

Машинный фонд русского языка: Предпроектные исследования, Институт русского языка 3 .

РАН, М., 1988 .

Бюллетень Машинного фонда русского языка, вып. 1, Институт русского языка РАН, М. .

4 .

1992 .

Бюллетень Машинного фонда русского языка, вып. 2, Институт русского языка РАН, М., 5 .

1992 .

Бюллетень Машинного фонда русского языка, вып. 3, Институт русского языка РАН, М., 6 .

1996 .

Труды Машинного фонда русского языка, том 1, Институт русского языка РАН, М., 1991 .

7 .

Труды Машинного фонда русского языка, том I1, Институт русского языка РАН, М., 1996 .

8 .

Вторая Всесоюзная конференция по созданию Машинного фонда русского языка (тезисы 9 .

докладов), Институт русского языка АН СССР, М., 1987 .

Третья Всесоюзная конференция по созданию Машинного фонда русского языка (тезисы 10 .

докладов), ч. 1–2, Институт русского языка АН СССР, М., 1989 .

Материалы III Всесоюзной конференции по созданию Машинного фонда русского языка 11 .

(тезисы докладов), Институт русского языка АН СССР, НИВЦ МГУ, М., 1990 .

Доклады Третьей Всесоюзной конференции по созданию Машинного фонда русского 12 .

языка (тезисы докладов), Институт русского языка АН СССР, М., 1990 .

Андрющенко В. М. Концепция и архитектура Машинного фонда русского языка, М.:

13 .

Наука, 1989 .

Аношкина Ж. Г. Подготовка частотных словарей и конкордансов на компьютере (пособие для филологов), Институт русского языка РАН, М.: Русские словари, 1995 .

Исаев И. А., Черкасова Г. А. Информационная система “ДАРЯ” // Вторая Всесоюзная 15 .

конференция по созданию Машинного фонда русского языка (Тезисы докладов). Институт русского языка АН СССР, М., 1987 .

Мошкович (Аношкина) Ж. Г. Автоматизированная лексикографическая система 16 .

Унилекс-2, НИВЦ МГУ, М., 1989 Пшеничнова Н. Н. Автоматизированнный вариант Диалектологического атласа русского языка (АВ ДАРЯ) // Лингвистические задачи и обработка данных на ЭВМ. М, 1987 .

Пшеничнова Н. Н. Диалектологический атлас русского языка и его Автоматизированный вариант // Общеславянский лингвистический атлас. Материалы и исследования .

1985–1987. М., 1989 .

Труды, связанные с программой создания Машинного фонда русского языка Бюллетень Фонетического фонда русского языка, Herausgeber: Christian Sappok (Bochum), 1 .

Лия Васильевна Бондарко (Ленинград) № 1–4, 1988– .

Проблеми створення машинных фондiв мов, Украiнский мовно-iнформацiйний фонд (тези 2 .

доповiдей), Киiв, 1991 Лексикографическая разработка фразеологизмов для словарей различных типов и для 3 .

Машинного фонда русского языка (Материалы к методической школе-семинару), Институт русского языка АН СССР. М., 1988 .

Фразеологические словари и компьютерная фразеография. Тезисы сообщений школысеминара, Научный совет по лексикологии и лексикографии АН СССР. Орел, 1990 .

Макет словарной статьи для автоматизированного толково-комбинаторного словаря 5 .

русских фразеологизмов. Образцы словарных статей. Институт языкознания АН СССР .

М., 1991 .

Лингвистическая концепция терминологического банка данных Машинного фонда 6 .

русского языка (Проект), под ред. А. С. Герда.Институт русского языка АН СССР, МГПИИЯ им. М. Тореза, М.: 1989 .



Pages:     | 1 ||



Похожие работы:

«Образец письменной части экзамена по английскому языку 1 курс 2 модуль Кол-во Баллы Удельный вопросов1 № Раздел Возможные задания за вес работы вопрос Чтение 1. Прочитайте текст и установите 1 10 2 20% соответствие между подзаголовками 1-5 и частями текста A-H. 2. Прочитайте текст и для утверждений 6-10, выберите, какие из них верны...»

«БАЙ ЯН ПОЭТИКА РУССКОГО ХАРАКТЕРА В ТВОРЧЕСТВЕ А.И. СОЛЖЕНИЦЫНА 1950-1960-Х ГОДОВ Специальность 10.01.01 – Русская литература ДИССЕРТАЦИЯ на соискание ученой степени кандидата филологических наук Научный руководитель: доктор филологических наук, профессор Сорокина Наталия Владимировна Тамбов 2017 ОГЛАВЛЕНИЕ ВВЕДЕНИЕ..3 ГЛАВА...»

«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Направление "Филология" Образовательная программа "Отечественная филология (Русский язык и литература)" Лексика и фразеология "Науки побеждать" А.В. Суворова на фоне других учебных книг XVIII в. о военном деле (Н.Г. Курганов 1777 г.; Е.Д. Войтяховский 1796...»

«ВАЗОРАТИ МАОРИФ ВА ИЛМИ ЉУМЊУРИИ ТОЉИКИСТОН ПАЖЎЊИШГОЊИ РУШДИ МАОРИФИ АКАДЕМИЯИ ТАЊСИЛОТИ ТОЉИКИСТОН ISSN 2308-3662 ИЛМ ВА ИННОВАТСИЯ (Маљаллаи илмию методї) НАУКА И ИННОВАЦИЯ (Научно-методический журнал ) №4 2014 (10) ПАЖЎЊИШГОЊИ РУШДИ МАОРИФИ АКАДЕМИЯИ ТАЊСИЛОТИ ТОЉИКИСТОН ИНСТ...»

«1128_3311126 АРБИТРАЖНЫЙ СУД ИРКУТСКОЙ ОБЛАСТИ Бульвар Гагарина, 70, Иркутск, 664025, тел. (3952)24-12-96; факс (3952) 24-15-99 дополнительное здание суда: ул . Дзержинского, 36А, Иркутск, 664011, тел. (395...»

«АНДРИПОЛЬСКАЯ Анна Сергеевна Формирование общественных ценностных представлений в медиатекстах Профиль магистратуры – "Профессиональная речевая коммуникация в массмедиа" МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ Научный руко...»

«Ондар Валентина Сувановна ОТРАЖЕНИЕ КАТЕГОРИИ ПРОСТРАНСТВА В ТУВИНСКОМ ЯЗЫКЕ (НА МАТЕРИАЛЕ ГЕРОИЧЕСКОГО ЭПОСА БОКТУГ-КИРИШ, БОРА-ШЭЭЛЕЙ) Работа посвящена анализу именных лексем с пространственной семан...»







 
2019 www.librus.dobrota.biz - «Бесплатная электронная библиотека - собрание публикаций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.