Колодяжная Л.И., Поликарпов А.А.
НЕКОТОРЫЕ КОЛИЧЕСТВЕННЫЕ ХАРАКТЕРИСТИКИ
РУССКОЙ СИНОНИМИИ
на материале "Словаря синонимов" под редакцией А.П. Евгеньевой (Л.: Наука, 1975)
1.Введение
Специализированные словарные компьютерные базы данных позволяют исследовать многообразные системные и количественные характеристики словаря данного языка. Книжной форме словаря, как правило, сопутствует единственный количественный параметр – число словарных статей. Компьютерная форма филологического словаря позволяет систематически определять и другие количественные характеристики, которые для редставительных словарей отражают различные системно-значимые характеристики лексики.
Совокупность количественных параметров данного филологического словаря тесно связана с тем набором признаков заглавного слова, которые определяют правую часть ловарной статьи. Для каждого словаря набор его количественных параметров уникален, но все же возможно выделить общие типы количественных параметров для различных филологических словарей. Мы выделяем три таких типа: элементарные количественные параметры, параметры табличного типа, параметры корреляционного типа.
Список элементарных параметров зависит от типа словаря, от способа организации лексикографической информации в нем.Параметры табличного типа можно разделить на два вида. К первому виду относятся количественные распределения каких-либо признаков заглавного слова по значениям (например, распределение слов по частям речи). Ко второму виду относятся количественные распределения слов, объединяемые каким-либо признаком (например, слов одной части речи). К параметрам корреляционного типа относятся таблицы, в которых даны количественные распределения одного признака заглавного слова относительно другого признака.
В настоящей статье описаны элементарные и табличные количественные параметры синонимического словаря. Конкретным материалом исследования послужила компьютерная версия словаря синонимов русского языка, созданная на основе книги: Словарь синонимов. Под ред. А.П. Евгеньевой. Л.: Наука, 1975.
2. Методика создания компьютерной версии Словаря синонимов
Компьютерная версия Словаря синонимов функционирует под управлением программной системы “Компьютерный филологический словарь”, которая является частью Лингвистического программно-источникового пакета UNILEX-D (см. [Андрющенко,1989],[Колодяжная,1990]).
Книжный словарь [Словарь синонимов, 1975], послуживший исходным материалом для создания компьютерной версии включает корпус основных статей (5464), корпус статей глаголов, соотносительных по виду (1696), корпус статей, включающих синонимические группы слов, производных к словам основных групп(220 статей). Кроме того, в словаре более 20000 статей, являющихся отсылочными к основным. В основные статьи компьютерной версии ключена вся информация книжного словаря кроме толкований, помет и иллюстраций. Ниже приведены описания структур статей каждой из трех словарных баз.
Структура статьи основной базы:
1 ЗАГЛ заглавное слово
2 АТЗ антоним к заглавному
3 ВАРЗ вариант заглавного
4 СИH синоним
5 ВАРС вариант синонима
6 *СТАТ вся статья 1 5
7 *ЗЗАГ зона заглав. с ант. 1 3
8 *ЗСИН зона синонима 4 5
Структура статей базы глаголов соотносительно вида:
1 ЗАГЛ заглавное слово
2 ПОМГ помета (сов./несов. вид)
3 СИHС синоним совершенного вида
4 ВСОВ вариант синонима совершенного вида
5 СИHH синоним несовершенного вида
6 ВНЕС вариант синонима несовершенного вида
7 *СТАТ вся статья 1 6
Структура статьи базы слов-производных:
1 ЗАГЛ заглавное слово
2 ПРСЛ производное заглавного слова
3 СИHП синоним производного слова
4 *СТАТ вся статья 1 3
Знак “*” в описании структуры стоит перед именем составной компоненты; цифры обозначают номера элементарных компонент, ограничивающих составную.
3. Некоторые количественные параметры Словаря синонимов
3.1. Элементарные количественные параметры
Элементарные количественные параметры являются характеристиками, отражающими в числовом виде самые общие свойства данной лексической системы, представленной в словаре. Ниже приведены элементарные количественные параметры Словаря синонимов.
Параметр |
Значение |
1. Число статей в основной базе (число доминант) | 5464 |
2. Число разных лексем,вступающих в синонимические отношения | 16852 |
3. Число всех лексико-семантических вариантов, вступающих в синонимические отношения | 20580 |
3. Число групп синонимов производных слов | 220 |
4. Число всех слов-производных образующих синонимические группы | 742 |
5. Число статей глаголов соотносительных по виду | 1696 |
6. Число всех слов в рядах глагольной базы | 7440 |
7. Число вариантов к заглавным словам | 91 |
8. Число вариантов к членам синонимических групп | 751 |
3.2. Количественные параметры табличного типа
Элементарные параметры совокупности слов, составляющих статьи синонимического словаря, дают самые общие характеристики. Параметры табличного типа выражают количественно структуру этой совокупности, выявляют ее экстремальные точки, например такие, как максимальный объем синонимической группы, максимальное число “вхождений” слова в различные синонимические группы и т.п. В том числе, представление этих данных в виде распределения дает возможность понять, как формируется то или иное среднее значение данной характеристики. Ниже приведены наиболее важные табличные параметры, характеризующие лексический массив данного Словаря синонимов.
3.2.1. Распределение основных групп по объему синонимического ряда
объем группы |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
число групп данного объема |
1578 |
1618 |
959 |
563 |
296 |
152 |
101 |
69 |
46 |
22 |
11 |
16 |
4 |
8 |
объем группы |
16 |
17 |
18 |
19 |
20 |
21 |
23 |
24 |
25 |
26 |
34 |
число групп данного объема |
4 |
2 |
4 |
3 |
1 |
1 |
1 |
1 |
1 |
1 |
2 |
Из этой таблицы наглядно видны экстремальные точки распределения. Максимальное число групп обладает объемом 3 синонима (для сравнения: в английском языке, для Вебстеровского словаря синонимов эта характеристика равна 5). Максимальный объем синонимического ряда приходится на группы, возглавляемые словами:
доминанта |
объем |
УМЕРЕТЬ |
34 |
УДАРИТЬ 2 |
34 |
ОБМАНУТЬ |
26 |
НАВЕРНОЕ |
25 |
МНОГО 1 |
24 |
УБИТЬ I. |
23 |
УСТАТЬ |
21 |
УДАРИТЬСЯ |
20 |
3.2.2. Распределение статей базы глаголов соотносительного вида по объему группы
а) глаголы совершенного вида:
объем |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
15 |
16 |
18 |
число групп данного объема |
1088 |
31 |
200 |
188 |
99 |
47 |
21 |
3 |
7 |
1 |
4 |
3 |
1 |
1 |
1 |
1 |
б) глаголы несовершенного вида:
объем |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
19 |
24 |
число групп данного объема |
606 |
32 |
350 |
313 |
177 |
97 |
60 |
24 |
8 |
9 |
9 |
5 |
3 |
1 |
1 |
1 |
Статья в глагольной базе состоит из компонент: заглавное слово, помета (несов./сов.), члены синонимической группы, вариант к члену синонимической группы. За объем группы в таблицах а) и б) принималось число синонимов совершенного вида (или несовершенного вида, в зависимосимости от типа пометы). В отличие от распределения групп основной базы максимум в таблицах а) и б) приходится на объем группы в 2 члена.Максимальным объемом среди групп совершенного вида обладают группы, возглавляемые глаголами:
доминанта |
объем |
соотв. заглавное из основной базы |
РАССЕРДИТЬСЯ |
15 |
СЕРДИТЬСЯ |
СЪЕСТЬ |
16 |
ЕСТЬ |
ПОБИТЬ |
18 |
БИТЬ 2 (наносить побои) |
Максимальным объемом среди групп несовершенного вида обладают:
доминанта |
объем |
соотв.заглавное из основной базы |
РАСТРЕПЫВАТЬ |
13 |
РАСТРЕПАТЬ |
УМИРАТЬ |
19 |
УМЕРЕТЬ |
ОБМАНЫВАТЬ |
24 |
ОБМАНУТЬ |
3.2.3. Распределение слов основной базы(включая заглавные) по числу вхождений лексемы в различные группы
Число вхождений |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
11 |
число лексем |
14185 |
1967 |
479 |
137 |
51 |
21 |
5 |
4 |
2 |
1 |
Ниже приведен список слов, синонимически наиболее активных, (входящих более, чем в 6 групп):
Слово |
число групп |
БРОСИТЬ |
7 |
БУХНУТЬ |
7 |
КРУТИТЬ |
7 |
СМОТРЕТЬ |
7 |
СТАТЬ |
7 |
ЗАХВАТИТЬ |
8 |
ЛИНИЯ |
8 |
ХВАТИТЬ |
8 |
ЯСНЫЙ |
8 |
ВЕРНЫЙ |
9 |
ТЯНУТЬ |
9 |
ПУСТОЙ |
11 |
Ниже приведена подробная схема вхождения слова “ПУСТОЙ” в различные синонимические ряды:
Доминанта синонимической группы |
Остальные члены синонимической группы |
ПУСТОЙ |
порожний |
БЕЗЛЮДНЫЙ |
пустынный |
пустой |
|
глухой |
|
нелюдимый |
|
БЕССОДЕРЖАТЕЛЬНЫЙ 1 |
малосодержательный |
пустой |
|
пустопорожний |
|
пустозвонный |
|
БЕССОДЕРЖАТЕЛЬНЫЙ 2 |
малосодержательный |
пустой |
|
ЛЕГКОМЫСЛЕННЫЙ |
несерьезный |
неосновательный |
|
ветреный |
|
пустой |
|
шалопутный |
|
НАПРАСНЫЙ |
тщетный |
безуспешный |
|
безрезультатный |
|
бесполезный |
|
бесплодный |
|
пустой |
|
зряшный |
|
НЕЖИЛОЙ |
необитаемый |
пустой |
|
НЕЗНАЧИТЕЛЬНЫЙ 1 |
ничтожный |
мизерный |
|
жалкий |
|
нищенский |
|
пустяковый |
|
пустячный |
|
пустой |
|
чепуховый | |
НЕЗНАЧИТЕЛЬНЫЙ 2 |
несерьезный |
пустяковый |
|
пустячный |
|
пустой |
|
пустяковинный |
|
чепуховый |
|
плевый |
|
ерундовый |
|
СВОБОДНЫЙ 4 |
незанятый |
пустой |
|
СВОБОДНЫЙ 5 |
незанятый |
пустой |
|
праздный |
Литература
1.
Андрющенко В.М. Концепция и архитектура Машинного фонда русского языка. М.: Наука. 1989.2.
Колодяжная Л.И. Принципы создания филологического словаря на персональном компьютере // Материалы III Всесоюзной конференции по созданию Машинного фонда русского языка. М.: Изд-во Моск.ун-та.1990.С.17-29.[ вверх ] [ главная страница ]