Коэффициент Жуайна

Материал из testwiki
Версия от 12:26, 29 сентября 2024; imported>Lumaca (викификация, внутренние ссылки)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигации Перейти к поиску

Коэффициент Жуайна — в лингвистике коэффициент, показывающий, насколько универсально или, наоборот, специализировано применение того или иного слова в текстах различной тематики. Если слово применяется только в текстах определённой узкой тематики, коэффициент Жуайна близок к 0, если же частота словоупотребления примерно одинакова в любом тексте, коэффициент близок к 100.

Вычисление

Коэффициент Жуайна определяется формулой[1][2]

D=100(1σμn1),

где n — количество тематических сегментов, на которые разбиты исследуемые тексты;

μ — средняя частота слова по всем сегментам;

σ — среднеквадратическое отклонение частот по отдельным сегментам.

Для вычисления коэффициента Жуайна исследуемые тексты разбиваются на сегменты разной тематики примерно одинакового объёма (при составлении частотных словарей обычно выделяют 100 сегментов). Для каждого сегмента вычисляется частота употребления μi определённого слова, то есть количество словоупотреблений, делённое на общий объём сегмента. Для полученного ряда частот μi вычисляется среднеквадратическое отклонение σ, после чего полученные значения подставляются в формулу.

Пример

Пусть исследуемые тексты разбиты на 4 сегмента, каждый размером по 1 миллиону слов. Некоторое слово, например, «коэффициент» встречается в этих сегментах соответственно 10, 11, 8 и 3 раза. Тогда μ1 = 10, μ2 = 11, μ3 = 9, μ4 = 3 употребления на миллион. Среднее значение

μ=10+11+8+34=8.

Среднеквадратическое отклонение

σ=(108)2+(118)2+(88)2+(38)24=4+9+0+254=9,5=3,08.

Тогда коэффициент Жуайна

D=100(13,08841)=100(10,22)=78.

Примечания

Шаблон:Примечания

См. также

  1. Ошибка цитирования Неверный тег <ref>; для сносок Sharov не указан текст
  2. Ошибка цитирования Неверный тег <ref>; для сносок Juilland не указан текст