Носовский Глеб Владимирович
Шрифт:
Эта мера отражает количество «связывающих летописей» для данной пары отрезков списка, нормированное таким образом, чтобы при отсутствии дубликатов в списке, оно сохраняло бы приблизительно одно и то же значение для всех пар определяющих окрестностей списка Х.
Более точно, мера связи двух отрезков списка подбиралась таким образом, чтобы в случае правильного списка (который мы, в соответствии со сделанным предположением, рассматриваем как некоторый случайный элемент) среднее значение этой меры не зависело бы от выбора конкретной пары отрезков, то есть было бы единым для всего списка Х.
Определение.
Пусть дан хронологический список имен Х и фиксированы параметры модели k и p. Назовем связью двух определяющих окрестностей Д_r и Д_s списка Х число
r+k s+k
c
L_0(Д_r, Д_s) = – l(a_i, a_j).
(2k + 1)^2
i=r-k j=s-k
j=i
Здесь c – постоянная масштаба, задаваемая из соображений удобства вычислений (мы брали значение c=25).
Лемма 2.
Если хронологический список имен Х не содержит дубликатов (является правильным) и выполнены предположения Леммы 1, то среднее значение по размещениям для связи L_0(Д_r, Д_s) не зависит от Д_r и Д_s и равно cа(Х).
Доказательство.
Утверждение Леммы 2 следует из Леммы 1 и из того, что среднее значение суммы случайных величин равно сумме их средних значений. Заметим, что число слагаемых в двойной сумме, определяющей значение связи L_0(Д_r, Д_s), равно множителю (2k + 1)^2, стоящему в знаменателе. Следовательно, среднее значение по размещениям для связи L_0(Д_r, Д_s) равняется среднему значению по размещениям для связи l(a_i, a_j), умноженному на c, то есть равно cа(Х).
Лемма 2 доказана.
4. Зависимость связи l_0 от числа общих имен в определяющих окрестностях
Изучим характер зависимости между величиной связи L_0 двух определяющих окрестностей Д_r и Д_s и количеством общих имен в этих окрестностях (с учетом кратности вхождения имен в Д_r и Д_s).
Определение.
Числом общих имен двух определяющих окрестностей Д_r(k) и Д_s(k) в списке Х (с учетом кратностей) назовем число:
r+k s+k
O(Д_r, Д_s) = д(a_i, a_j),
i=r-k j=s-k
где д(a_i, a_j)=1 если a_i=a_j (то есть имена a_i и a_j одинаковы) и равно нулю иначе.
Другими словами, O(Д_r, Д_s) – это число пар из декартового произведения Д_r x Д_s, таких, что в паре стоят одинаковые имена.
В рассмотренных нами случаях реальных хронологических списков, описывающих древнюю и средневековую историю Европы, обнаружилось весьма примечательное обстоятельство:
Значения L_0(Д_R, Д_S) И O(Д_R, Д_S) связаны между собой таким образом, что при увеличении O(Д_R, Д_S) увеличивается (в статистическом смысле) и L_0(Д_R, Д_S).
Этот вывод был получен на основе сравнения гистограмм частот значений L0(Д_r, Д_s) при условии, что значение O(Д_r, Д_s) фиксировано.)
Может показаться, что значение связи L0(Дr, Д_s) увеличивается при увеличении O(Д_r, Д_s) непосредственно за счет общих имен в Д_r и Д_s (механизмы, приводящие к такому увеличению даже в правильных списках действительно существуют, но они очень слабы). Однако это не так. Чтобы показать это, введем еще две меры связи определяющих окрестностей Д_r и Д_s в хронологическом списке Х.
Пусть дана пара определяющих окрестностей Д_r и Д_s в списке Х. Определим соответствующие разреженные определяющие окрестности следующим образом:
Д'_r = множество различных имен из Д_r;
Д'_s = множество различных имен из Д_s;
Д»_r, s = множество имен из Д'_r, не совпадающих ни с какими именами из Д_s;
Таким образом, окрестности Д_r, Д'_s и Д»_r, s разрежены таким образом, что в них не осталось различных имен. Кроме того, окрестность Д_r, s не содержит имен, общих с Д_s или с Д'_s.
Определение.
Положим c
L1(Дr, Д_s) – ____________________Д l(a, b),
|Д'_r|x|Д'_s| aД_r, bД'_s c
L (Д_r, Д_s) – ____________________Д l(a, b).
|Д»_r, s|x|Д'_s| aД»_r, s, bД'_s
Здесь через |ч| обозначена длина (разреженной) определяющей окрестности, то есть число имен в ней.
Легко проверить, что определенная таким образом величина связи L_2 не зависит от порядка определяющих окрестностей: