Я хочу рассчитать индекс Жаккара между двумя соединениями. Каков алгоритм? Я искал его, он просто дает формулу, но как применять его к соединениям, мне неизвестно. Вы можете помочь?
Индекс Жаккара — это мера сходства между двумя множествами. Взгляните на статью в Википедии здесь . Это очень легко вычислить:
Коэффициент сходства Жаккара для наборов X и Y определяется как:
J(X,Y) = |intersection(X,Y)| / |union(X,Y)|
Где | |
указывается размер (количество элементов) множества. Представьте, что у вас есть два множества X и Y, определенные следующим образом:
X = {A, B, C, D}
Y = {C, D, E, F, G}
Затем:
intersection(X,Y) = {C, D} => |intersection(X,Y)| = 2
union(X,Y) = {A,B,C,D,E,F} => |union(X,Y)| = 5
Поэтому:J(X,Y) = 2/5
В качестве альтернативы расстояние Жаккара будетD(X,Y) = 1 - J(X,Y) = 1 - 2/5 = 3/5
В биологии индекс Жаккара использовался для вычисления сходства между сетями путем сравнения количества общих ребер (например , методы Bass, Nature 2013 ) .
Что касается применения его к соединениям, если у вас есть два набора с разными соединениями, вы можете определить, насколько похожи два набора, используя этот индекс. Элементы множеств, в данном случае соединения, в моем примере соответствуют A, B, C и т. д.
файлпод водой
ддиез
WYSIWYG
девушка101
девушка101