草稿 - 咕咕鸽爱学习

非常好的问题 💡 你抓住了 FMI 的一个关键弱点：它对类不平衡（尤其是“大簇 vs 小簇”）敏感。我给你一个非常直观的小例子（带数字），让你一步就理解为什么大簇会“主导”FMI 的结果。

🧩 一、背景

FMI 衡量“延迟聚类是否正确识别真实的同簇节点对”。

它在计算时看的是：

$\text{Precision} = \frac{TP}{TP + FP}, \quad \text{Recall} = \frac{TP}{TP + FN}$

其中 TP、FP、FN 都是在节点对级别计算的。

而节点对的数量和簇大小密切相关！

一个簇有 $n$ 个节点，它内部的节点对数量是：

n(n−1)2\frac{n(n-1)}{2}

也就是说，大簇里的“同簇节点对”远远多于小簇。所以 大簇错误一点点，FMI 会掉很多；小簇错一大片，FMI 变化反而不大。

假设我们有 10 个节点：

簇类型	节点	簇大小	内部节点对数
大簇	A, B, C, D, E, F, G, H	8	$\frac{8×7}{2} = 28$
小簇	I, J	2	$\frac{2×1}{2} = 1$
总同簇节点对	—	—	29 对

可见： 👉 只有 1/29 ≈ 3.4% 的“真实同簇节点对”来自小簇。

我们比较两种延迟聚类结果：

延迟聚类：

(A–H 在一起)，(I)、(J)

也就是：

统计：

计算：

$Precision = 28/(28+0)=1.0, \quad Recall = 28/(28+1)=0.9655$$FMI = \sqrt{1.0 × 0.9655} ≈ 0.9826$

→ FMI ≈ 0.98，非常高！ 尽管你其实完全错了小簇。

延迟聚类：

(A–E 在一起)，(F–H)、(I,J)

也就是：

统计：

计算：

$Precision = 14/(14+0)=1.0, \quad Recall = 14/(14+15)=0.4827$$FMI = \sqrt{1.0 × 0.4827} ≈ 0.694$

→ FMI ≈ 0.69，骤降！ 虽然你只是把大簇分裂了一点点。

情况	错误类型	FMI	实际错误影响
✅ 情况 1	小簇完全错	0.98	几乎没影响
❌ 情况 2	大簇拆错一半	0.69	FMI 急剧下降

所以我们说：

FMI 对类不平衡（簇大小差异）敏感。 FMI 的高低主要反映“大簇聚类的一致性”，小簇的错误被“淹没”。

在 FMI 中，大簇内部节点对的数量多得多，导致它们在计算中权重更大。因此 FMI 更能反映“大簇聚类的好坏”，而忽略“小簇是否聚错”。

是否希望我帮你扩展这个例子写成一段 Python 演示代码？我可以打印出每种情况下的 TP/FP/FN/FMI，让你直接运行看到这两个场景 FMI 变化的数值差异。