这里p+q+r可理解为A与B的并集的元素个数,而p是A与B的交集的元素个数。 而样本A与B的杰卡德系数表示为: 代码 1、当两个集合元素个数相同,则直接调包 from numpy import * import scipy.spatial.distance as dist # 导入scipy距离公式 matV = mat([[1,1,0,1,0,1,0,0,1],[0,1,1,0,0,0,1,...
杰卡德系数为:J(A,B) = 2/6 = 1/3 杰卡德距离为:1 - J(A,B) = 2/3 评价聚类质量: 在数据集上使用聚类方法之后,需要评估结果簇的质量。 两类方法:外在方法和内在方法 外在方法:有监督的方法,需要基准数据。用一定的度量评判聚类结果与基准数据的符合程度。 内在方法:无监督的方法,无需基准数据。类内...