安德森鸢尾花卉数据集
維基百科,自由的 encyclopedia
安德森鸢尾花卉数据集(英文:Anderson's Iris data set),也称鸢尾花卉数据集(英文:Iris flower data set)或费雪鸢尾花卉数据集(英文:Fisher's Iris data set),是一种多重变量分析的数据集。它最初是埃德加·安德森从加拿大加斯帕半岛的鸢尾属花朵中提取的形態學变异数据[1],后由羅納德·費雪作为判別分析的一个例子[2],运用到统计学中。
其数据集包含了150个样本,都属于鸢尾属下的3个亚属,分别是山鸢尾、变色鸢尾和维吉尼亚鸢尾(英语:Virginia Iris)。每个样本都包含4项特征,即花萼和花瓣的长度和宽度,它们可用于样本的定量分析。基于这些特征,费雪发展了能够确定其属种的线性判别分析。