Excel中的三个检验区别在于原假设上,这里我们采用双样本等方差假设,来分析红、白葡萄酒质量分布趋势是否有差异。 选择t-检验: 双样本等方差假设,变量1选择白葡萄酒对应的质量区间数据;变量2选择红葡萄酒对应的质量区间数据,置信系数默认0.05,点击确认,得到结果 4、哪个酸度水平的平均评分最高?请写出分析过程与结论。
数据集中包含11个红酒的理化性质以及红酒的品质(评分从0到10)其中品质分布在3到8之间。 分析关心的内容为理化性质与红酒品质之间的关系。理化性质主要分为酸度和甜度。 -酸度 酸度有7个相关指标,分别为fixed acidity, volatile acidity, citric acid, free sulfur dioxide, total sulfur dioxide, sulphates, pH。前...
品质的评价范围是0-10,这个数据集中范围是3到8,有82%的红酒品质是5或6。 酸度: 这个数据集有7个酸度相关的特征:fixed acidity, volatile acidity, citric acid, free sulfur dioxide, total sulfur dioxide, sulphates, pH。前6个特征都与红酒的pH的相关。pH是在对数的尺度,下面对前6个特征取对数然后作histo...
对于品质高于7的优质红酒和品质低于4的劣质红酒,直观上线性可分,对于品质为5和6的红酒很难进行线性区分 随机森林、线性回归等算法部分 对数据类型编码,将数据集划分为训练集和测试集等等 对比原始数据与做了标准化处理的数据,其结果相差不大,所以该数据集不需要做标准化处理 下面我们展示各种算法的预测精度结果 可以...
三.TXT红酒数据集预处理 1.数据集描述 该实验数据集是UCI Machine Learning Repository开源网站提供的MostPopular Data Sets(hits since 2007)红酒数据集,它是对意大利同一地区生产的三种不同品种的酒,做大量分析所得出的数据。这些数据包括了三种类别的酒,酒中共13种不同成分的特征,共178行数据,如下图所示。 该数...
UCI红酒数据集分析报告(英文)R语言 俗事**偶遇上传数据集r语言 UCI红酒数据集分析报告(英文)R语言 (0)踩踩(0) 所需:1积分