登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 计算机类 > 物联网工程 > 正文

基于预测模型的红酒品质分析毕业论文

 2021-04-06 10:04  

摘 要

随着我国葡萄酒行业的快速发展以及葡萄酒越来越受人欢迎,葡萄酒企业也迅速发展壮大,但是中国的葡萄酒依然受到了进口葡萄酒的威胁,因此两者开始了激烈的竞争,由此也因为葡萄酒质量检测不明确而带来了市场紊乱。为此,本文的目的就是在分析了人工品尝存在的不足之时,同时采用一种更科学更有说服力的技术来提高葡萄酒质量等级的识别率,这对于中国的葡萄酒市场的能够稳定的发展以及能够酿造出更高的质量的葡萄酒起促进作用。

本文以UCI数据库中的“Wine Quality”数据集为研究对象,以葡萄酒品质与理化性质之间的复杂的非线性关系为研究基础,采用随机森林算法来对红酒品质进行预测。

原因如下:

1.随机森林算法稳定,并且葡萄酒识别率也高,对于那些低质量的葡萄酒也一样。

2.能够用随机森林算法确定变量重要性。

同时本文也对其他的一些识别算法进行了比较,例如,判别分析、支持向量机、分类回树等其他一些抽样建模算法。最重要的是,随机森林算法对于那些低质量的葡萄酒的识别率提高了,同时从不平衡的样本中提取出平衡样本进行建模并对测试样本预测,不断地循环,以寻求最终的预测结果,这种方法能大大提高低质量葡萄酒的识别率。

关键词:葡萄酒质量识别,判别分析,支持向量机,分类回归树,随机森林算法

ABTRACT

With the rapid development of China's wine industry and the growing popularity of wine, wine enterprises are also growing rapidly, but Chinese wine is still threatened by imported wine, so the two began to compete fiercely, which also brought about market disorder because of the uncertainty of wine quality detection. Therefore, the purpose of this paper is to analyze the shortcomings of artificial tasting, and to use a more scientific and convincing technology to improve the recognition rate of wine quality grade, which can promote the stable development of China's wine market and the production of higher quality wine.

In this paper, Wine Quality data set in UCI database is taken as the research object. Based on the complex non-linear relationship between wine quality and physical and chemical properties, stochastic forest algorithm is used to predict wine quality.

The reasons are as follows:

1. Random forest algorithm is stable, and the recognition rate of wine is high, as is the case for those low-quality wines.

2. The importance of variables can be determined by Stochastic Forest algorithm.

At the same time, this paper also compares some other recognition algorithms, such as discriminant analysis, support vector machine, classification tree and other sampling modeling algorithms. Most importantly, random forest algorithm improves the recognition rate of those low-quality wines. At the same time, it extracts balanced samples from unbalanced samples for modeling and predicting test samples, and continuously circulates to find the final prediction results. This method can greatly improve the recognition rate of low-quality wines.

Key words:Wine Quality Recognition, Discriminant Analysis, Support Vector Machine, Classified Regression Tree, Random Forest Algorithms.

目录

摘要 2

ABTRACT 3

第一章 绪论 5

1.1 研究背景 5

1.1.1 中国葡萄酒业的发展 5

1.1.2 中国葡萄酒业发展面临的问题 5

1.2数据挖掘在红酒评级中的研究状况 6

1.2.1 国内情况 6

1.2.2 国外情况 7

1.2.3 存在的不足 7

1.3论文结构 7

1.4 本文的主要工作 8

第二章 红酒品质分析的主要参数 9

2.1 葡萄酒的成分 9

2.1.1 葡萄酒的基本成分 9

2.1.2 葡萄酒的微量成分 9

2.2 数据来源 9

第三章 相关技术知识 10

3.1分类与回归 10

3.1.1 支持向量机 10

3.1.2 随机算法 13

第四章 红酒品质数据处理及结果分析 15

4.1 数据处理与基本分析 15

4.1.1 数据处理及预处理 15

4.1.2 数据基本分析 15

4.2 算法的实现过程及葡萄酒预测结果分析 16

4.2.1 算法的实现过程 16

4.2.2 葡萄酒预测结果分析 17

第五章 总结与展望 19

5.1 总结 19

5.2 展望 19

参考文献 20

致谢 21

第一章 绪论

1.1研究背景

1.1.1 中国葡萄酒业的发展

葡萄酒具有色、香、味、酸、甜、涩、度数和酒体8大基本特征。葡萄酒的生产链很长,葡萄酒品质受品种、气候地理环境、栽培方式、采摘方法、酿酒师、酿造工艺及储存工艺等多重因素影响。质量的高的葡萄酒更是一件艺术品。葡萄酒其实在中国有着悠久的发展历史,自汉唐起,至清代有很多葡萄酒的生产记录,尤其是改革开放后,我国葡萄酒行业不仅发展很快,而且也取得了很大的进步。

中国葡萄酒已从最初级的阶段上升为发展阶段。经过了20多年的发展,中国的葡萄酒有了突飞猛进的发展,在中国自改革开放后由计划经济逐步转化为市场经济的过程中,中国的葡萄酒市场已经完成了从内到外相关产业的产、供、销等一体化配置。而且政府管理也不在放任葡萄酒行业自行发展了,政府已经建立起了比较完备的机制;葡萄酒行业也不再根据每个厂家自己的感性认识来给葡萄酒定价了,而是更加理性的分析了客户的需求和国内外的价格水平,从而制定出更加科学的价格。消费者的消费也从一开始的感性消费变成了理性消费;竞争也不再是仅仅和国内的一些厂家单方面的竞争了,而是面临着外国一些知名的企业的强力竞争。特别是在2008年新的国家标准出台了之后,便引来的国际葡萄酒的进入,以及对于中国的葡萄酒行业的促进作用,使得国内企业开始了自身的战略发展,这一切的现象,标志着中国的葡萄酒行业已经和世界的葡萄酒行业融为一体,标志中国的葡萄酒进入了一个崭新的阶段。

我国目前的葡萄酒消费率与世界比起来还是要差上很多,而且在中国国内,人们引用的酒中葡萄酒占得比率非常低,但是中国的葡萄酒市场具有很大的潜力,因为随着中国人收入越来越多,购买葡萄酒的人也将会越来越多。

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图