大数据分析学习之用Excel构建数据分析预测模型!
小职 2020-11-20 来源 : 阅读 3435 评论 0

摘要:本篇介绍了不用代码,在大数据分析的学习中如何在Excel中构建线性回归模型以及如何解释结果,希望对于大数据分析的学习有所帮助。

本篇介绍了不用代码,在大数据分析的学习中如何在Excel中构建线性回归模型以及如何解释结果,希望对于大数据分析的学习有所帮助。

大数据分析学习之用Excel构建数据分析预测模型!

你可以在Excel中执行建模,只需几个步骤。


下面是一个教程,介绍如何在Excel中构建线性回归模型以及如何解释结果。


Excel真的能构建预测模型?


这通常是我提起这个话题时的第一反应。当我演示如何利用Excel的灵活性为我们的数据科学和分析项目构建预测模型时,接下来是一个令人怀疑的眼神。


让我问你一个问题:如果你周围的商店开始收集客户数据,他们是否可以采用基于数据的策略来销售他们的商品?他们能预测自己的销售额或估计可能销售的产品数量吗?


现在你一定想知道,他们究竟将如何建立一个复杂的统计模型来预测这些事情?学习分析或雇佣分析师可能超出了他们的能力范围。好消息是,他们不需要。


Microsoft Excel为我们提供了一种构建预测模型的能力,而不必编写复杂的代码。


我们可以很容易地在MS Excel中建立一个简单的线性回归模型,它可以帮助我们在几个简单的步骤中执行分析。我们不需要精通Excel或统计学就可以进行预测建模!


在这篇文章中,我将解释如何在Excel中建立一个线性回归模型,以及如何对结果进行分析,以便你成为一名分析师!


什么是线性回归?

线性回归是我们大多数人学习的第一种机器学习技术。它也是业界最常用的监督学习技术。


但什么是线性回归?


它是一种线性方法,用于统计建模因变量(要预测的变量)和自变量(用于预测的因素)之间的关系。


线性回归给出了这样一个方程:

大数据分析学习之用Excel构建数据分析预测模型!

Y:因变量

X:自变量

C:系数,基本上是根据重要性分配给特征的权重


最常用的回归方法是OLS(普通最小二乘法)。它的目标是减少平方和以产生这样的最佳拟合线:

大数据分析学习之用Excel构建数据分析预测模型!

Excel加载项获取分析工具包

要在Excel中执行回归分析,首先需要启用Excel的分析工具包加载项。Excel中的分析工具包是一个插件程序,为统计和工程分析提供数据分析工具。


要将其添加到工作簿中,请执行以下步骤:

步骤1:Excel选项

转到文件->选项:

大数据分析学习之用Excel构建数据分析预测模型!

步骤2:定位分析工具包

转到左侧面板上的加载项->管理Excel加载项->转到:

大数据分析学习之用Excel构建数据分析预测模型!

第3步:添加分析工具包

选择“分析工具包”并按“确定”:

大数据分析学习之用Excel构建数据分析预测模型!

你已在Excel中成功添加分析工具包!你可以通过转到功能区中的数据栏进行检查。


让我们开始用Excel建立我们的预测模型!


在Excel中实现线性回归

到目前为止,很多东西都是理论上的。现在,让我们深入了解Excel并进行线性回归分析!


下面是我们将要处理的问题声明:


Winden镇有一家卖鞋的公司。该公司希望通过考虑以下因素来预测每个客户的销售情况:客户收入、离家距离、客户每周的跑步频率。

大数据分析学习之用Excel构建数据分析预测模型!

步骤1:选择回归

进入数据->数据分析

转到数据工具包中的“数据分析”,选择“回归”,然后按“确定”:

大数据分析学习之用Excel构建数据分析预测模型!

步骤2:选择

在这一步中,我们将选择一些分析所需的选项,例如:

大数据分析学习之用Excel构建数据分析预测模型!

1.输入y范围–独立因子的范围

2.输入x范围-相关因素的范围

3.输出范围–要显示结果的单元格范围


其他选项是自由选择的,你可以根据你的特定目的选择它们。


按OK,我们最终在Excel中用两个步骤进行了回归分析!很简单!现在我们将在excel中看到回归分析的结果。


用Excel分析预测模型的结果

实施线性回归模型是最简单的部分。现在是我们分析的棘手方面——在Excel中解释预测模型的结果。


综上所述,我们有三种产出类型,我们将逐一介绍:

回归统计表

方差分析表

回归系数表

残差表


1.回归统计表

回归统计表告诉我们最佳拟合线如何定义自变量和因变量之间的线性关系。两个最重要的度量是R方和调整R方。


R方统计量是拟合优度的指标,它告诉我们最佳拟合线解释了多少方差。R方的范围从0到1。


在我们的例子中,R平方值为0.953,这意味着我们的行能够解释95%的方差——这是一个好的迹象。

大数据分析学习之用Excel构建数据分析预测模型!

但是有一个问题-当我们不断增加更多的变量,我们的R平方值将继续增加,即使变量可能没有任何影响。调整R平方解决了这个问题,是一个更可靠的度量。


2.方差分析表

方差分析表将平方和分解为其组成部分,以提供模型内变化的详细信息。


它包括一个非常重要的指标,显著性F(或P值),它告诉我们你的模型是否具有统计显著性。


简而言之,这意味着我们的结果可能不是由于随机性,而是因为一个潜在的原因。


p值最常用的阈值是0.05。如果我们得到的值低于这个,就可以了。否则,我们需要选择另一组自变量。

大数据分析学习之用Excel构建数据分析预测模型!

在我们的例子中,我们的值远低于0.05的阈值。太棒了,我们现在可以前进了!


3.回归系数表

系数表以系数的形式分解回归线的组成部分。从中我们可以了解很多。


对于Winden鞋业公司来说,似乎每增加一个单位的收入,销售额就增加0.08,而增加一个单位的店面距离就增加508个销售额!

大数据分析学习之用Excel构建数据分析预测模型!

running frequency的增加似乎使销售量减少了24,但我们真的能相信这个特征吗?


如果你看上面的图片,你会发现它的p值大于0.5,这意味着它在统计学上不显著。


4.残差表

残差表反映了预测值与实际值之间的差异。


它由我们的模型预测的值组成:

大数据分析学习之用Excel构建数据分析预测模型!

如何改进我们的模型?

如前所述,变量running frequency的p值大于0.05,因此让我们从分析中移除该变量来检查结果。


我们将遵循上述所有步骤,但不包括running frequency列:

大数据分析学习之用Excel构建数据分析预测模型!

我们注意到调整后的R平方的值从0.920略微提高到0.929!


用Excel做预测!

我们已经准备好回归分析了,现在该怎么办?让我们看看。


你的一位老顾客,名叫亚历山德,走进来,我们想预测他的销售额。我们可以简单地从线性回归模型的数据中插入数字。


Aleksander有4万的收入,住在离商店2公里的地方。估计销售额是多少?


方程变成:

大数据分析学习之用Excel构建数据分析预测模型!

在这里,我们的模型估计,亚历山德先生将支付4218购买他的新鞋!这就是简单地在Microsoft Excel中进行线性回归的能力。


结尾

在本文中,我们学习了如何在Excel中建立线性回归模型以及如何解释结果。我希望这本教程能帮助你成为一个更好的分析师或数据科学家。



关注“职坐标在线”(Zhizuobiao_Online)公众号,免费获取最新技术干货教程资源哦

大数据分析学习之用Excel构建数据分析预测模型!

大数据时代 大数据分析报告 大数据分析模型
本文由 @小职 发布于职坐标。未经许可,禁止转载。
喜欢 | 0 不喜欢 | 0
看完这篇文章有何感觉?已经有0人表态,0%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论
加入IT交流圈
JAVA工程师交流群 +加入
大数据架构师交流群 +加入
人工智能Python交流群 +加入
WEB/H5前端交流群 +加入
职坐标公众号
大数据云计算 直通车
  • 索取资料 索取资料 索取资料
  • 答疑解惑 答疑解惑 答疑解惑
  • 技术交流 技术交流 技术交流
  • 职业测评 职业测评 职业测评
  • 面试技巧 面试技巧 面试技巧
  • 高薪秘笈 高薪秘笈 高薪秘笈
海同专业团队 更多>>
黄骈 联系TA
认证System Analyst,System Architect
程光淼 联系TA
精通C、C++等语言、智能芯片开发
热门就业技能 更多>>
【零基础】人工智能+Python全栈开发技术
【零基础】人工智能+Python全栈开发技术
人工智能+Python技术风口浪潮
【零基础】JavaEE高级开发技术
【零基础】JavaEE高级开发技术
起薪高,轻松进名企
【零基础】大数据与分布式架构技术
【零基础】大数据与分布式架构技术
培训大数据分布式架构
大数据分析30天热搜词 更多>>
大数据分析方法是什么样的方法 大数据分析方法ppt 大数据分析工具 proe python数据分析案例 大数据分析常用方法 数据仓库与数据挖掘 大数据统计分析 用什么数据库 大数据分析工具厂家 大数据分析是什么意思 大数据分析处理技术 大数据分析培训 大数据分析工具 druid 大数据分析网站 大数据分析方法 知乎 大数据分析平台 生产数据统计分析 大数据分析师工资待遇 数据分析师适合女生嘛 大数据分析工具所属技术领域 大数据分析方法从π中获取生日

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标- IT技术咨询与就业发展一体化服务 沪ICP备13042190号-4
上海 海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

关于我们 │ 法律声明 │ 联系我们

©2015 www.zhizuobiao.com All Rights Reserved

208小时内训课程
在线客服

深圳坪山网站建设公司盘龙区网站优化哪家好福建网站优化代理哪里有卖掇刀区网站seo优化排名湛江网站优化哪里不错百度优化网站建邺区公司网站优化网站做好之后需要做优化吗奉节县网站seo优化排名seo优化网站方案怎么做好网站的内部优化福建靠谱的网站优化日文优化网站网站打开速度优化新兴搜索引擎网站优化服务杭州优化网站怎么样万山特区网站优化服务长春网站优化与推广用什么方法大朗网站关键词优化哪家好深圳产品在网站优化哪家好孝感市网站关键词优化怎么做郑州官网网站优化哪家便宜网站搜索优化es冫云速捷秦淮区网站关键词优化宁海优化网站哪家好厦门seo网站内部优化网站做优化济南五金行业网站优化推广可靠吗哪些关键词不能做网站优化网站优化有哪些平台焦作优化网站怎么样香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

深圳坪山网站建设公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化