logo 返回列表

数据分析、数据挖掘、数据统计的区别

2017-08-23 2170

数据分析

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。围绕业务,提出问题,确定需求,然后收集和整理数据(数据统计的范畴),分析和挖掘数据,最后可视化展示

数据挖掘

数据挖掘是按照既定的业务目标,对大量的企业数据进行探索、揭示隐藏 其中的规律性并进一步模型化的先进、有效的方法。一般数据挖掘的流程是:问题理解和提出→数据准备→数据整理→建立模型→评价和解释。

数据统计

数据统计就是通过概率、统计、离散的数学方法揭示事物在特定时间方面的数量特征,以便对事物进行定量乃至定性分析。目前常用的数据统计软件有SAS、SPSS、EXCEL等等。

OLAP

OLAP和数据挖掘都是为决策提供支持,只是侧重点不同,前者提供描述型的模型,告诉你什么样的产品在什么地区的销售额和去年的对比。后者提供探索型的模型,告诉你啤酒和尿布的规律,最后的决策都是人来做。

几个定义都属于广义的数据分析,OLAP最清晰,就是多维数据分析,通过多维建模方式组织数据,用SQL或者自定义查询语言进行建模、生成CUBE,进行数据分析,因为支持上卷下钻,可以获取不同粒度的数据,我一般用他来做异常状况分析。数据分析我一般分成两类,简单数据分析和复杂数据分析,所谓简单是指可以利用业务知识或者数学知识,通过可定义的规则实现的分析,通常统计分析属于这个范畴,探索式分析除外;复杂分析是无法通过规则定义的,需要靠数据说话的分析,比如使用挖掘、ML等方法实现的。

联机分析处理(on-line analytical process)开发工具有EssbaseMicrosoft Analysis等。 OLAP的基本思想是使企业其他的决策者应能灵活地操纵企业其他的数据,以多维的形式从多方面和多角度来观察企业其他的状态、了解企业其他的变化。

课题用过OLAP开发工具将维表和事实表做相应的连接,然后做聚合操作保存成Cube从而达到多角度分析数据的目的。

前端展示开发工具:前端展示开发工具是辅助用户来多角度,自定义展现报表形式的开发工具,是对OLAP开发工具的一个补充,通常OLAP开发工具只能做简单的数据展示,上钻、下钻等。前端展示开发工具可以根据用户需求展现各类图表,通过展示开发工具我们可以做一些个性化设 置,权限控制等等,这在BI工具中很常见,像传统的BPOBIEE如今的FineBI等。

相关推荐
微信扫一扫
微信扫一扫
关注公众号,了解更多资讯
联系客服

微信扫码联系客服