联系我们

全国统一资讯热线

17606398341

联系我们

在线QQ客服:3447469126

地址:青岛市市北区台东五路87号

邮箱:qdklod@126.com

网址:www.karatdata.com




新闻资讯
您现在所在的位置 : 首页 > 新闻资讯 > 行业新闻
大数据分析需要考虑的问题具体如下

发布者: 发布于:2018/09/07 浏览量:449

一、了解 DATA

进行 DATA 探究前,咱们需先结合事务去了解 DATA,这儿推荐运用 5W1H 法,也即在拿到数据后问本身以下几个问题:

Who: 是谁收集了此数据? 在企业内可能更重视是来自哪个事务体系。

How: 是怎么收集的此数据? 尽可能去了解具体的收集规矩,收集规矩是影响后续剖析的重要因素之一。如:数据来自埋点,来自后端仍是前端差异很大,来自后端则多是实时的,来自前端则需更近一步了解数据在什么网络状况会上传、无网络状况下又是怎么处理的。

What: 是关于什么事务什么事? 数据所描绘的事务主题。

Why: 为什么收集此数据? 咱们想从数据中了解什么,其实也就是咱们此次剖析的方针。

When: 是何时段内的事务数据?

Where: 是何地域范围内的事务数据?

经过回答以上几个问题,咱们能快速了解:数据来历是什么?它的可信度有多少?它在描绘何时发生的怎样的事务(问题)?咱们为什么要收集此数据?等等。然后快速了解数据与事务展开近一步的探究与剖析。

二、探究 DATA

之前的文章中,咱们从前共享过怎么快速地探究 DATA ( 「怎么成为一名数据剖析师:数据的开始认知」 ),其中有谈到怎么经过比如平均数/中位数/众数等描绘计算、经过相关系数计算快速探究 DATA 的办法。本文首要解说可视化,所以将从可视化的视点去介绍怎么经过可视化办法进行数据探究。

在探究、研讨阶段,更重要的是要从不同的视点去调查数据,并逐渐深入到对事务更重要的工作上。在这个阶段,咱们不用去过多地寻求图表美化,而应该尽可能快速地尝试更多个视点。下面咱们依据数据/主题类型的差异分隔阐述:

1. 分类数据的探究

在事务剖析中,咱们常常将人群、地点和其他事物进行分类,分类能为咱们带来结构化,能让咱们快速把握信息。

在分类数据可视化中,咱们最多使用的是条形图;但当试图调查分类中的份额时,咱们可能也会挑选饼图、瀑布图;当不只关怀一级分类还关怀子分类时分,咱们可能会挑选树形图。经过对分类数据的可视化,咱们能快速地获取最大、最小值,一起也能方便地了解到数据集的范围,由于它在一定程度上还反映了数据散布特征。

文章关键词:青岛大数据

 

CopyRight© 2015-2018 , All Rights Reserved.   版权所有:青岛克拉欧德数据科技有限公司   备案号:鲁ICP备16019955号
点击这里给我发消息