工作中经常听到吐槽,辛辛苦苦做了一周的数据分析报告,提交给领导后被痛批了一顿,觉得很委屈。其实,很多同学在做数据分析时,手里拿着数据不知道怎么分析,也不知道数据应该用哪一种商业数据分析方法。

我们眼前所有精彩的商业案例分析,追其溯源,都是脱离不了底层数据和业务本身。今天就来给大家分享一下如何做去做商业数据分析,让你轻松运用数据分析解决实际工作问题,提升核心竞争力。
在商业数据分析过程中,我们把分析流程拆分为4个步骤来进行(数据收集、数据清洗、分析方法选择、溯源)。下面一一展开来讲。
数据收集
当我们在做商业数据分析时,第一步要解决的问题就是数据来源问题。通常把数据分为二大类。
第一类是直接能获取的数据,通常都是内部数据,可以从公司的数据库中获取的数据。
第二类就是外部数据,需要经过加工整理后得到的数据。典型的数据来源有:爬虫、官方数据集、合作伙伴共享数据等。有一点需要特别关注,验证数据的真实性,数据再怎么漂亮,数据一定是真实的。
数据清洗
清洗数据目的无非是从大量的、杂乱无章、难以理解的数据中抽取并推导出对解决问题有价值、有意义的数据。清洗后、保存下来真正有价值、有条理的数据,为后面做数据分析减少分析障碍。清洗数据一方面考验的是数据处理能力,另外一方面考验的是对业务知识的深刻理解。
清洗数据是至关重要的一环,也一定程度会影响数据分析报告质量。数据清洗过程中可以通过数据对比,数据更细粒度拆分来发现异常问题,常用处理方法:删除,异常值替换,插值等。
分析方法选择
1.比如对一些电商产品来说,最终目的是让用户下单并支付,关注数据分析的整个流程。这时,我们就可以通过漏斗模型一步一步地进行监测。如下图所示,我们可以监控用户在流程中各个层级上的行为路径,寻找每个层级的可优化点。对没有按照流程操作的用户绘制他们的转化路径,找到可提升用户体验,缩短路径的空间,最终提升整体转化率。

2.比如分析顾客放入购物篮中的不同商品之间的联系,分析顾客的购买习惯。这时可以使用关联分析法,它是一种简单、实用的分析技术,是指从大量数据集中发现项集之间的关联性或相关性。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联等。

3.在实际工作中,当拿到一些可视化数据图表或者是Excel表格时,我们可以用指标分析法,运用统计学中的一些基础指标来做数据分析,比如平均数、众数、中位数、最大值、最小值等。以众数和中位数为例:
众数是数据中的一种代表数,它反应的是数据的一种集中程度。比如说最佳,最受欢迎,最满意都与众数有关.
中位数反映的是一组数据的集中趋势,像我们比较常见的正态分布,比如说我们想去统计某市的人均收入,其实,大部分的人均收入都是在一定范围之内的,只有少部分是处于最低的和最高的,其实这是中位数带来的意义。
溯源
上一环节讲解了商业数据分析方法,此时商业数据分析环节并没有结束,数据追本溯源才是开始。通过上述商业数据分析的几个环节基本可以分析出大多数问题的原因,此时要站在更高视角去审视需要解决的问题,跳出数据本身问题。比如:结合用户使用场景去思考。
比如:国内的社交产品,在上下班的时间段会特别活跃,而该产品经理对比美国地区却发现在美国地区用户的上班活跃数据恰恰相反,特别低,到底是什么原因呢。看数据怎么也看不出来,怎么办呢?若果该产品经理结合用户上班时的使用场景去思考就能一眼看出问题,因为国内的上班一族通常上是通过公交、地铁等公共交通工具去上班的,所以他们有大把的时间在玩社交,刷朋友圈。而美国地区的上班一族,大多数都是自驾车去上班(车轮上的国家),他们上班时间都在专心地开车,根本没有时间去玩手机,玩社交产品。

获取更多精彩内容,请长按二维码关注!
解惑答疑,进群交流




