推广 热搜: 采购方式  甲带  滤芯  气动隔膜泵  减速机  减速机型号  履带  带式称重给煤机  链式给煤机  无级变速机 

数据专家带你精通商业数据分析-Excel篇

   日期:2026-01-02 17:29:51     来源:网络整理    作者:本站编辑    评论:0    
数据专家带你精通商业数据分析-Excel篇
第一篇:XLOOKUP的使用
前言
Excel作为最广泛使用的办公工具之一可以解决很多日常工作的问题,优点在于使用方便快捷,同时,拥有数据集成的功能和建模分析能力。在数据分析中,Excel扮演着重要角色。该系列旨在通过对excel运用方法的学习,协助商业分析、挖掘数据价值。
本系列初次将分享使用频率最高的函数之一 VLOOKUP在新的office 365测试版本中可作为替代函数的XLOOKUP的使用。
VLOOKUP函数是很多Excel用户学习的第一个查找函数,常用于匹配查找值并返回对应数据。而XLOOKUP为Excel用户在电子表格中显示信息提供了一种更简单的方法。XLOOKUP具有垂直和水平查看的能力,它还替代了HLOOKUP,只需要3个参数就可以执行最常见的精确查找,而VLOOKUP需要4个参数。
案例背景介绍
性别比是研究人口的重要指标之一,是指一个国家或地区平均每100名女性所对应的男性人口数量。本篇希望通过运用excel函数,对比各省份和各地理区域的性别比,了解哪些地区的比例是平衡的,哪些是有明显差异的,以期将结论运用于一些商业决策。2020正是全国第七次人口普查的时间,未来,通过对比与本文的结论我们也可以看到各省在这十年间男女比例的变化。
该案例数据来源为国家统计局第六次人口普查数据,数据包含中国各省家庭户以及集体户的人口数、各省男性和女性人口数。
首先,让我们看看XLOOKUP的公式:
XLOOKUP几种应用场景以及与VLOOKUP的区别:
1
基础查找
基础查找XLOOKUP不需要包括 match_mode 参数,因为 XLOOKUP 默认为完全匹配。
[示例1:]
目标:通过已知的各省人口数,计算七大地理区域人口占比。我们需要将每个省份匹配上所属的地理区域,地理区域分别为东北、华北、华中、华南、华东、西北、西南。
显然,VLOOKUP和XLOOKUP两个函数都可以满足这个简单的匹配需求,区别在于,XLOOKUP使用单独的查找并返回数组,而 VLOOKUP 使用一个表数组,后跟列索引号。
图例中,XLOOKUP查找值为北京(D9),引入lookup_array(范围 A:A)和 return_array(范围 B:B)参数。它不包括 match_mode 参数,默认为完全匹配。随后,通过数透统计各地理区域人口占比,我们了解到华东区域人口数最多,占比约29.48%。华中区域其次。

已关注
关注
重播 分享


在本例中,等效的 VLOOKUP 公式是:=VLOOKUP(D6,A:B,2,FALSE)
2
多条件查询
[示例2:]

目标:通过已知的各省男女人数,分别计算华东地区各省的家庭户和整个地区家庭户的性别比。在这里,查询条件需要同时满足省份和家庭户两个条件。

对于多条件查询,XLOOKUP仅需要将查询的多个条件区间以“&”符号合并,在此例中lookup_array为查询区间A列加上查询区间B列。对超过三个条件的情况此方法同样适用。图例中上海市家庭户的男性数量公式为:=XLOOKUP(I9&J9,A:A&B:B,D:D)
通过计算,华东地区家庭户的性别比为101.18,我们认为,华东地区家庭户男女比例是比较平衡的。随后,分别统计其它地理区域家庭户的性别比,发现整体区间在101.18-105.62之间,表现均为比较平衡,男性略高于女性。对于家庭户,华南的性别比最高而华东最低。

已关注
关注
重播 分享

使用类似的方法,统计各地理区域集体户的性别比,整体区间在130.78-161.69,男性比例远高于女性,其中,内蒙古、西藏、青海的集体户性别比最高,男性比女性大于2:1。

可见,全国家庭户各省的性别比整体比较均衡,而集体户男性普遍多于女性。
各省集体户性别比排行:
在本例中,等效的 VLOOKUP 公式需要嵌套if{1,0}的函数,上海家庭户的男性人数对应的K4单元格公式可写为:=VLOOKUP(I4&J4,IF({1,0},A:A&B:B,D:D),2,FALSE)
3
反向查找
[示例3:]
目标:通过已知的各省人口数,计算七大地理区域人口占比(同示例1)。同样需要将省份匹配上对应的地理区域,假设返回值(地理区域)出现在查询值(省份)前一列,即需要反向搜索时,单纯使用VLOOKUP函数就难以实现。XLOOKUP支持搜索区域lookup_array 列位于返回区域 return_array 列的右侧,即从右向左查询,而 VLOOKUP 只能从左到右。
图例XLOOKUP查找值为四川(E11),lookup_array查询区间此时在范围 B:B,return_array返回区域在左侧A:A。它需要介入 search_mode 参数并选择-1执行反向搜索。

已关注
关注
重播 分享

搜索模式,search_mode有四个参数可选,其中:
1,表示从第一个项目开始执行搜索。
-1,表示从最后一个项目开始执行反向搜索。
2,表示在查找区域为升序的前提下搜索。
-2,表示在查询区域为降序的前提下搜索。如果未排序, 将返回无效的结果。
这里,同样可以用if嵌套的方法使用VLOOPUP,公式为:=VLOOKUP(E8,IF({1,0},B:B,A:A),2,FALSE)
4
一对多查找
[示例4:]

目标:根据各省家庭户和集体户数量,计算各地理区域集体户占总人口数的比例。 与 VLOOKUP 不同,XLOOKUP 可以返回具有多个项的数组,这允许单个公式从单元格 C:D 同时返回家庭户和集体户两组数据。当输入H10单元格公式=XLOOKUP(G10,A:A,C:D)时,返回区域为C:D列,I10单元格的公式将自动补齐,补齐的I10公式也为=XLOOKUP(G10,A:A,C:D)。

通过统计各区域集体户占比,我们发现华南地区集体户占比最高,占总人口数的8.37%,东北集体户占比最低,为1.85%。其中,广东省集体户占比为11.15%,为所有省份最高,而黑龙江的集体户占比最低。

已关注
关注
重播 分享

各省集体户占比排行:
日常生活中,我们也可以通过VLOOKUP逐个列输入返回索引号的方法,分别统计家庭户和集体户,但当所需匹配的返回数组数量多时,逐个键入就显得麻烦。
5
模糊匹配
[示例5:]
目标:通过给各省性别比评级,找到男女比例差异较大的省份。我们给性别比评级分为三档:男性多、性别比例均衡、女性多。
本示例通过查找各省性别比在I列上的区间范围所属,返回对应的J列数据,如河北省性别比为102.84,介于95-105之间,则应匹配I列95档的评级内容,返回河北“性别比例均衡”。此示例中,性别比查询区间为顺序,查询需返回下一个较小的项95,故match_mode输入-1。同时,XLOOKUP也可以进行倒序匹配,公式不变。
通过性别比评级的划分,发现大部分省份男性比例较高(19个省份),其余较为均衡(13个省份)。其中,天津省的性别比最高114.52,江苏最低101.52。

已关注
关注
重播 分享

匹配模式match_mode有四个参数可选,默认是0精确匹配,另外:
1,精确匹配或下一个较大的项。即如果未找到查询值, 则返回下一个较大的项目。
-1,精确匹配或下一个较小的项。即如果未找到查询值, 则返回比查询值小的下一个项目。
2,通配符匹配。
VLOOPUP也可以用类似的方法给目标值进行划分和评级,但性别比查询区间必须为顺序,对应公式为=VLOOKUP(E6,I:J,2,1)。
引申部分
1
if_not_found参数的使用
此示例通过引用示例1展示if_not_found参数的应用。
XLOOKUP函数查询时,当未于搜索区间搜索到目标值,返回预先设定的if_not_found的值。而VLOOKUP会输出#N/A。
2
XLOOKUP的其它优点
  • 列插入/删除

VLOOKUP的第三个参数是列号,因此如果插入或删除列,则必须在VLOOKUP中递增或递减列号。使用XLOOKUP,用户可以轻松地插入或删除列。
  • 从尾部开始搜索

使用VLOOKUP,用户需要反转数据的顺序以查找最后一次出现的数据,但是使用XLOOKUP,用户可以通过设置搜索模式,很容易地从数据尾部搜索匹配的数据。
  • 系统地引用单元格

对于VLOOKUP,需要框选查询值到返回值的整个表区间。它引用了更多的单元格,这些单元格会导致不必要的计算,从而降低电子表格的性能。XLOOKUP系统地引用其中的单元格不会导致计算的复杂化。
3
案例Insight
  1. 统计各地理区域人口占比,我们了解到华东区域人口数最多,占比约29.48%。华中区域其次。

  2. 各地理区域家庭户的性别比整体区间在101.18-105.62之间,各地理区域家庭户的男女比例比较平衡,男性略高于女性。

  3. 各地理区域集体户的性别比整体区间在130.78-161.69之间,男性比例远高于女性。内蒙古、西藏、青海三个省份的集体户性别比最高,男性比女性大于2:1。

  4. 华南地区集体户占比最高,占总人口数的8.37%,东北集体户占比最低,为1.85%。其中,广东省集体户占比为11.15%,为所有省份最高,而黑龙江的集体户占比最低。

  5. 总体上看,大部分省份男性比例较高(19个省份),其余较为均衡(13个省份)。其中,天津省的性别比最高114.52,江苏最低101.52。

联系我们

陈品秀

Sarah Chen

数据分析师

电邮:pinchen@deloitte.com.cn

马子理

Daniel Ma

高级数据科学家

电邮:daniema@deloitte.com.cn

数据来源

普查数据链接:国家统计局

http://www.stats.gov.cn/tjsj/pcsj/

 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  皖ICP备20008326号-18
Powered By DESTOON