性别比是研究人口的重要指标之一,是指一个国家或地区平均每100名女性所对应的男性人口数量。本篇希望通过运用excel函数,对比各省份和各地理区域的性别比,了解哪些地区的比例是平衡的,哪些是有明显差异的,以期将结论运用于一些商业决策。2020正是全国第七次人口普查的时间,未来,通过对比与本文的结论我们也可以看到各省在这十年间男女比例的变化。该案例数据来源为国家统计局第六次人口普查数据,数据包含中国各省家庭户以及集体户的人口数、各省男性和女性人口数。XLOOKUP几种应用场景以及与VLOOKUP的区别:基础查找XLOOKUP不需要包括 match_mode 参数,因为 XLOOKUP 默认为完全匹配。目标:通过已知的各省人口数,计算七大地理区域人口占比。我们需要将每个省份匹配上所属的地理区域,地理区域分别为东北、华北、华中、华南、华东、西北、西南。显然,VLOOKUP和XLOOKUP两个函数都可以满足这个简单的匹配需求,区别在于,XLOOKUP使用单独的查找并返回数组,而 VLOOKUP 使用一个表数组,后跟列索引号。图例中,XLOOKUP查找值为北京(D9),引入lookup_array(范围 A:A)和 return_array(范围 B:B)参数。它不包括 match_mode 参数,默认为完全匹配。随后,通过数透统计各地理区域人口占比,我们了解到华东区域人口数最多,占比约29.48%。华中区域其次。
在本例中,等效的 VLOOKUP 公式是:=VLOOKUP(D6,A:B,2,FALSE)目标:通过已知的各省男女人数,分别计算华东地区各省的家庭户和整个地区家庭户的性别比。在这里,查询条件需要同时满足省份和家庭户两个条件。
对于多条件查询,XLOOKUP仅需要将查询的多个条件区间以“&”符号合并,在此例中lookup_array为查询区间A列加上查询区间B列。对超过三个条件的情况此方法同样适用。图例中上海市家庭户的男性数量公式为:=XLOOKUP(I9&J9,A:A&B:B,D:D)通过计算,华东地区家庭户的性别比为101.18,我们认为,华东地区家庭户男女比例是比较平衡的。随后,分别统计其它地理区域家庭户的性别比,发现整体区间在101.18-105.62之间,表现均为比较平衡,男性略高于女性。对于家庭户,华南的性别比最高而华东最低。
使用类似的方法,统计各地理区域集体户的性别比,整体区间在130.78-161.69,男性比例远高于女性,其中,内蒙古、西藏、青海的集体户性别比最高,男性比女性大于2:1。
可见,全国家庭户各省的性别比整体比较均衡,而集体户男性普遍多于女性。在本例中,等效的 VLOOKUP 公式需要嵌套if{1,0}的函数,上海家庭户的男性人数对应的K4单元格公式可写为:=VLOOKUP(I4&J4,IF({1,0},A:A&B:B,D:D),2,FALSE)目标:通过已知的各省人口数,计算七大地理区域人口占比(同示例1)。同样需要将省份匹配上对应的地理区域,假设返回值(地理区域)出现在查询值(省份)前一列,即需要反向搜索时,单纯使用VLOOKUP函数就难以实现。XLOOKUP支持搜索区域lookup_array 列位于返回区域 return_array 列的右侧,即从右向左查询,而 VLOOKUP 只能从左到右。图例XLOOKUP查找值为四川(E11),lookup_array查询区间此时在范围 B:B,return_array返回区域在左侧A:A。它需要介入 search_mode 参数并选择-1执行反向搜索。
搜索模式,search_mode有四个参数可选,其中:-2,表示在查询区域为降序的前提下搜索。如果未排序, 将返回无效的结果。这里,同样可以用if嵌套的方法使用VLOOPUP,公式为:=VLOOKUP(E8,IF({1,0},B:B,A:A),2,FALSE)目标:根据各省家庭户和集体户数量,计算各地理区域集体户占总人口数的比例。 与 VLOOKUP 不同,XLOOKUP 可以返回具有多个项的数组,这允许单个公式从单元格 C:D 同时返回家庭户和集体户两组数据。当输入H10单元格公式=XLOOKUP(G10,A:A,C:D)时,返回区域为C:D列,I10单元格的公式将自动补齐,补齐的I10公式也为=XLOOKUP(G10,A:A,C:D)。
通过统计各区域集体户占比,我们发现华南地区集体户占比最高,占总人口数的8.37%,东北集体户占比最低,为1.85%。其中,广东省集体户占比为11.15%,为所有省份最高,而黑龙江的集体户占比最低。
日常生活中,我们也可以通过VLOOKUP逐个列输入返回索引号的方法,分别统计家庭户和集体户,但当所需匹配的返回数组数量多时,逐个键入就显得麻烦。目标:通过给各省性别比评级,找到男女比例差异较大的省份。我们给性别比评级分为三档:男性多、性别比例均衡、女性多。本示例通过查找各省性别比在I列上的区间范围所属,返回对应的J列数据,如河北省性别比为102.84,介于95-105之间,则应匹配I列95档的评级内容,返回河北“性别比例均衡”。此示例中,性别比查询区间为顺序,查询需返回下一个较小的项95,故match_mode输入-1。同时,XLOOKUP也可以进行倒序匹配,公式不变。通过性别比评级的划分,发现大部分省份男性比例较高(19个省份),其余较为均衡(13个省份)。其中,天津省的性别比最高114.52,江苏最低101.52。
匹配模式match_mode有四个参数可选,默认是0精确匹配,另外:1,精确匹配或下一个较大的项。即如果未找到查询值, 则返回下一个较大的项目。-1,精确匹配或下一个较小的项。即如果未找到查询值, 则返回比查询值小的下一个项目。VLOOPUP也可以用类似的方法给目标值进行划分和评级,但性别比查询区间必须为顺序,对应公式为=VLOOKUP(E6,I:J,2,1)。