
作者简介:
孟晖,民进湖北省武汉市委会主委,国家督学
唐晓,湖北省武汉市教育科学研究院,助理研究员
· 引文信息 ·
孟 晖 唐 晓.构建关注动态进步的高中学业质量增值评价体系——以超大城市为样本的从个体到区域的精准评价模型的创建与应用[J].中国基础教育,2026(06):68-73.

教育评价改革是落实新时代国家教育发展战略的关键环节,党的二十大报告明确要求“深化教育领域综合改革”“完善学校管理和教育评价体系”。然而,当前高中教育阶段的评价实践与改革要求之间仍存在明显差距,核心问题在于评价制度本身尚未发生根本性改变。长期以来,对高中教育的评价普遍简化为一本线人数、高分段人数及“清北”录取率等一次性结果指标。这种评价方式存在明显的缺陷,它更多反映的是学校的生源“筛选”能力,而非教育“培养”效能,进而导致“唯生源论”盛行,部分拥有优质生源的学校其教育贡献被高估,而许多在生源基础上不占优势但教学成效显著的学校则被忽视和低估。这严重挫伤了广大高中学校办学的积极性,无法引导学校与教师关注教育过程的本质——每一个学生、班级、学校、区域的进步。这与《深化新时代教育评价改革总体方案》中“改进结果评价,强化过程评价,探索增值评价”的要求背道而驰。
为破解这一现实困境,我们基于某超大城市的全域教育数据,尝试构建兼具科学性与操作性的学业质量评价模型。该模型的核心在于将评价的重心从静态的“绝对结果”转向动态的“相对进步”,通过剥离生源起点的影响,公平地衡量每一所学校、每一位教师乃至每一名学生在教育过程中所创造的“增值”。我们力图解决的核心问题是:构建一个能够贯通区域、学校、班级、学生等多个层面,且易于理解、便于推广的量化工具,以精准诊断学业质量,引导区域教育生态回归“比进步、看增值”的健康轨道。
/
一
/
分析框架与模型设计
1. 理论基础与核心假设
本模型的理论基础是教育生产函数理论,其核心假设是学生的最终学业成就(Output)是其初始学业水平(Input)与学校教育过程质量(Process)共同作用的结果。借鉴增值评价控制初始水平差异的基本思路,模型通过计算“输出/输入”比来近似表征教育过程的质量,并通过与一个标准基准线的比较,消除初始水平差异的影响,最终得到直观的“提升指数”,即直观的“增值”程度。
2. 核心概念与操作化定义
为便于量化分析,本研究对模型中的核心概念给出以下操作化定义。
评估单元:待评价的对象,可以是区域、学校、班级或学生个体。
学业转化系数(T):评估单元在特定学科或总分(分物理类P/历史类H)上的高考平均分(E)与中考录取平均分(e)的比值。反映评估单元从入口到出口的学业转化效率。计算公式为:

学业基准转化系数(T0):作为评价“尺规”的参照样本(市、区、校、班)的转化系数,计算公式与T相同:

其中,下标“0”表示所选定的参照样本(基准);E0和e0分别为参照样本的高考平均分和中考平均分,中考平均分不区分物理类或历史类组合。
学业提升指数(Δ):本模型的核心输出指标,反映评估单元相较于参照样本的学业增值优势程度。定义为评估单元的学业转化系数(T)与学业基准转化系数(T0)的差值乘以100(乘以100是为了放大差异,便于直观比较)。

3. 多层级评价框架:从宏观诊断到微观反馈
该模型的创新性与灵活性在于其动态的基准选择机制,从而实现不同维度的精准定位。
宏观层:区域教育质量监测。基准(T0)设为全市学业转化率(全市物理类或历史类高考均分与中考录取均分的比值),用于比较各区教育质量的相对效能。所有区域以全市平均水平为统一参照,有助于客观评估区域教育发展的均衡性与相对效益。
中观层:学校教育教学评估。基准(T0)可设为全市或所在区的学业转化率。当选择以全市为基准时,可评估学校在全市范围内的竞争力与定位;当选择学校所在区为基准时,可评估学校在所属区域内部的相对表现,有助于区域内部主体针对性施策。
微观层Ⅰ:班级教学质量诊断。基准(T0)可扩展至全市、全区或本校学业转化率。与全市、全区相比,可明确班级在更大范围内的教学水平。与本校相比,可揭示该班级在学校内部的教学表现,促进校内教研组间的经验交流与良性竞争。
微观层Ⅱ:学生个体成长追踪。基准(T0)可选用全市、全区、本校或本班的学业转化率。学生可清晰地获知自己的成长幅度在不同参照系中的位置,帮助其形成客观自我认知,激发内生发展动力。
/
二
/
实证检验与结果分析
本研究以中部某超大城市为样本,基于2022—2025年中考和高考追踪数据,从区域、学校两个层面验证模型的有效性。
1. 区域层面的教育效能诊断
我们以全市转化系数为基准,计算各区提升指数(Δ),结果如表1所示。全市2025年物理类高考平均分为476.43,该届学生2022年中考录取平均分为432.95,据此代入公式②可计算得出全市物理类学业基准转化率1.1004。同理,全市历史类学业基准转化率为1.1235。各区学业转化系数为该区高考与中考录取均分之比(代入公式①),学业提升指数为该区学业转化系数与全市基准转化率之差再乘以100(代入公式③)。该指数反映了各区域在高中教育阶段相对于全市基准的“增值”表现。由表1数据可得出以下结论。

其一,区域间教育增值分化显著。无论是物理类还是历史类,各区域提升指数均呈现较大差异。在物理类方面,城区1以6.8领先,显示出强劲的教育增值能力;而城区15和城区14仅为-11.02和-7.36,表明这些区域物理类学业提升表现相对薄弱。在历史类方面,城区6(4.24)和城区1(3)表现优异,城区14(-14.05)和城区15(-10.3)则显著落后。这些数据表明区域间教育质量不均衡现象普遍存在。
其二,区域内呈现学科结构差异。部分区域的物理类与历史类提升指数存在非对称特征。城区12历史类提升指数(2.77)为正且表现尚可,但其物理类(-2.32)则为负值,提示该区在历史类的教学上更具优势。与之相反,城区2物理类提升指数2.66,但历史类仅为-0.8,反映出其在物理类教学方面相对更强。这种表现差异,既反映了各区域在学科教学优势上的不同偏向,也进一步印证了区域内在学科资源配置或教学质量上存在的结构性差异,为区域教育资源配置优化指明了方向。
其三,入口与产出存在非线性关系。中考录取分数(生源基础)与提升指数并非呈简单的正相关。中考录取分数较高的城区8、城区9,其提升指数接近或略低于全市基准;而中考录取分数中等的城区4、城区7却取得了更好的提升效果。这表明教育过程质量可以成为改变最终结果的关键变量。
2. 学校层面的培养效能甄别
当评价单元细化至学校层面时,学业基准转化系数的设定既可选择全市统一基准,也可视研究目的选取该校所属区域为参照。表2以全市学业转化系数为基准进行计算,旨在考查各学校相较于全市整体水平的增值表现,依据提升指数与生源水平两个维度,可将学校划分为三种典型类型。

一是“高进优出”型,高起点与高增值并存。以学校2到学校7为代表,它们不仅中考录取均值(e>488)与高考产出(EP, EH >587)均处于绝对高位,其物理类与历史类的提升指数(表P≥10.68,ΔH≥6.71)也普遍领先。这表明此类学校在汇聚优质生源的基础上,实现了显著的“教育增值”。特别是学校5,其历史类提升指数(11.77)为该组最高,展现了在文科培养上的突出优势。
二是“低进高出”型,中等起点的有效提升。学校1是此类型的典范,其中考录取均值(415.38)处于中等水平,但其物理类提升指数(15.98)高居全表之首。这一数据有力证明了学校1在中等生源基础上实现了极高的教学“增值”,体现了教育过程质量的关键作用,这样的学校应该得到肯定。
三是“低进低出”型,多重挑战与负增值。学校10到学校16群体性地呈现出中考录取分数低、高考分数低与提升指数极低的“三低”特征。值得注意的是,学校16的中考录取均分并非该组最低,但其物理类(-25.93)与历史类(-26.74)提升指数均位列末位,这一反差表明该校在教育教学过程中面临极为严峻的挑战。
综上所述,当分析单元下沉至学校层面,高中阶段的教育质量呈现出巨大且复杂的异质性。生源质量(中考分数)是重要的基础,但并非决定最终产出(高考分数)的唯一因素。学校1与学校16的鲜明对比表明,教育过程质量是导致校际分化的关键变量。采用全市统一基准进行评价,能够有效剥离生源基础的影响,识别出如学校1的教育高质量学校和学校16的教育薄弱学校,从而为学校教学改革和教育资源的精准配置提供实证依据。
3. 纵向分析:从“静态评估”到“动态演进”
本研究分别从区域与学校两个层面对学业提升指数Δ进行纵向分析,旨在超越单一年度的静态评估,深化对教育过程质量动态变化的理解,为不同层级的精准诊断与干预提供依据。

从区域层面(见表3)来看,其一,教育质量的动态演进并非线性。部分区域的表现出现剧烈起伏,而非沿循稳定的上升或下降通道。城区9的历史类Δ值在4年间经历了1.55(2022年)、0.77(2023年)、7.67(2024年)、0.03(2025年)的剧烈震荡,其中2024年的异常高值尤为值得关注。城区2物理类Δ值从-0.16(2022年)跃升至10.88(2024年)后回落至2.66(2025年),呈现“冲高回落”型波动。这些剧烈波动本身是重要的教育质量信号,提示相关区域的教育产出尚不稳定。其二,教育质量的底部固化现象凸显。从4年数据来看,区域间的质量分化格局已趋于稳定。城区13、14、15在物理类与历史类两个维度上,Δ值绝大部分为负,形成了稳定且突出的低质量集聚区。这表明,这些区域面临的已非偶然性或短期性的教学困难,而是系统性和长期性的发展瓶颈(见图1)。

图 1:2022—2025年部分城区物理类、历史类提升指数变化趋势
从学校层面(见表4)来看,连续4年数据揭示了各学校不同的发展轨迹,可归纳为三类典型模式。一是稳健优质型,以学校2、3为代表,其双科Δ值持续高位,体现了成熟均衡的育人体系。二是波动调整型,学校4的历史类Δ值在2022年(11.73)和2023年(9.49)表现优异,但2024年骤降至-1.61,次年又回升至9.22,此类波动本身即为重要的诊断线索,需结合学校具体情境进行归因。三是持续薄弱型,以学校16为典型,其物理类和历史类Δ值呈现下滑趋势,显示出教育质量改进乏力,警示该校亟须获得结构性的外部支持与系统性干预。此外,通过对比同一学校历年物理与历史类Δ值差异(见图2),可进一步诊断其内部学科教学质量的均衡性,为学校改进教学提供更具操作性的靶点。


图 2 :2022—2025年部分学校物理类、历史类提升指数变化趋势
综上所述,纵向分析的核心价值在于:将教育质量的考查维度,从单一时间节点的“静态快照”拓展为连续时间序列的“动态轨迹”。评估单元的教育表现并非凝固不变,而是始终处于持续的演进与波动之中。通过追踪这种动态轨迹,那些保持“持续优质”或呈现“趋势向好”的评估单元得以凸显,其经验可为整体改进提供参照;而那些陷入“持续薄弱”或“趋势恶化”的评估单元则被精准识别,明确后续的针对性帮扶目标。这种基于多年数据的动态诊断,正是超越单一结果评价、走向深度过程评价的关键路径。
/
三
/
核心价值与改进方向
1. 模型的核心价值:重塑评价生态的实践路径
本模型的核心价值在于其全纳性、公平性、科学性与导向性,为破解“唯分数”困境提供了可行的实践路径。
从模型设计来看,通过引入比值和相对差值,模型有效剥离了生源起点的影响,确保不同基础的评估单元能在更公平的基准上被衡量。尤为关键的是,该模型对低分段学生的进步具有更高的敏感性——由于比值关系的数学特性。这意味着,关注并帮助底部学生进步,既是教育公平的应然追求,也能在评价结果中获得实质性的正向反馈,从而真正将“不放弃每一个孩子”的理念转化为可量化、可感知的评价导向。
从应用层级来看,该模型为教育系统的不同主体提供了适配的诊断工具。于教育管理者而言,可通过区域层面的提升指数监测各板块教育质量的动态演进,统筹资源配置;于校长而言,可聚焦本校与全市基准或区域基准的差距,诊断学校整体的育人效能及学科均衡性;于教师而言,可依托班级层面的增值数据,定位教学改进的着力点,实现精准施教;于学生而言,可通过个体层面的增值反馈,清晰了解自身学业进步幅度与相对位置,从而激发内生动力,实现自主成长。四个层级依托同一套评价逻辑,形成了目标一致、各有侧重的评价闭环。不仅如此,当学业提升指数作为公开透明的评价标尺面向社会发布时,区域、学校、师生和家长都将从过度追求高分生源转向全力追求高效教学与自我成长。这种以增值为导向的评价共识,有助于构建更为健康、可持续的教育生态——让每一所学校都有机会被看见,让每一位努力进步的学生都能被肯定,最终回归到教育评价的本真——衡量教育本身带来的改变。
2. 研究局限与改进方向
尽管本模型取得了明显成效,但仍存在有待深化的空间。
其一,中考与高考的结构性差异。本模型隐含假设中考与高考分数具备线性可比性,但二者在考试性质、能力测量维度、题目难度与区分度上均存在本质差异。当前采用的全样本中考均分与分科高考均分的宏观比较,忽视了学生选科的内生性问题——不同选科方向的学生在中考基础能力上可能已存在系统性差异,这会影响增值评价的精确性。未来,可将学生按选科方向和基础能力进行分层比较,在更同质的群体内部测算提升指数,从而进一步提高评价模型的科学性与解释力。
其二,影响因素控制的局限性。模型目前未能纳入学校资源配置、师资队伍结构、教学管理模式等关键过程性变量。这些因素对教育增值有重要影响,后续可考虑收集多维度校际数据,将其作为协变量纳入更复杂的多水平模型,以更全面地揭示影响学业增值的多层面因素。
其三,追踪数据与真实性挑战。模型的准确应用高度依赖于大规模、长周期、高质量的追踪数据链,这对区域教育数据治理提出了很高要求。与此同时,当评价结果与资源分配及问责关联时,需警惕数据失真风险。因此,未来需结合数字化技术,通过多源数据交叉验证等方式,建立更可信、透明的数据质量保障机制,构建数据驱动的常态化评价系统。
其四,中高考分数对学业质量的代表性问题。本模型虽然试图突破“唯分数”的传统评价取向,但在操作层面上仍然依赖中高考分数作为衡量学生学业质量的核心指标—区别在于不再使用终结性分数,而是关注过程性增值。分数并非学业质量的完美量度,它难以全面捕捉学生的批判性思维、创新能力、合作素养等深层能力。然而,在现行教育评价体系与大规模数据可得性的双重约束下,中高考分数依然是信度、效度与可操作性最为均衡的评价抓手。因此,本研究将其作为学业质量的代理变量,既是对现实条件的务实选择,也是一种阶段性的研究策略。
本研究构建的高中学业质量增值评价模型,以简明的算法将评价重心从静态的结果转向动态的增值过程,为破解“唯分数”“唯生源”的顽疾提供了兼具理论解释力与实践操作性的工具。该模型的应用,有助于引导区域、学校、教师和学生共同关注每一点进步,推动我国基础教育走向更加公平、更有活力的高质量发展之路。
文章来源:《中国基础教育》2026年第6期,原标题《构建关注动态进步的高中学业质量增值评价体系——以超大城市为样本的从个体到区域的精准评价模型的创建与应用》
作者文章链接:
欢迎订阅
2026年《中国基础教育》杂志

文章编辑:石家丽
微信编辑:张文佳
微信设计:月 亮
本刊从不收取任何审稿费、编辑费、版面费
投稿邮箱:zgjcjy2022@163.com(请勿一稿多投)
邮件主题:作者姓名-手机号码-栏目名称-文章标题
办公电话:(010)84022301
投稿咨询:(010)84020856
邮发代号:80-572(国内)
国际标准连续出版物号:ISSN2097-1540
国内统一连续出版物号:CN10-1787/G4
月刊, 2026年,单期定价22元,全年定价264元
