
心力衰竭(心衰)是一种严重的疾病,预后差,生活质量下降,对医疗系统造成负担,费用高昂,全球有2600万患者受到影响。超声心动图是HF诊断和患者随访的基石影像学方法。很多接受培训的心脏科医师仍不能准确地解读超声心动图,故而心力衰竭的诊断可能具有挑战性。此外,有研究显示,高达40%的患者可能会出现心力衰竭的延迟诊断。
对于HF的分类和治疗,需要估计左心室(LV)射血分数(EF)。另一个可靠且容易获得的左心室功能测量方法是二尖瓣环收缩期位移(MAPSE),它对于检测左心室功能障碍相当敏感,即使在EF保留的情况下也是如此。LVEF的半自动定量已经有一段时间了,但MAPSE的自动定量尚未广泛应用。
本研究的目的是评估HUD检查的可行性和可靠性,包括实时autoEF和autoMAPSE,由不同经验水平的用户在疑似心衰的门诊队列中进行。其中,新手组、中级组和专家组分别由全科医生、注册心内科护士和经验丰富的心内科医生代表。由有经验的心脏科医师进行全面的常规超声心动图检查作为金标准。

图1:研究路线图. AutoEF,自动测量左心室射血分数;autoMAPSE,自动测量二尖瓣环平面收缩期位移;GP,全科医生;HUD,手持超声设备;RCN,注册心脏护士。
图1显示研究参与者的流程由5名全科医生中的1名和3名注册护士中的1名按随机顺序对患者进行检查,专家组一名专家进行HUD检查,另一名专家进行常规心超检查,他们对彼此的结果均不知情。由于某些原因,前29例患者未由专家组进行HUD检查。本研究未对参与者进行额外的随访或超声检查。

参与者
本试验纳入了被转诊至挪威Levanger医院(LevangerHospital)的疑似HF患者。排除标准:年龄<18岁,已知心衰和在过去10年内接受过心脏影像学检查。从2018年6月至2020年6月连续纳入符合条件的患者。由于COVID-19大流行,纳入工作从2020年3月至6月暂停。

人员的培训和教育
新手组:共有6名全科医生按照欧洲推荐标准接受了HUD心脏超声培训。1例因职业变化中途退出,共5名全科医生参与研究。所有全科医生均接受为期6天的住院培训,由2名有心脏超声专业经验的住院医师进行一对一的督导,并由超声诊断和超声心动图专家进行2次晚间讲座。从培训的第一天开始,全科医生就有机会在没有监督的情况下使用个人HUD。所有研究对象在研究开始前均未接受额外的培训。6人中只有1人在培训前接受过HUD超声检查(n=7次检查),因此,这一组是缺乏经验的使用者。入组前共进行了46次(45 ~ 68次)检查,其中无监督检查10次(9 ~20次),有监督检查36次(31 ~ 43次)。
来自心衰门诊护士主导的3名经验丰富的心脏科注册护士(RCNs)代表了具有中级经验的使用者。对HF患者的胸腔积液、下腔静脉和临床体征的评估有经验。在纳入患者之前,RCNs共完成了118(74 ~ 221)次有限的超声心动图检查,因此,他们没有接受与全科医生相同的系统培训。他们在纳入前4周被告知如何使用HUD和初始化autoEF和autoMAPSE软件。
5名有超声心动图经验的心脏科医师(中位经验18(6 ~43)年)只被指导如何在HUD上初始化自动决策支持软件,而没有被提供任何额外的培训。所有心脏科医师均经国家主管部门认证。

研究方法
除参考影像外,每例患者均接受了3次HUD检查。所有HUD检查均采用Vscan Extend扇形探头进行,参考超声心动图采用Vivid E9或E95扫描仪(GE超声)进行,相控阵探头为1.4 ~ 4.6 MHz。所有检查均按照标准操作程序进行,包括左心室四腔记录。新手组采集的图像包括胸骨旁长轴、短轴切面、心尖四腔切面、肋缘下四腔且慢,并对下腔静脉及胸膜腔进行评估。记录下腔静脉在正常呼吸状态下的最大径和最小径。坐位时评估胸膜腔。同时记录心尖二腔切面、心尖长轴切面、右心室四腔切面和心房切面。中级组除以上切面,还记录了与本研究目的无关的二尖瓣、主动脉瓣和三尖瓣的彩色多普勒图像。心脏科医师仅通过HUD记录四腔心切面,但参考超声心动图是全面的。
所有HUD检查均记录至少一个心动周期的实时电影循环。在HUD上实现的autoEF或autoMAPSE软件由用户初始化,自动分析的记录随后存储在HUD上。通过autoEF(3次)和autoMAPSE(3次),对6个单独的记录进行自动分析。所有记录的视图和分析均被存储并立即传输到基于云的服务器(Tricefy, Trice Imaging, California, USA)。
由初级和中级检查结束后,立即进入独立房间进行参考超声心动图检查。所有测量值均反映至少3个心动周期(心律失常情况下为5个心动周期)的平均值。方法学如下:所有测量均使用EchoPAC, V.202和V.203 (GE超声)进行。在四腔心切面和二腔心切面采用双平面Simpson法计算左室舒张末期容积和收缩末期容积及左室射血分数。在M型超声模式下测量MAPSE,即二尖瓣环间隔和侧壁点的纵向位移。

量化左室功能的自动工具和图像分析的详细信息
在存储四腔观记录之前,在HUD上初始化特定的应用程序(autoEF或autoMAPSE)。左心室容积和射血分数的自动测量采用LVivo软件(DiA Imaging Analysis, Be 'er Sheva, Israel)。该软件提供了在整个心动周期的标准心尖四腔切面的全自动边缘检测和心内膜边界追踪。测量左室舒张末期和收缩末期容积,计算左室射血分数(EF)。在左心室模型上,采用自动算法追踪二尖瓣环间隔和侧壁点来估计MAPSE。使用实时轮廓跟踪库(Real-time ContourTracking Library, RCTL)和非均匀有理b样条模型处理和跟踪LV运动、图像(GE, Vingmed,挪威)、二尖瓣环间隔点和侧壁点。计算二尖瓣环最大位移点阵列。在二尖瓣环的间隔点和侧壁点计算MAPSE并取平均值。对于autoEF和auto-MAPSE,四腔室视图记录与自动算法结果的叠加按上文所述存储。
所有HUD记录均由有超声心动图经验的心脏科医师提供,用于盲法分析。这些心脏科医师使用自动测量叠加对所有记录进行以下分类之一的评分:(1)丢弃(不用于临床),(2)接受结果,但根据性能不理想调整结果,或(3)接受结果。评分同时考虑了图像的质量和应用程序的性能。因此,如果图像不能代表四腔心,分数就会更低。

其他测量
当天抽取血液样本,并在院内认可的实验室进行分析。检测血清 n末端脑钠肽前体(NT-pro-BNP)、血肌酐、估算的肾小球滤过率 (Cockcroft-Gault公式计算 )、电解质(钠、钾)和血红蛋白 (g/L) 。由护士进行纽约心脏协会(NYHA)心功能分级,测量体重 (kg) 、身高 (cm)和血压 (mm Hg)。人体测量值四舍五入到最接近1的倍数。

表1:基线特征

测试结果
可 行 性
新手组分别有134例(80%)和153例(92%)能用autoEF和autoMAPSE记录至少1张四腔图像。中级组分别为151例(90%)和161例(96%)(与新手组,P均<0.001)。在91%的病例和99%的病例中,专家能够使用HUD获得相同的autoEF视图和auto-MAPSE视图(与中级组差异,p值均<0.001。
由盲法心脏科医师判定为可行(评分≥2分)的图像比例在新手中最低,在中级组中较高,专家的比例最高(均p≤0.001,表2)。总体而言,初学者对autoEF或autoMAPSE的图像判断为可行的比例≤53%,而专家对autoEF和autoMAPSE的图像判断为可行的比例分别为84%和85%。在考虑了两个版本的autoEF算法的分析中,修改后所有人的autoEF可行性都有所提高,新手的可行性为68%,专家的可行性为91%(表2)。只有非常少的自动算法被打3分:“接受这个结果”在新手中,autoEF和autoMAPSE的数量(%)分别为7(2%)和23(5%),中级组分别为13(3%)和52(11%),专家组分别为25(7%)和67(17%)。
超声检查时间在新手组平均为18(7)分钟,在中级组平均为23(7)分钟。6次自动记录所用时间:新手为4分34s (2min 20s),中间组为3分21s (1 min 52s),专家组为2分21s(1 min 19s)。

表2:结合图像记录和使用自动应用程序的可行性(即评分≥2)
可 靠 性
表3显示了autoEF和autoMAPSE在不同用户之间的一致性。简而言之,三组之间的大变异系数和大可重复性系数表明,与参考的标准心超相比,自动应用的一致性较差。根据autoEF和autoMAPSE的重复性系数估计的最小可检测变化范围分别为24.2% ~ 21.5%和5.0 ~ 4.1mm。修正autoEF软件后,可检测到的最小可检测变化有所改善,但仍约为20%。
表4显示autoMAPSE检测,除了中级组(ICC0.85)和专家组(ICC 0.83)外,其余所有组内相关性(ICC)均为中度(<0.75)。专家组autoEF的ICC最高,3组的组内相关系数为0.51 ~ 0.72。新手的auto MAPSE评分者内ICC最低,专家的评分者内组内相关系数最高(ICC为0.70 ~ 0.85)。三组的组间ICCs均较差(≤0.51)。专家组autoEF的ICC最高,autoMAPSE的组间ICC在新手组中最低(0.35),在专家组中最高(0.51)。
图2显示根据用户组与参考相比,使用autoEF 和autoMAPSE的HUD 记录的 Bland-Altman图。类似地,图3显示了设盲的心内科医师评价为可接受的图像的BlandAltman图(评分2或3分)。总体而言,一致性较差至中等。

表3:自动手持超声测量左心室功能的平均值和与参考值的一致性

表4:由HUD根据操作人员自动测量左心室功能的评分者内和评分者间的可靠性

图2:Bland-Altman图说明了全科医生所有autoEF和autoMAPSE记录之间的一致性,与参考超声心动图相比,中级组和专家组使用自动决策支持软件对所有记录进行了比较,而不考虑图像评分。

图3:Bland-Altman图显示了通过盲心脏病专家评估认为可接受的记录中autoEF和autoMAPSE之间的一致性(盲图像评分≥2)。

讨论
据我们所知,这是第一个在新手、中级经验用户和专家中评估实时自动决策支持软件量化左心室功能的可行性和可靠性的研究。结果发现:第一,应用的可行性是可接受的,尽管在专家中是最高的;第二,与标准的心超相比的一致性差到中等,即使是专家的一致性和可靠性也几乎没有在推荐的临床使用范围内。

参与者
研究人群代表在日常临床实践中为诊断或排除心衰而进行心脏超声检查的患者。新手组接受了有限的集中训练。中级组在日常临床上有使用有限心脏超声的经验,专家组具有常规心超的全面检查的经验。患者多为超重或肥胖,并发房颤、高血压等。因此,成像不佳和房颤(24%的检查中存在)都可能干扰图像采集和自动测量的精度。

可行性
当没有对所记录的图像进行质量评估或应用程序的性能进行评估时,所有用户组运行自动决策支持软件的能力都很高,autoEF和autoMAPSE的性能成功率分别为80%和92%。新手的比例最低,专家的比例最高。改良后应用autoEF的可行性明显进一步提高。然而,在由心脏科医师进行盲法质量评估后,两种应用的可行性均明显受损。在新手中,35% ~ 40%的自动决策支持软件记录不建议临床使用。在中级组和专家中,相应比例分别约为20%和10%。另外,操作人员能够运行autoEF软件的图像比例在第二版软件中有所降低,这可能是由于算法成功的规则更加严格所致。最近,有经验的用户在一些研究中评估了左心室射血分数的自动量化。一项研究评估了同一autoEF软件,该软件由一名在研究开始前6个月接受过高级超声心动图培训的心脏病学研究员操作。112例患者中有76例(68%)成功进行了左心室自动定量分析。在我们的研究中,autoEF应用程序更新后显著改善,说明训练的影响有限(更依赖于软件)。我们的研究结果还强调了软件应用于临床实践之前进行全面评估的重要性而不仅仅是在引入市场之前。此外,在更新autoEF软件后,由心内科医师进行的盲法评估中,可能获得最高评分的记录比例有所降低。对于初学者和中级组,完成HUD检查的平均时间为18 - 23分钟,我们认为这在日常实践中选择的病例中是可以接受的,具有显著的临床获益潜力。
初学者和中级组的组内和组间icc主要低于临床推荐使用的icc(常用界值0.75)。专家组的icc略高,但与标准化超声相比仅为0.51。最近发表的一篇文章使用另一个HUD平台,由一名心脏科医师对LVEFf进行自动定量,icc值为0.91。尽管给出的数据不具有直接可比性,但它们可能表明,在本研究中使用的autoEF软件可靠性可能不高。未来的研究必须阐明下一代LVEF自动分析功能将如何在不同经验水平的用户之间执行。
所有用户自动测量EF和MAPSE的一致性较差。尽管对于最有经验的用户,autoEF的偏倚较低,但对于所有用户组,一致性差至中等。在Filipiak-Strzecka和Papadopoulou最近发表的论文中,与参考文献的一致性下限上限分别为- 10-12 (EF %)和- 16-13 (EF %)。因此,与图2和图3所示的一致性界限相比,两项研究均发现LVEF的一致性略高,但不同研究的的数据之间不具有直接可比性。对于autoMAPSE,与标准心超相比的低估是一致的。这强调了临界值这一概念不能在不同的方法之间互换。经验较少的用户获取的图像欠佳,部分解释了不同用户组之间的差异。重要的是,专家的一致性和可靠性也不理想,这表明自动测量软件在作为一个可靠的工具纳入日常临床实践之前需要改进。

从患者角度
从患者的角度来看,重要的是提供正确的诊断,从而尽早治疗。快速而精确的诊断可以减少患者的痛苦并提高医疗质量。将先进的诊断设备转移到患者的床旁可能会缩短诊断时间并改善治疗。正如本研究所指出的,在应用于临床实践之前,彻底评估新方法学至关重要,因为万一出现假The patients’ perspective患者的角度阴性结果,进一步的诊断检查可能会被延迟。

优势和局限性
这项研究的主要优势是通过三个不同的用户组对连续的患者进行盲法检查,从受过培训的新手到专家,采用盲法审查自动算法性能的可行性。据我们所知,由无经验的用户实时自动定量评价左室功能并进行实时反馈,这是前所未有的。此外,市政当局根据他们在各种医疗机构的角色招募了这些新手,而不是根据参加研究的个人动机。这提高了通用性,但与更有经验的用户组相比,可能削弱了新手的性能。本研究的另一个优点是具有足够的统计学功效。

结 论
通过在hud上实现的自动决策支持软件,新手全科医生、中级经验的心脏科注册护士和心脏科专家均能对左心室功能进行自动分析。然而,这些自动测量显示了较差到中等的一致性和中等的可靠性。虽然这项研究是在使用新技术帮助医疗保健提供者做出诊断决策的正确方向上迈出的一步,但在大规模实施到临床实践之前,仍需要更可靠的方法。
复旦附属静安区中心医院心内科专家门诊一览表

注:周一至周五均有专科门诊(包括高血压门诊)


第166期
编辑|魏雅丽


