热点文章

基于心电算法自动分析准确性评价的心电数据库

发布时间:2019-03-26 14:05:00      浏览  次

作者:王茜1,梁振士1,方丕华2,杨啸林3,曹东芳2,刘俊2,李卫2,王杨2,杨红2 ,张正国3

单位:1 北京市医疗器械检验所,医疗器械检验与安全性评价北京市重点实验室;2 中国医学科学院阜外医院;3 中国医学科学院基础医学研究所

〔关键词〕算法;准确性;数据库

基金项目:基金项目:首都卫生发展科研专项项目(编号:首发 2011-3001-04)

心电数据库是对医学研究、临床诊断、疾病过程和预后判断的宝贵医学资源。可为临床研究提供心血管流行病的资料;可为建立不同年龄、性别、种族的正常人群心电图(electrocardiogram,ECG)特征提供依据;可探讨某种心脏疾病情况下的心电图诊断标准和评估心电图的潜在价值等。

Iribarren 等 通过心电数据库来探索短 QT 间期在儿科人群中患病率以及其与人口统计学参数关系;对 VA 心电数据库的研究,使其发现从临床和 ECG 中得到的参数是很好的男性患者病死率的预测因素,提高了诊断预防水平。美国国家卫生院及美国心、肺、血压研究院通过规划几个大规模心血管病流行病学调查和临床试验,建立了国家级心电数据库等。国内近年的基于大规模人群调查,提供了流行病资料的心电数据库;有用于心电信息医院管理的远程心电监护系统的心电数据库等 。

与此同时,心电数据库对于产品的研发设计、性能评价也具有重要价值。心电图在临床的重要地位,以及计算机、电子等相关技术的发展,越来越多的心电图机具有心电图自动分析及诊断功能。这些有着各异的技术方法、模式和特点的心电算法,或是具有心电图自动分析及诊断功能的心电图机,其性能良莠不齐,自动分析结果可能会存在较大差异。

心电数据库是评价其自动分析准确性的重要评判依据。相较于心电算法或心电图机的飞速发展,在算法准确性评估领域,符合要求的心电数据库发展较慢。特别是缺少采集自中国人的、格式开放、可用于心电算法自动分析准确性评估的标准十二导联心电数据库。国际电工委员会(International Electrotechnical Commission,IEC)在心电图机的相关标准中提出,用于验证心电图形态轮廓和节律自动诊断算法的心电图数据,应在预期使用的特定人群中采集。然而,可应用于此目的的心电数据库存在应用需求和监管缺口。

我们结合北京优质资源(与中国医学科学院基础医学研究所、中国医学科学院阜外医院合作),参考国外权威数据库 CSE 心电数据库,并根据相关标准要求,结合临床实际及技术可行方面,从心电图的形态和节律方向,设计实现了一种格式开放、经临床专家确认、可用于心电图机自动分析准确性的中国北方成年人标准十二导联检测心电数据库。

1 需求分析与研究现状

1.1 需求分析

1.1.1 应用需求

按照标准要求,应利用合适心电数据库作为评价素材,来评价心电算法自动分析性能的准确性。为保证评价的可靠性、客观性,国际上通行的做法是采用经临床心电专家确定的心电数据库。我国该类心电数据库发展较晚,准确性评价多引用国外(欧美)的权威心电数据库,这些数据库的样本采集自西方人种。然而,作为一种体表记录的生理参数,心电图存在人种差异和适用性等方面的问题。这也与临床实践相同,即 ECG 的参数与年龄、性别和种族可能都有关系。考虑到中国是一个幅员辽阔的多民族国家,人群生活习性不同,生理参数与西方人种更可能存在地域、种族差异。完全用西方人种的心电数据库来评价心电算法自动分析性能对中国人心电图的分析能力,无法衡量是否会有潜在风险。

另一方面,心电图作为常规临床诊疗技术手段之一,临床与研究已经产生海量的心电图数据。但由于绝大部分心电数据以产品制造商的专有格式进行储存,存在格式壁垒,使得不同制造商的产品之间几乎无法交换数据。开发算法准确性评估的素材,难点在如何建立格式开放(利于共享)、答案可靠的心电数据库。

1.1.2 标准要求

不同研究方向对心电数据库有着不同的要求,可用于心电图机自动分析准确性评估的心电数据库,还应满足相关的医疗器械标准。行业标准 YY 0782:2010[12](转化自国际标准 IEC 60601-2-51:2003)中对心电图机的准确性性能评估所采用的数据库要求如下:

(1)形态自动诊断准确性评估:验证数据应从心电图机适用的健康人群和心脏病患者数据中获得。其中,用于测试评估分析型心电图机的健康人群应该有标准的临床诊断方法确定其没有疾病,尤其是没有心脏病,这些方法可能包括身体检查正常、无心脏病症状、没有患过已知的对心脏功能或形态会产生影响的疾病、条件允许情况下的运动心电试验等。用于测试评估分析型心电图机的心脏病患者要有非心电图手段(心脏导管术、超声心动图等)来准确验证其所患心脏病。标准同时提出,对于一些疾病,如正常、陈旧性心肌梗死、心室肥大,可以使用 CSE 诊断数据库进行准确性验证。

(2)节律自动诊断准确性评估:验证数据应来自有代表意义的目标人群。包括窦性心律和心房颤动心律,以及心房扑动、交界性节律等主要节律,适用时还有房性期前收缩、房室传导阻滞等更详细的节律分类。这些心电图的“真正”节律(用来)应由至少 1 名在心律失常分析方面受过培训的心脏病专家,通过仔细观察至少两个同步导联,每个导联不少于 10 s 心电图记录的心房活动来确定。

1.2 研究现状

目前欧美等发达国家已建立了一些采集自西方人种、可用于心电设备算法准确性评估的权威心电数据库。包括MIT-BIH 心律失常心电数据库、美国心脏学会 (American Heart Association,AHA)心电数据库、心电图通用标准 (Common Standards for Electrocardiography,CSE) 数 据 库、ST-T 数据库  和克瑞顿大学室性心律失常数据库(Creighton University Ventricular Tachyarrhythmia Database) 等。

其 中CSE 数据库可用于心电图机算法准确性评估。该库共有 3个子库,其中的三导联库和多导联库可用于心电图机间期自动测量准确性的性能评估,诊断库可用于波形自动分类准确性的性能评估。目前已有超过 200 家研究中心和制造商使用了 CSE 3 个数据库中的至少 1 个以上数据库来评价心电算法。CSE 数据库有正常、心室肥大、心肌梗死等部分形态诊断类别的心电图,但没有足够数量的急性心肌梗死和心肌缺血心电图。与此同时,CSE 数据库里也缺少节律诊断信息,无法验证算法的节律自动解析准确性。综合来看,作为心电算法准确性的评估素材,在满足标准要求的对形态或节律诊断分类识别方面,CSE 数据库有一定的局限性。

国内能进行心电算法评估的数据库很少。SDMU 心律失常心电数据库  主要针对的是心律失常心电算法的准确性评价。中国人心血管疾病数据库 (Chinese Cardiovascular Disease Database,CCDD)提供的临床标注信息有各波起终点、QRS 波倾斜度特征和心拍标注。两者均不能满足用于评估心电算法或心电图机节律和形态自动分类识别诊断的评估目的,而节律诊断和形态诊断则是相关标准对有自动分析功能心电图机的要求,以及当实际产品适用时,对心电图自动分类识别诊断的共性内容。

2 技术思路和方案设计

参照 CSE 诊断心电数据库,并根据相关标准要求、结合临床实际以及后期应用,我们设计制定并建立了中国北方成年人标准十二导联心电数据库。实现的总体技术方案见图 1。

2.1 “考题”(心电图)设计

2.1.1 规则

既然心电算法面对的心电图有正常心电图和异常心电图两类,评估用心电数据库里也应含有具备典型性的正常和异常心电图。考虑到相对于人种之间在同种诊断类别心电图上可能存在的种族差异,正常和异常心电图之间的差异可能会更大。因而,综合考题代表性与研究成本两方面因素,我们设计并实施的数据获取规则如下:正常心电图从有大数据支持的流行病调查资料里,根据年龄、性别、患病率等心脏病影响因素随机抽样获得;而异常心电图则考虑病种的覆盖,尽量纳入种类较全、数量较多的异常类心电图。所有入库的心电图数据均通过伦理审查。其中,正常心电图按照要求,通过临床常规方法(采用包括常规体检、无心脏病症状、无已知对心脏功能或形态学有影响疾病的病史)的诊断来证实受试者没有心脏方面的疾病。异常心电图要通过非心电图的临床方法来确认受试者所患心脏疾病的真实性,项目实施中所依据的非心电图临床方法有:超声心动图、心肌酶检查、心脏导管术、血管造影、CT、心脏 MRI、心肌核素显像等,同时还有受试者的既往病史资料及心电图检查时的用药信息。

2.1.2 特征

心电图每道数据的采样率为 500 Hz,模拟信号频响带宽 0.05~150 Hz,幅度分辨力不劣于 5 μV,符合开发心电数据库的推荐标准(由美国国家卫生院及美国心、肺、血液研究院特别专家小组给出)[21]。所有的心电图数据均采用开放的 xml 格式进行数字化存储。为了提高资源的可利用性,同时还提供以认可度高、开放的 MIT 兼容数据格式(每条记录含 .dat 和 .hea 两个文件,格式同 MIT-BIH 心律失常心电数据库)和 txt 格式两种存储形式。

2.1.3 质控

所建库中所有数据均由相对固定的专业人员使用可靠心电图机采集。以减少可能引入、来自外部的非数据特性的差异。另外,数据库中每条数据均经过至少 2 名有多年丰富经验的临床心电专家(来自阜外医院)独立进行典型性筛选,一致认为具有典型性者,方作为预备“考题”。

2.2 “参考答案”(临床标注)设计

2.2.1 规则

库中临床标注的诊断有两方面:形态诊断和节律诊断。由于在相关标准中,对异常心电图只有大致的分类(节律)和部分的分类(形态),实施时,仍需进一步细化到合理、可实施的诊断分类。所以在参照 AHA/ACC/HRS 的心电图标

准化及解析指南(2007)给出的诊断分类和术语名称基础上,我们进一步制定了合理、可实施的详细心电图诊断分类类别,并建立了一套心电图编码表,将之用于临床数据采集、典型性筛选和标注。

按照建库要求,标注时,临床医师根据临床实践,须仔细观察至少两个同步导联、每个导联 10 s 心电图记录的心房活动,对每一份心电图,都会标注其形态诊断和节律诊断。临床非心电图手段的检查资料、既往病史、用药情况等会在提取各项信息后,与对应的心电图关联。医师在标注时,会同时获得这些与典型心电图筛选、诊断标注关联的临床信息。这样方式能在医师标注时综合参考多方面临床信息,符合临床实践,进一步提高了标注的准确性。同时,我们以电子图纸的软件形式完成临床工作,节省了大量纸版 ECG 标注、整理对比的工作和时间,提高效率,并减少了可能引入的误差。

2.2.2 质控

为保证最终结果的可靠性,分两轮实施标注工作:

第1 轮,每条数据由两位经验丰富的临床心电专家进行独立的筛选和标注诊断;而后逐一比对梳理提取不一致数据;

第2 轮,将第 1 轮中所有的不一致处,提交更高级心电专家或复审并确定最终诊断结果。

2.3 数据库总体

最终入库内容,除了含正常和异常心电图作为评估心电算法的“考题”,其中每条记录均经临床心电专家进行独立的典型性筛选,同时还有专家确认或复审一致的标注诊断作为评估心电算法的“参考答案”,共同构成可应用于心电算法对节律和形态自动诊断和分析性能评估的测试题库(库中总数据超过 1800 条)。另外,除心电图数据及临床专家标注的诊断信息之外,数据库包含的相关信息还包括人口构成、心电图记录的时间等。按照标准要求,还包含非心电图验证手段的检查结果等辅助信息。

无论是在心电产品研发阶段还是在上市前的测试阶段,在评估心电算法或有自动分析功能的心电图机性能准确性的领域,心电数据库的重要性毋庸置疑。准确性评价过程中,设备或算法通过对心电数据库里心电图的检测、自动分析给出自己的结果,然后将其结果与数据库中的参考答案进行比较和统计,从而得到算法对心电图形态或节律的自动分析诊断准确程度的客观量化评估。

按相关医疗器械标准要求,每种心电算法或每个企业应公布其用来进行准确性测试评估的心电数据库信息,及其所能诊断的疾病种类的敏感性、特异性和阳性预测值。该要求对于已经有自有数据库的心电图机制造商来说,可以实现;但对于许多尚无自有数据库的心电图机制造商来说,西方人种的 CSE 心电数据库有一定局限性,自己建数据库又需要重复伦理审查、临床采集、临床确认评价等过程,耗费大量时间、人力、物力。而目前由于数据格式的壁垒,参考答案的烦琐确认过程等原因,国内很少有格式开放、可用于评估目的的心电数据库。

针对应用需求,结合临床实际以及标准要求,本项目设计实现的中国北方成年人标准十二导联心电数据库,样本全部采集自中国人,考题可以多种数据格式提供,便于使用,同时含有符合相关国际、国内标准规定的形态诊断和节律诊断、由心电专家结合心电图与相关非心电图临床检查信息综合确认的“参考答案”,是一种可用于心电算法自动分析准确性评估的可靠资源。其可为心电图机类制造商提供设计研发、性能检测和临床评价的依据,降低研发成本,提高性能评估验证结果的有效性和客观公正性。

[参考文献]

[1]Iribarren C, Round AD, Peng JA LM, et al. Short QT in a cohort of 1.7 million persons: prevalence, correlates, and prognosis[J]. Ann Noninvasive Electrocardiol, 2014, 19(5): 490-500.

[2]Stavrakis S, Patel N, Te C, et al. Development and validation of a prognostic index for risk stratification of patients with early repolarization[J]. Ann Noninvasive Electrocardiol, 2012, 17(4): 361-371.

[3]杨啸林,张靖,徐铖,等 . 基于大规模人群调查的心电数据库的构建 [J]. 中国生物医学工程学报,2010,29(3):326-330.

[4]刘星,陈希超,汪觉民,等 . 远程心电监护系统的设计与开发 [J].医疗卫生装备,2007,11(28):55-56.

[5]IEC. IEC 60601-2-51: 2003, Medical electrical equipment -Part 2-51:Particular requirements for safety, including essential performance, of recording and analysing single channel and multichannel electrocardiographs[S]. Switzerland, 2003.

[6]Rautaharju PM, Surawicz B, Gettes LS, et al. AHA/ACCF/HRS Recommendations for the Standardization and Interpretation of the Electrocardiogram. Part IV: The ST Segment, T and U Waves, and the QT Interval A Scientific Statement From the American Heart Association Electrocardiography and Arrhythmias Committee, Council on Clinical Cardiology; the American College of Cardiology Foundation; and the Heart Rhythm Society Endorsed by the International Society for Computerized Electrocardiology[J]. J Am Coll Cardiol, 2009, 53(11): 982-991.

[7]Mansi IA, Nash IS. Ethnic differences in electrocardiographic intervals and axes[J]. J Electrocardiol, 2001, 34(4): 303-307.

[8]Mansi IA, Nash IS. Ethnic differences in electrocardiographic amplitude measurements[J]. Ann Saudi Med, 2004, 24(6): 459-464.

[9]Jain A, Tandri H, Dalal D, et al. Diagnostic and prognostic utility of electrocardiography for left ventricular hypertrophy defined by magnetic resonance imaging in relationship to ethnicity: the Multi-Ethnic Study of Atherosclerosis (MESA)[J]. Am Heart J, 2010, 159(4): 652-658.

[10]Macfarlane PW, Katibi IA, Hamde ST, et al. Racial differences in the ECG--selected aspects[J]. J Electrocardiol, 2014, 47(6): 809-814.

[11]Soliman EZ, Prineas RJ, Case LD, et al. Ethnic Distribution of ECG Predictors of Atrial Fibrillation and Its Impact on Understanding the Ethnic Distribution of Ischemic Stroke in the Atherosclerosis Risk in Communities (ARIC) Study[J]. Stroke, 2009, 40(4): 1204-1211.

[12] 全国医用电器设备标准化技术委员会医用电子仪器标准化分技术委员会 .YY0782-2010 医用电气设备 第2-51部分:记录和分析型单道和多道心电图机安全和基本性能专用要求 [S]. 北京:中国标准出版社,2010.

[13]Goldberger AL , Amaral LA, Glass L , et al. PhysioBank, PhysioToolkit, and PhysioNet: components of a new research resource for complex physiologic signals[J]. Circulation, 2000, 101: E215-E220.

[14]AHA database[EB/OL].https://www.ecri.org/Pages/default.aspx.

[15]Willems JL, Arnaud P, van Bemmel JH, et al. A reference database for multilead electrocardiographic computer measurement programs[J]. J Am Coll Cardiol, 1987, 10(6): 1313-1321.

[16]European ST-T Database[EB/OL].http://www.physionet.org/physiobank/database/edb/.

[17]Creighton University Ventricular Tachyarrhythmia Database[EB/OL].http://www.physionet.org/physiobank/database/cudb/.

[18]Rautaharju P. Eyewitness to history: Landmarks in the development of computerized electrocardiography[J]. J Electrocardiol, 2016, 49(1): 1-6.

[19]邵庆余,李桥,王永,等 .SDMU 心律失常心电数据库的建立 [J].中国生物医学工程,1996,15(1):54-61.

[20]Zhang Jia-wei, Wang L i-ping, L iu xia , et a l. Chinese Cardiovascular Disease Database (CCDD) and its Management Tool: proceedings of the 2010 IEEE International Conference on Bioinformatics and Bioengineering, 2010 [C].

[21]Norman JE, Bailey JJ, Berson AS, et al. NHLBI workshop on the utilization of ECG databases:preservation and use of existing ECG databases and development of future resources[J]. J Electrocardiol, 1998, 31(2): 83-89.