前沿研究

基于 DeepSeek 的药物洗脱支架不良事件数据治理和风险信号检测及分析模型构建

发布时间:2026-04-28 09:26:32      浏览  次

作者:蔡权周1,林占权1,肖育华2(通信作者)

单位:1 佛山市食品药品检验检测中心 (广东佛山 528000);2 广东省药品不良反应监测中心 (广东广州 510080)

〔关键词〕药物洗脱支架;不良事件监测;DeepSeek;风险信号检测;自然语言处理

〔中图分类号〕R197.39  〔文献标识码〕B

〔文章编号〕1002-2376(2026)05-0030-06

基金项目:广东省药品监督管理局科技创新项目(2024TDB23、2024TDB42、2021TDB26)

医疗器械不良事件监测是保障医疗器械安全使用的重要手段。随着《医疗器械不良事件监测和再评价管理办法》[1] 等政策法规的实施,医疗机构和企业上报的不良事件数量大幅增加。2024 年,国家医疗器械不良事件监测信息系统共接收医疗器械不良事件报告 94.62 万份,每百万人口平均医疗器械不良事件报告数 671 份,较 2023 年增加 9.11%[2]。然而,部分报告存在器械故障表现和伤害表现描述不规范、质量参差不齐等问题 [3],给各级医疗器械不良事件监测机构的分析工作带来巨大挑战。传统人工方式进行数据治理和统计分析的效率低下,难以应对海量数据的处理需求。近年来,DeepSeek 在自然语言处理领域展现出强大能力 [4],为医疗器械不良事件报告的数据治理和分析提供了新思路。本研究将DeepSeek 应用于具有高风险特性的药物洗脱支架的不良事件数据治理、风险信号检测和分析,旨在实现对医疗器械不良事件的智能分析和风险识别。

1 研究方法

1.1 数据来源

收集 2020 年 5 月 1 日至 2025 年 4 月 30 日国家医疗器械不良事件监测信息系统中广东省医疗机构上报的 194 份药物洗脱支架不良事件报告,提取信息包括报告编码、发生日期、产品名称、注册证编号、上市许可持有人名称、伤害程度、伤害表现、器械故障表现、使用过程、事件原因分析描述、处置情况、产品类别等。纳入标准:市级监测机构审核通过的报告。排除标准:错报误报以及重复报告。1.2 模型的构建本研究采用 Python 及其数据科学工具库构建分析模型。Python 在数据分析领域已成为主流工具之一 [5],其核心工具包括:Pandas 提供高效的数据结构(如 DataFrame)和数据处理功能,支持数据清洗、转换、聚合等操作;NumPy 为高性能数值计算基础库,支持多维数组和矩阵运算;SciPy 扩展 NumPy 功能,提供科学计算算法;Requests 库用于通过应用程序编程接口与 DeepSeek 进行交互;Matplotlib 库实现数据可视化。本研究采用的分析框架与方法流程,参考了本团队在血液净化辅助器具不良事件监测中的研究 [6],并结合药物洗脱支架的产品特点进行针对性调整,利用 Python 工具库组合构建了基于 DeepSeek 的药物洗脱支架不良事件数据治理、风险信号检测和分析模型,将传统数据分析与大语言模型的智能研判能力有机结合,既可保证计算效率,又可提升分析深度和智能化水平。

1.3 模型的数据治理

1.3.1 数据脱敏

为保护患者隐私和商业机密,对报告数据部分字段进行脱敏处理。脱敏内容包括报告者姓名、联系方式、联系地址、医护人员姓名、患者姓名、单位名称、注册证编号、型号 / 规格、上市许可持有人名称、场所名称等敏感信息。采用映射代码替换法实现可逆脱敏,并以 JSON 格式储存映射字典,以便后续恢复。

1.3.2 术语集建立

采用多层次的术语集构建方法,先基于原始数据中器械故障表现、伤害表现的高频词汇进行初步提取,然后将相关高频词汇集发送至 DeepSeek。对于药物洗脱支架不良事件,参考国际医疗器械监管机构论坛的 IMDRF 术语集[7]自动生成研究术语集。术语集构建过程中,通过交互式界面设置单个字段的最大术语数量为 8 项。术语集建立遵循以下原则:(1)合并语义相似但表述不同的术语;(2)按出现频率降序排列;(3)保留“其他”作为最后的归类;(4)确保术语简洁、明确。构建的分析模型支持监测人员对自动生成的故障术语、伤害术语和故障部位术语进行人工校验和修改,最终形成标准化的药物洗脱支架不良事件术语参考体系。

1.3.3 数据规整

采用基于 DeepSeek 的智能化规整方法,将待规整的报告数据与预建立的术语集进行匹配,通过DeepSeek 的自然语言理解能力对每份报告的故障表现、伤害表现、使用过程、事件原因分析描述、处置情况进行语义分析和归类。为提高处理效率,选择每批 20 份报告的批量处理模式,并设置合理的请求间隔(3 s)以避免应用程序编程接口过载。规整结果以 JSON 格式返回,包含每份报告的唯一编码与规整结果的映射关系,根据映射信息将规整结果合并至原始报告。通过可视化展示,直观地呈现规整后数据的分布特征和趋势,通过规整前后对比评估数据治理效果。研究中,DeepSeek 根据报告生成的故障表现术语集在 5 min 内对 194 份不良事件报告进行了规整,结构化提取了器械故障表现、伤害表现和故障部位等字段,经逐份报告分析,规整后的数据一致性良好,为后续分析打下良好基础。数据规整前后比较见表 1。

表 1 数据规整前后比较

使用 DeepSeek 重复规整 1 次,对于器械故障表现、伤害表现、故障部位等字段,分别评估其重现性(重现性 =2 次规整一致的报告数量 / 报告总数量),以评估和控制数据规整质量。其中器械故障表现的重现性为 86.60%(168/194),伤害表现的重现性为 90.21%(175/194),故障部位的重现性为 87.63%(170/194),进一步逐份分析 2 次规整结果不一致的报告,其中器械故障表现和伤害表现前后有差异是由术语理解可能存在交叉重叠引起,如故障表现的“推进困难”也可理解为“操作运行异常”,伤害表现的“手术时间延长”也可理解为“延误治疗”。总体而言,首次规整基本正确,可用性较强,本研究采用首次规整后的器械故障表现用于后续信号检测。

1.4 模型的风险信号检测和分析

目前国内外没有公认的信号检测方法金标准,对于来源于自发报告系统的数据,因缺乏临床使用总量,无法获得计算不良事件发生率的分母数据,故常使用基于比例异常分析法的自动监测技术 [8]。本研究采用报告比值比(report odds ratio,ROR)和比例报告比(proportional reporting ratio,PRR)等比例失衡方法进行信号检测。ROR 和PRR 是常用的信号检测方法,不仅可用于药品不良反应的信号检测,在识别不良事件与医疗器械之间的关联性方面也有应用 [9-10]。但医疗器械不良事件与药品不良反应在发生机制上存在较多差异。药品不良反应主要源于药物本身的固有药理特性,其发生与生产流通环节及临床操作的相关性较低;而医疗器械不良事件主要与产品设计缺陷、材料特性、生产工艺参数及临床操作规范性等因素密切相关。故在信号检测方法上,比例失衡法的应用策略亦有不同:在药品不良反应监测中,该方法主要用于从全部药品或某一药理类别中,识别出与特定通用名药物(可能涉及多个生产厂商)具有统计学显著关联的不良反应信号,其关注点更侧重于药物化学成分本身固有的药理属性;本研究侧重于检测特定注册证号医疗器械(代表特定的设计方案、生产工艺、材料体系和质控标准)在同品类器械中的异常不良事件信号,以识别特定厂商产品在设计、材料或生产环节存在的潜在质量问题。具体而言,本研究采用 ROR 和 PRR 进行信号检测,当计算结果超过预先设定的阈值(即出现“失衡”)时,则提示该医疗器械与特定不良事件之间可能存在非偶然的相关性,值得进一步关注 [11]。本研究比例失衡计算公式分别为 ROR=(ad)/(bc)和 PRR= [a/(a+b)] / [c/(c+d)], 式中 a 为目标对象(如某一注册证号的产品)出现目标事件报告数,b 为目标对象未出现目标事件报告数,c 为非目标对象出现目标事件报告数,d 为非目标对象未出现目标事件报告数。ROR 的 95% 置信区间(confidence interval, CI)通过 95%CI = exp[ln ROR±1.96×(1/a+1/b+1/c+1/d1/2] 计算,PRR 的 95%CI 则通过95%CI = expln PRR±1.96×[1/a-1/(a+b)+1/c-1/(c+d)]1/2} 计算。信号判断标准为:报告数≥3 份, 且 ROR 和 PRR 的 95%CI 下限均 >1, 满足以上标准即判定为 1 个不良事件信号,且 ROR 与PRR 数值越大,表明信号强度越强。

对于检出的信号,采用 DeepSeek 进行多维度分析评估,通过结构化提示词工程引导其从产品设计、生产工艺、材料特性、流通存储、临床使用、产品维护等关键环节开展系统性评估,自动生成包含故障模式分析、伤害特征分析、故障原因分析、风险等级研判、调查重点建议和处置措施的结构化报告。

2 实验结果

2.1 风险信号检测结果

采用 ROR 和 PRR 方法对药物洗脱支架不良事件进行信号检测(目标对象:某一注册证号的产品;目标事件:第 1 次规整后的器械故障表现),检出 5 个潜在风险信号,故障表现分别为生物相容性问题、支架断裂或球囊破裂、推进困难或失效、表面粗糙或起毛、压应力变形,见表 2。

表 2 药物洗脱支架不良事件信号检测结果

注:A~E 为不同注册证号的产品,ROR 为报告比值比,PRR 为比例报告比,a 为目标对象(如某一注册证号的产品)出现目标事件报告数,b 为目标对象未出现目标事件报告数,c为非目标对象出现目标事件报告数,d 为非目标对象未出现目标事件报告数。

2.2 风险信号的分析

对于检出的风险信号,经查看原始报告,发现注册人在系统中回复均为与产品无关或无法确定,与产品无关的基本归结于患者血管条件不佳(如病变血管扭曲成角、存在钙化病变),无法确定的基本回复为“经自查相关产品生产和流通环节未见异常”。本研究采用 DeepSeek 对检测到的风险信号进行了多维度评估,并给出详细的分析报告。分析报告指出故障原因可能涉及多方面:(1)生物相容性问题(产品 A)可能与材料材质或涂层工艺有关;(2)支架断裂或球囊破裂(产品 B)可能与因设计结构强度不足、生产热处理工艺缺陷或术中血管钙化导致应力集中有关;(3)表面粗糙(产品 C)原因可能是抛光工序质量控制不严;(4)推进困难(产品 D)可能与输送系统设计缺陷或病变血管解剖条件相关;(5)压应力变形(产品 E)可能源于材料抗疲劳性不足或球囊压力不均。风险研判显示,(1)至(3)问题风险等级较高,需进一步深入调查不良事件与产品的潜在关联。有研究指出,支架断裂的发生率为 10.2%,与较高的不良心血管事件发生率存在相关性 [12]。此外,支架断裂与支架的材料和设计、血管和病变的形态、支架置入技术及支架与血管壁的相互作用等均有关 [13],支架发生疲劳变形的原因还与支架的材料、结构尺寸、血液腐蚀及金属降解等有关 [14]。上述研究与DeepSeek 提示的风险方向相互印证,进一步说明将不良事件仅归因于患者血管条件可能忽略了系统性设计、工艺与材料因素的影响。相较于注册人的评价结论,DeepSeek 从更多角度展开了补充分析,提示潜在的分析或调查方向,对监管部门风险调查和研判具有一定的参考意义。本研究监测到的产品 B关于药物洗脱支架断裂的风险信号,后续经现场调查后得以确证,并受到国家药品不良反应监测中心的重点关注,目前注册人已依照监测机构的研判意见采取了必要的控制措施。

3 讨论

3.1 方法创新性

3.1.1 人工智能技术与传统信号检测方法深度融合

本研究创新地将 DeepSeek 与传统统计方法(如 ROR 和 PRR,作为调用的技能)相结合,实现了对医疗器械不良事件监测数据的高效利用。DeepSeek 的自然语言处理能力能够有效规整非结构化数据,提高数据的可分析性;传统统计方法一般通过人工方式进行数据规整,虽然能够准确识别潜在风险信号,但效率低,遇到海量的不良事件数据时易漏掉风险信号。本研究构建的模型将数据规整时间由传统处理数据需数小时缩至数分钟,大幅度提升了工作效率,也解决了原始报告文本描述不规范导致的信号漏检问题,同时通过多维度的风险分析(如设计、材料、操作等环节),为监管决策提供更全面的参考。

3.1.2 数据分析智能流程设计,自动化程度高

上市后医疗器械不良事件的数据分析已成为该领域的研究热点 [15]。在信息化实现路径上,传统方法多依赖于从历史报告通过逻辑匹配方式构建关键词库,并以此为基础开展信号检测与风险预警 [16]。本研究设计了一个药物洗脱支架不良事件风险分析的智能流程,可自动提取数据、调用 DeepSeek 生成术语集、规整报告、多维度分析风险信号,集成了多步骤的监测数据分析流程和过程交互,兼顾了易用性、灵活性和全面性。该类方法在不同品类医疗器械中均能有效运行和验证 [6],具有良好的跨品类适用性。

3.1.3 利用人工智能进行深度风险评估

在当前监测机构普遍人手不足、人员知识面有限的情况下 [17],通过 DeepSeek 对检测出的信号进行深度风险评估,生成详细的评估报告,报告涉及故障原因分析、风险研判、调查建议和处置措施等内容,为监测机构提供了全面的评估信息,具有一定的推广和应用价值。在条件成熟的情况下,有望与相关信息系统集成或实时对接,实现自动化、智能化的风险预警功能。

3.2 局限性

本研究仍存在一定局限性:首先,DeepSeek 分析存在生成幻觉风险 [18],可能产生不符合医疗器械专业认知的结论;其次,当前方法未充分结合生物医学工程和临床医学知识库,对医疗器械材料特性、临床操作规范等关键因素的分析深度不足;最后,本研究采用比例失衡法进行信号检测在样本较小、未知使用基数等情况下可能会产生较大偏倚 [19]。这些局限可能影响分析结论的可靠性,后续研究将加强相关领域知识整合,建立防幻觉机制,并扩大样本量以提高分析准确性。

4 结论

本研究构建了一个基于 DeepSeek 的药物洗脱支架不良事件数据治理、风险信号检测和分析模型,通过利用 DeepSeek 自动建立术语集、进行结构化规整、采用比例失衡方法进行风险信号检测、自动对信号生成风险评估报告等步骤,实现了对医疗器械不良事件监测数据的高效利用和评估。实验结果表明,该模型可提高数据治理、风险信号检测和分析的工作效率,为医疗器械的安全监管提供科学依据。未来,将进一步优化模型性能、引入专业知识库提高分析精准度和缓解大语言模型幻觉 [20]

【参考文献】

[1]国家市场监督管理总局 , 国家卫生健康委员会 . 医疗器械不良事件监测和再评价管理办法 [EB/OL].(2018-08-13 ).https://www.gov.cn/gongbao/content/2018/content_5343748.htm.

[2]国家药品不良反应监测中心 . 国家医疗器械不良事件监测年度报告(2024 年)[EB/OL].(2025-07-31).https://www.cdr-adr.org.cn/ylqx_1/Medical_aqjs/Medical_aqjs_sjbg/202505/t20250519_51128.html.

[3]张博涵,蔡权周,杨燕妮,等 . PDCA 循环在医疗器械不良事件个例报告表质量管理中的应用 [J]. 现代医院,2024,24(5):707-710.

[4]赵精武, 窦志成, 杨洪源, 等 . 以 Deepseek 为代表的人工智能技术对学科发展的影响:工具创新与方法交融 [J]. 北京航空航天大学学报(社会科学版),2025,38(3):30-45.

[5]陈华 . Python 在数据分析中的应用 [J]. 上海轻工业,2024(3):108-110.

[6]肖育华,蔡权周,傅渊锋,等 . 基于 DeepSeek 的大语言模型智能体在医疗器械不良事件分析评价中的研究 [J]. 中国医学装备,2026,23(2):89-93.

[7]董放,杨建龙,康自新,等 . 2023 年版 IMDRF 不良事件报告医疗器械问题术语及其新增术语项分析 [J]. 中国医学装备,2023,20(2):198-204.

[8]滕颖影,李柴全,胥洋,等 . 真实世界数据在医疗器械上市后监测中的应用进展 [J]. 中国药物警戒,2022,19(3):233-238,243.

[9]黄琳,李霞,杨建卫,等 . 监护仪不良事件分析及比例失衡法在风险信号检测的应用 [J]. 中国医药导刊,2024,26(10):975-980.

[10]肖育华,蔡权周,傅渊锋,等 . 非均衡性测量法在一次性使用静脉采血针不良事件报告风险信号挖掘与分析中的应用 [J]. 中国医疗设备,2024,39(11):93-97,119.

[11]赵燕,李栋,程音婕,等 . 医疗器械上市后安全性数据来源和信号识别方法研究进展 [J]. 中国药物警戒,2023,20(2):236-240.

[12]OHYA M, KADOTA K, TADA T, et al. Stent fracture after Sirolimus-Eluting stent implantation 8-year clinical outcomes[J]. Circ Cardiovasc Interv, 2015, 8(8):e002664.

[13]李姝雅,王江友,张龙岩,等 . 冠状动脉支架断裂致极晚期支架内血栓形成1例 [J]. 中国循证心血管医学杂志,2024,16(1):110-111.

[14]李治国,冯海全 . 不同材质冠脉支架耦合变形机制研究 [J]. 稀有金属,2018,42(9):931-936.

[15]魏芬芳,吴建茹,吴文宇 . 应用 CiteSpace 对医疗器械不良事件研究文献的可视化分析 [J]. 中国医疗设备,2021,36(12):122-126.

[16]凌庆庆,王浩文,夏景涛,等 . 医疗器械不良事件报告自动分析软件的设计 [J]. 中国医疗设备,2024,39(2):90-94.

[17]罗万婷,温润龙,李亮华,等 . 广东省地市级药品不良反应监测机构存在问题及对策 [J]. 今日药学,2018,28(8):561-563,572.

[18]何静,沈阳,谢润锋 . 大语言模型幻觉现象的识别与优化 [J]. 计算机应用,2025,45(3):709-714.

[19]叶小飞 . 上市后药品不良反应信号检测方法的进展与思考 [J]. 海军军医大学学报,2022,43(2):117-122.

[20]曹荣荣,柳林,于艳东,等 . 融合知识图谱的大语言模型研究综述 [J]. 计算机应用研究,2025,42(8):2255-2266.

内容来源于《医疗装备》杂志,如需转载请注明出处。

《医疗装备》杂志社有限责任公司   版权所有   Copyright(c)2001-2017
ylzbzz.org.cn All Right Reserved    京ICP备17008523号-1   网站构建:Blovemedia