Rheumatol Int:人工智能是否已经具备替代经验丰富的风湿病学专家的能力?

2024-08-17 潘华 MedSci原创 发表于上海

GPT-4在一定程度上展示了在医疗决策支持中的潜力,但其表现仍不及人类专家。

风湿病的复杂性使得个体化治疗方案的制定对临床医生来说充满挑战。近年来,随着人工智能技术的发展,大型语言模型(LLMs)如ChatGPT逐渐显示出在医疗决策支持中的潜力。本研究旨在比较由ChatGPT-3.5、GPT-4以及风湿病学专家委员会(RB)生成的治疗方案,以评估其在安全性、指南依从性、医学适宜性、整体质量以及逻辑性等方面的表现。

本研究设计了20个涵盖不同风湿性疾病的虚拟病例,包括类风湿性关节炎、脊柱关节炎、混合性结缔组织病和血管炎等。通过标准化提示,分别向GPT-3.5、GPT-4和风湿病学专家委员会(RB)提问,生成相应的初始治疗方案和后续治疗方案,并提供相应的治疗理由。随后,四位来自不同风湿病学中心的资深风湿病学家,对这些治疗方案进行了盲评,使用5分Likert量表评估方案的安全性、指南依从性、医学适宜性、整体质量、逻辑性和完整性,并选择其整体偏好的治疗方案。数据分析采用Kruskal-Wallis检验、Spearman相关分析以及Fleiss' kappa检验等统计方法。

在160次评分中,风湿病学专家委员会(RB)生成的治疗方案在68.8%(110/160)次评分中被评为最佳选择,而GPT-4和GPT-3.5分别为16.3%(26/160)和15.0%(24/160)。GPT-4在初始治疗方案中表现优于GPT-3.5(13.8% vs 7.5%)。在所有评估维度中,RB生成的方案在指南依从性、医学适宜性、整体质量、逻辑性和完整性上显著优于GPT-3.5和GPT-4。在安全性方面,GPT-4的初始治疗方案与RB的方案无显著差异。进一步分析显示,LLMs生成的治疗方案在字符数上明显长于RB,且更为详尽。

治疗计划偏好(总治疗计划偏好显示在条形图中。 B 该表显示了各种决策,并针对个别案例的插图和评估者进行了颜色编码。 C 堆叠条形图显示了多数赞成 (LLM > RB) 或反对 (RB > LLM) LLM(GPT-3.5 和 GPT-4)的案例插图数量,以及导致平局的案例数量)

本研究表明,尽管ChatGPT-4和GPT-3.5能够生成安全且高质量的风湿病治疗方案,但它们在个体化决策和临床判断上仍无法替代风湿病学专家的角色。GPT-4在一定程度上展示了在医疗决策支持中的潜力,但其表现仍不及人类专家。

原始出处:

Vignette-based comparative analysis of ChatGPT and specialist treatment decisions for rheumatic patients: results of the Rheum2Guide study. Rheumatol Int (2024). https://doi.org/10.1007/s00296-024-05675-5

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (1)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=2220421, encodeId=ab9d222042168, content=<a href='/topic/show?id=d3a024808e0' target=_blank style='color:#2F92EE;'>#人工智能#</a> <a href='/topic/show?id=836c11e941a9' target=_blank style='color:#2F92EE;'>#风湿病治疗决策#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=158, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=24808, encryptionId=d3a024808e0, topicName=人工智能), TopicDto(id=117941, encryptionId=836c11e941a9, topicName=风湿病治疗决策)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=cade5395722, createdName=梅斯管理员, createdTime=Fri Aug 16 09:49:56 CST 2024, time=2024-08-16, status=1, ipAttribution=上海)]

相关资讯

【协和医学杂志】人工智能在医患共同决策中的应用

从开发和实施层面探讨AI决策辅助应用于SDM领域的潜在问题和挑战,提出可能的解决措施,为后续AI决策辅助的研发与实施提供参考。

Nature Medicine:人工智能与传统技术在IVF胚胎选择中的首次对决:效率提升与临床成效的探索

研究旨在评估深度学习算法是否能够在胚胎选择过程中达到或超过传统形态学评估的效果,同时探索其在提高操作效率、减少评估时间等方面的潜在优势。

【协和医学杂志】人工智能在胰腺癌诊疗中的应用

本文阐述国内外胰腺癌领域AI应用的最新进展,以期进一步推动AI技术在胰腺癌诊疗中的应用。

Diagnostics:人工智能对CBCT口腔成像中金属伪影的影响

研究人工智能(AI)降噪算法对口腔锥形束计算机断层扫描(CBCT)图像中金属伪影和图像质量参数的影响。

Nature:应对抗生素耐药性危机:五大策略助力抗生素革命

介绍了研究人员在应对抗生素耐药性危机方面所采取的五种创新策略。

Cureus:人工智能通过牙龈临床表现检测贫血研究

全世界有数百万人患有贫血症,贫血等全身性疾病危害口腔健康。本研究旨在评估三种不同的AI学习方法,利用患者牙龈的临床口腔内图片来自动检测贫血。

NAR:基于人工智能技术在非编码DNA中发现新型癌症驱动突变

这项研究颠覆了人们对DNA的传统认识,将研究视角扩展到了之前被忽视的非编码区域。

人工智能囊胚形态评估数据集构建与质控专家共识(2024年版)

本文以囊胚形态AI评估数据集构建、质量控制及评价的具体问题为导向,对数据集质量的表现形式进行解析,对囊胚形态AI评估智能产品相关的数据集构建过程给予示范及引导,旨在引导本领域数据集的科学有序发展。

人工智能在医学影像分析迈出重要一步!Nature子刊发表赵世华教授团队研究成果

基于人工智能的多中心、大样本的临床研究成果——《基于磁共振成像的人工智能筛选和诊断心血管疾病》,填补了人工智能在心脏磁共振诊断领域的空白。

问诊分析:28岁男博士查出微小结节,焦虑至此!极高分辨率CT用于筛查,到底带来的是益处还是坏处?

今天分享的这位结友才28岁,是一位博士,但就是由于此类微小结节搞得焦头烂额。