找回密码
 注册

微信登录,快人一步

QQ登录

只需一步,快速开始

公告区+ 发布

01-11 22:45
01-11 22:43
01-07 16:18
01-06 15:55
01-03 17:36
01-03 09:00
01-02 17:30
查看: 71|回复: 2

医务人员怎样合理使用生成式人工智能

[复制链接]
发表于 2024-12-27 15:19 | 显示全部楼层 |阅读模式
专家笔记
内容分类: 其他 
会议类别: 国家级
举办日期: 2024年
专家名称: 应峻
会议名称: SIFIC年会

马上注册登录,享用更多感控资源,助你轻松入门。

您需要 登录 才可以下载或查看,没有账号?注册 |

×
本帖最后由 nionline 于 2024-12-27 15:34 编辑

讲者丨应峻(复旦大学)
整理丨蓝雪0816
审核丨王玉兰
来源丨SIFIC 2024“全国感控与耐药感染”联合大会


目前科技领域最火爆的话题就是人工智能,人工智能在各个领域都有应用,医疗领域亦不例外。在SIFIC 2024“全国感控与耐药感染”联合大会上,复旦大学的应峻教授从生成式人工智能在医学领域的应用、临床医生如何使用、注意事项和人工智能在IDC的实践与探索四个方面进行了详细的介绍。

                               
登录/注册后可看大图


01 生成式人工智能(GenAI)在医学领域能做什么

(一)学术论文使用GPT生成图片被撤稿
在国内有吃螃蟹的医生。第一篇文章来自西安交通大学某医院,研究内容非常正常,但是这篇论文很短命,发表三天后就被撤稿,原因是插图中大鼠的身体结构不正常,其他图片里还出现了面包、甜甜圈、番茄、面条等。第二篇撤稿的论文来自广东省水电医院,论文插图中胳膊和腿上的骨骼数量错误。作者也做了一些解释,但承担后果的仍是这位医生。国内已经把GPT使用、GPT撰写学术论文并且不做任何声明的,被判定为学术不端行为,所以请大家引以为戒。


目前,人工智能可以来识别哪些东西是人工智能生成的,并且Open AI把它生成的图片打上“记号”,一看就知道哪些图片是来自生成式人工智能。如果让机器帮你写的,机器也可以反过头来识别出来有多少是它写出来的。所以,不要有任何侥幸心理,如果发表了人工智能生成的文章,若干年后会被发现。


(二)GenAI最炸裂的应用
1.AlphaFold 3
人工智能能做很多人类做不到的事情。比如说在生物医药领域最炸裂的应用就是AlphaFold 3。下面这张AlphaFold 3图中,蓝色部分是冠状病毒的蛋白,绿色部分是抗体,黄色部分是单糖,计算机模拟显示了药物和蛋白结合的过程。实际上它的真实状态的结构是灰色结构,看到GenAI模拟出来的基本是一模一样。现在也有专门用于蛋白质的大模型,它可以模拟自然界五亿年的进化。

                               
登录/注册后可看大图


2.基因编辑
另外一个比较炸裂的应用是基因编辑工具,人工智能生成的基因编辑的工具,已经被证明有些比自然界自然生成的效果还要好。

                               
登录/注册后可看大图


有了GenAI后,凡是机器可以做的活,人类起的作用已经越来越小了。但是临床医生的工作暂时机器还替代不了。科学家们到现在也不了解GPT的工作原理,类似GPT这种人工智能的工具存在一个黑箱问题,有的时候看它挺正常的,会突然不正常。例如,七月初突然发现GenAI有个漏洞,它竟然比较不了类似于10.1和10.9的大小,基本所有的人工智能工具全部答错了,它们认为10.1比10.9大。这样的错误都能犯,不可能让它去面对真实的病人。人类并没有完全了解GPT的工作过程,它有黑箱问题,会产生错误,也会延续刻板印象,还会泄露隐私。所以,GPT暂时还取代不了医生。


(三)临床应用-辅助影像诊断
人工智能发展这么多年,发展得最好的是辅助影像诊断。影像诊断相对来说比较固定,但是在医院里拿到的影像诊断报告,你真相信是人工智能做出来的吗?人工智能只是辅助,它给一些提示。阿里的一个比较好的研究,在回顾病史时发现了以往人工判断而没有判断出来的胰腺癌,挽救了该病人的生命。人工智能所做的工作是辅助影像诊断。


JAVA上发表的眼科文章,GenAI诊断的准确率也只有70%,病人能够容忍准确率只有70%医生的吗?虽然它在影像方面发展得比较好,但也并不尽如人意。


(四)临床应用-辅助患者咨询
GenAI当不了医生,但类似GPT这种人工智能来解答患者的咨询时,其效果比医生咨询要好。机器没有情感,不会生气,不会像医生被病人刺激了会情绪不稳定,它会一直以非常好的态度对待患者的咨询。


GenAI可以随时进行计算,在回答问题的时候,结合个人病史,把其他所有的病在脑中过一遍。虽然证明GenAI做咨询做得比较好,但是哪家医院敢放机器出来回答患者的问题?万一答错了,医院承受不了错误的风险。所以,它所做的也是辅助患者咨询,做医生的助手,提示医生帮助医生去回答问题。但是还没有哪家实体医院直接让AI回答问题。


(五)科研应用-辅助论文写作
GenAI能用来写论文吗?写文章可以,但是文章不署你的名。有一位编辑就给大家画了一个大坑。它在nature上发了一篇文章告诉大家,有三种方法让chat GPT帮助人们进行学术写作。它分享了三个方面应用:
1. 精炼学术写作:可以让你的上下文变得更清晰、更专业、更连贯;


2. 提升同行评审的效果:用GPT来做同行评审,效果是比较好的。它可以模拟一个资深的审稿人,用它来跟作者沟通,效果比较好。问题是它的身份是编辑,可以指出错误,如果用了GPT,被撤稿的是你。可巧的是,几天后nature发了一篇文章告诉大家,chat GPT已经占领了同行评审(peer review)这个市场。研究发现,因为chat GPT参与到同行评审中,医学文献的质量和可靠性已经受到了干扰,可能涉及包含敏感信息的未发表的稿件,已经被这些审稿人在不经编辑和作者同意的情况下提供给了大模型工具。


大模型工具会客观、独立、完全顾及你的隐私吗?用于大模型训练的那些数据来自哪里?不是它家的,都是你们给它的,给了它就等于给了全世界。请GPT或者类似工具进行论文审稿,无异于把你的一篇文章放到淘宝上去查重,结果可能是你的文章还没发表,窃取你文章的那个人抢先发表了文章。这样的纠纷不止一次,所以请大家务必注意。这些杂志为什么能发这些文章出来?它们动手比较早。等你再发这样的文章,就必须标注哪些用了人工智能工具的辅助。

3. 在科研工作中,GPT到底被用在了哪里?
nature上今年年初发了一篇文章,统计了1600名科学家,其中30%的人用它辅助写论文,15%的人用它来撰写基金,55%的人认为它主要的好处是帮助非英语母语的研究人员编辑和翻译写作。这样做好像也没错,但是前面被撤稿的两篇被判定成学术不端。


GenAI是一个智者,你可以跟它聊,可以用它的idea,但是不能直接照搬它的东西。举例:大家认为张文宏老师是位很有名的专家,想写一篇论文或者有一个项目去咨询他的意见,他会给一些启发。他给的启发或意见,变成自己的idea,变成自己的观点写在论文里,或者在申请项目的时候用到这些观点,需要把张文宏老师列成作者吗?相信你不会,他也不会有意见。对GPT的使用也是如此,把它当成一个智者,可以向它请教,它也可以给你意见,但是它不负责,也不能把它列为作者。你不能直接采用,因为它能识别出是GPT生成的。


(六)国内GenAI开发进展和探索性应用
目前国内效果最好的大模型是来自清华的ChatGLM-智谱清言,它相应地也推出的工具叫“智谱清言”,参数级比较大,而且稳定性比较好。


在医学方面,国内也有一些比较好的研究。清华发了一篇智能体医院的文章,医院的医生、病人、护士都是假的,它们通过一些数据在训练自己,在不断地进化,但是很不幸,它用的大模型是GPT的,没有用清华的。


国内最新的进展是向两个方向发展:一个是智能体AI agent。这些智能体能够接收外界的反馈,自我净化,并且来执行这些操作。另一个是GPT的类似物GPT s。它是GPT符合某些需要而做的定制,够不上智能体,只能被认为是一个GPT s的类似物。

02 临床医生如何快速使用GenAI

1.国内部分人工智能软件
国内的一些人工智能软件不用翻墙,有免费版本,使用还不错。比如kimi用起来比较方便,国内这些大模型和GPT一样,绝对不是专门训练某一方面的能力,而是训练所有的能力。一家公司的一个产品强,必然所有产品都强。目前的这些工具大部分来自国内的一些互联网大厂,比如阿里、字节、抖音的,能干各种各样的活。对于我们来说,可能是在合适的时间选择合适的工具来干想让它干的工作。

                               
登录/注册后可看大图


使用GenAI时关键是看怎么去问它,如何提问也是一门学问。很多课程去教你怎么构建你的prompt,怎么对大模型去提问。新加坡政府科技数据局和AI团队创立的一个模型,它叫CO-STAR,CO-STAR限定了你怎么向大模型去提问,它适用于任何一个大模型。


CO-STAR分成几个方面,如果落实到科学研究角度的话,就可以理解成我是谁,我要做什么,我的研究目的是什么,输出内容是怎样的形式的,并且用怎样的语调呈现,你的受众是谁,用表格形式还是用多少文字的形式呈现,都明确地告诉它,才会比较正确地回答出你的问题。

场景1:国内可以用哪个人工智能呢?
“秘塔”和“天工”的搜索比较好。“秘塔”是没有广告的百度。在秘塔搜索时,会发现原来要付费的东西在这里不付费了,且没有广告,还会问你搜全网、文库还是学术;搜完了会帮你理出来,理出思维导图,还可以让它帮你精简变成多少字,关键是给出了来源,从哪里找来的。所以,很多人认为国内的人工智能的工具很像一个搜索引擎,好处是比较一本正经,胡说八道概率比GPT小一点。


“天工”也是一样的,想要多少字?它给你分析成多少字。
当然,智能体在手机端或者其他端的时候,会进化出类似于GPT s一样的很多“小玩意儿”,是工具中演化出来帮你干事的,如“公文笔杆子”,专门帮你写公文的。它是把大模型进行了prompt的包装,告诉它想要怎样的。这种智能体都适合干不同的活。在你的工具里面直接@它或者点它就可以了,一般手机端都可以。

场景2:了解医学领域的最新研究进展
GenAI能帮我们了解医学领域的最新研究进展,是不是直接问GPT、秘塔、天工等工具就行了,不用文献检索课了?还不可能。希望GPT能表现较好,搞了很完美的prompt(请求)来提问国内外的这些工具。想要了解Pubmed里的最新研究进展,中文工具比较“诚实”,kimi和秘塔会老实地告诉“查不了”。


国内外的任何一个专业数据库都不愿意跟这些大模型合作。因为一旦这些大模型GPT能访问Pubmed,就没人去访问Pubmed了。GenAI结合这些数据能干掉所有的数据库,其他的数据库能答应吗?所有的数据库包括Pubmed都不允许大模型直接访问。所以文献检索课可以继续讲授。


如果问GPT,它不说“查不了”,它会一本正经地告诉你2020年以来的重要的进展:一篇来自BMJ,另一篇来自CLINICAL TRIALS。实际上查不了pubmed。如果一定想查pubmed,比如说Elicit,会绕过了pubmed,用一个其他工具“偷偷”访问pubmed。帮你总结在pubmed里搜索出来的几篇重要文献,方法、干预措施、研究的重点等,总结得非常好。在pubmed里找到你想要的文献,然后导出文摘格式文件,把文件交给人工智能工具,它可以帮你总结出来这几篇文章的异同、研究热点和研究缺陷,有何启发。它解决了下一个场景阅读的专业文献、总结,这才是它适用的场景。

场景3:阅读专业文献并总结
GenAI帮你读文献的功能是任何一个人目前替代不了的。因为它能一次读20份20万字的长文档,可以一次读1000页的PDF文件。所以,带着自己的专业文献来用这些工具。这些工具的能力不会单独体现在某一方面。比如说“通义”人工智能,可不是简单地读文档,如参加会议需要实时记录,用“通义”后,点“实时记录”,它就会全程听会,还会区别几个讲者,会后会议纪要马上就出来。要求多少字,什么格式,会马上输出。这些大模型都是用图像处理单元(GPU)的,它有显卡,可以多个任务一起处理,很快完成所交的任务。它算的速度绝对比你快,直接给它音视频,它帮你总结出来。


在阅读论文时,把论文交给它,它马上告诉你论文的方法是什么。它不是简单的翻译,而是把它提炼出来,还可以生成脑图,生成笔记,还可以缩写成500个字。但是,它只负责写,不负责任,不愿意成为作者。


读书的能力更强大。它可以一次阅读不超过20万字、不超过1000页的PDF,它马上把这本书里的内容全部读出来。关键是还能跟你聊,可以一边读一边问它,它可以结合这本书的内容,再结合它的知识储备给你一些答案。很多人看到GPT出来以后,感叹文科类发文章更难了。因为GPT想得太多了,而文科文章很多是靠想出来的。医科和理科则是需要的idea,目前它不可能完全替代你。

场景4:陪我一起读文献
当审稿人、出题都是类似这样的功能。看了大量的文献以后,可以出考研的试题,考研、四六级、高考的重点知识点,都能理出来。还可以跟你一起讨论,它像一个专家、审稿人,甚至可以把文章交给它,对它说:如果你是站在审稿人的角度,提出修改意见。问题是把论文交给它,就做好把这篇文章贡献给它的准备!

场景5:外语写作中检查错误
修正语法,推荐大家写作时,用它来检查修正语法错误,会给一些建议,可以采纳,也可以不采纳。但不建议直接用它写作。可以探讨大纲,然后进行修改,不能直接让它写。推荐给大家的工具不是GPT,而是“grammarly”。好处:可以只看、写,不直接动手。把动手权交给你。可以提建议,告诉哪里有问题,可以选择改,也可以选择不改。所以,目前直接用“grammarly”普通版本的,可能不会被认定为学术不端,如果用了人工智能版本,只是让它进行语法润色,结果进行改写,就有可能会被认定为学术不端。不推荐AI学术写作!

场景6:参加学术会议
参加学术会议一般有两个诉求:一个是参加别人的会议,很想快速地梳理出来或者想做会议纪要;另外一个是听了会议或者有别人国外的会议前言,想把它传达给听众,不可能直接把东西移植过来,怎么办呢?可以结合几个工具,经过改动把别人的变成你的。


示例的工具是用三个工具结合,比如用自己科普的一段素材,做一个肾脏病科普。把这段录像给“通义”,让它把语音转成文字。又把文字给“智谱清言”或其他工具,让“智谱清言”把这段文字做成PPT的大纲,这样做出来的PPT大纲跟原来的可能不完全一样了。有了这个大纲,可以让它扩写成讲稿,也可以让它换一种说法。然后把这个讲稿给“讯飞智文”。“讯飞智文”是现在看到的国内做PPT最好的人工智能工具。它可以做个70分的PPT,去修改内容,然后让它“开始”,直接可以生成一个PPT,下载下来修改。

场景7:移动设备上快速浏览和理解文献
现在手机用得多,很多时候文献的快速阅读是在手机端进行。有可能就发一篇文章给你或者一个链接或者一个公众号,手机客户端可以直接帮你把这篇文章给读了。像“智谱清言”,直接把文章给它,它就会告诉这篇文章是干什么的,研究方法是什么,局限性是什么;还可以跟它深度聊;kimi就更强大了,直接把这篇文章给它,在手机这个文档的右键就会出现kimi智能助手。直接用智能助手把它打开,它就直接帮你阅读这篇文献。帮你把几篇文献一起汇总。好处在于同时读多篇文献,并且对它进行汇总。

场景8:海报设计
GenAI还能画画、做视频,也能唱歌。2024年SIFIC年会的主题曲也是人工智能谱曲和人工智能唱出来的。在用GenAI时,如果涉及谱曲\做视频,需要付费。可以用“智谱清言”或者任何一个手机客户端免费的版本做通用的海报。有一点要提醒大家,虽然现在GPT进化到了可以局部修改海报,但是中文海报,建议大家一次性地把要求说清楚。因为让它修改的时候,它可能发病,乱来了。要原谅它,它还很年轻,如果做简单的活动,不是用于学术发表的,是足够的。


如果还是想在国内用GPT,怎么办呢?首先不赞成翻墙,但若使用必须得翻墙,还需要outlook邮箱在GPT上进行注册。注册的好处是能把原来的对话保留,随着时间记忆,它可以知道你的喜好和习惯,还可以用GPT的高级版本,现在最新的是GPT-4o。

03 临床医生使用生成式人工智能的注意事项

1.GPT们太聪明了,聪明到什么程度呢?它给的所有回答都是根据前面的词猜出来的。让它去帮找一些文献,它列了五篇参考文献,但五篇参考文献全部是编出来的,像真的。作者叫smith A、johnson B,如果不仔细看,问题可能看不出来。所以,前面讲到被撤稿的文章,参考文献有的是找不到的,很可能是GPT编出来的。因它查不了Pubmed。这就是取代不了人的更重要的原因。


2.2025年1月1日正式启动《学位法》。如果用人工智能代写论文要撤销学位。请大家一定注意。


3.全球的国际医学编辑委员会(ICMJE)今年年初更新了对人工智能生成内容的观点。首先,要求作者披露是否使用了人工智能辅助技术。如果用于写作辅助,要在致谢中感谢它;如果用于数据收集分析图表生成,要在方法学中进行描述。这些都不能成为作者,因为它负不了责,负责任的是作者;且要能够断言没有抄袭,包括AI生成的文本和图像。所以,请大家注意,它虽然让你声明。但是后面有一条必须断言你的论文中没有AI生成的文本和图像,也就是明确地告知,人工智能不能用于写作。


4.中华医学会杂志社对AIGC的态度是根据国外的医学编辑委员会的态度来制定的,告诉可以用,但是要保证数据的可靠性,不能将GenAI署名作为作者,也不能撰写论文的主要部分。在评审过程中严禁使用生成式人工智能,即审稿人不可以用生成式人工智能来审稿。


5.数据安全和隐私保护问题
不可以不经过你单位的同意,把单位的病历数据给GPT,不能把病人的隐私暴露在国外的工具当中;不可以把研究数据给GPT,让它分析;如果是非本地的应用,也是不可以的。因为数据给了它,就给了全世界,违反了《中华人民共和国保守国家秘密法》。


6.人工智能在使用时和人类价值观的冲突问题。循证医学告诉我们,所有的决策必须结合病人的实际情况和病人的利益。人工智能可以做到吗?人工智能都不能保证出来的东西是科学的、合理的,它怎么保证跟人类的价值观一致呢?所以,人工智能目前直接使用于病人的,在现实生活中基本没有看到,只是作为医生的助手发挥作用。

04 SenAI 在IDC的相关工作

IDC(传染病诊治中心)去年尝试用人工智能发热助手,来提升基层医疗机构的诊断效率,是为了在应急情况下能够快速分诊。对医疗资源还不是很充分的地方,通过病人情况的输入,给临床医生一定的提示,帮助他做出更好的诊断,更快地生成电子病历。其中用了国产的大模型,还用了生成人工智能结合Advanced RAG*(检索增强生成)技术。


将本地的知识库和大模型能力结合起来,该系统在华山北院的病房试用过,对一般性疾病、常见疾病的效果比较好。问题在对一些疑难疾病还有缺陷。所以,IDC同时也在做疑难病例库,发热待查的疑难病例库,希望通过疑难病例库来改进人工智能发热助手工具,提升对疑难病症的诊断能力,在应急情况下能够快速分诊,快速诊断,科学治疗。


    小结
AI是取代不了医生的,但是,熟练掌握人工智能工具的医生可能会取代那些不会用人工智能工具的医生,因为它的工作效率比单纯用人工要高效很多。希望大家能够掌握好人工智能工具,让人工智能助力科研教学及研究工作。


AI还不能取代人类,但有些时候人会被熟练掌握AI工具的人取代!

欢迎投稿:sific2007@163.com(来稿请注明SIFIC科普笔记投稿)

回复

使用道具 举报

发表于 2025-1-2 08:45 | 显示全部楼层
谢谢应峻老师的分享
回复

使用道具 举报

发表于 2025-1-7 12:06 | 显示全部楼层
谢谢老师的分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册 |

本版积分规则

快速回复 返回顶部 返回列表