Loading...

PMC-LLaMA: 用医学论文微调LLaMA

大模型1年前 (2023)发布 智源社区
801 0 0

PMC-LLaMA: Further Finetuning LLaMA on Medical Papers

本文提出一种基于生物医学文献的预训练语言模型PMC-LLaMA,通过对LLaMA模型进行微调,注入医疗知识以增强其在医疗领域的能力,从而提高其在医疗问答基准测试中的表现。

解决问题

论文旨在解决在医学领域中,大型语言模型(LLMs)由于缺乏领域特定知识而表现不佳的问题。作者通过在4.8百万篇生物医学论文上进行微调,提出了一个新的开源语言模型PMC-LLaMA,以进一步注入医学知识,增强其在医学领域的能力。

  • 动机:大型语言模型在多个领域表现出了卓越的自然语言理解能力,但在医疗领域的精度要求较高的任务中表现不佳,原因是缺乏领域特定的知识。
  • 方法:通过对LLaMA模型进行微调,注入医疗知识以增强其在医疗领域的能力,从而提高其在医疗问答基准测试中的表现。使用4.8百万篇医学学术论文进行微调,得到了一个新的基于医疗领域的模型PMC-LLaMA。
  • 优势:PMC-LLaMA模型表现出更好的医疗领域特定概念的理解能力,其在医疗问答基准测试中的表现也更好。

PMC-LLaMA: 用医学论文微调LLaMA

关键思路

文章的关键思路是通过在大量医学论文上进行微调,将LLMs注入医学知识,以提高其在医学领域中的表现。相比当前的研究状态,该论文的新意在于提出了一种新的解决方案,以提高LLMs在医学领域中的性能。

其他亮点

该论文的亮点在于作者提出了一个新的开源语言模型PMC-LLaMA,并在三个生物医学问答数据集上进行了初步评估,表现出更好的医学领域特定概念理解能力,从而在QA基准测试中取得了高性能。该模型和代码以及在线演示均已公开发布。该论文的工作值得进一步深入研究。

关于作者:该论文的主要作者是Chaoyi Wu、Xiaoman Zhang、Ya Zhang、Yanfeng Wang和Weidi Xie。

Cooperative Medianet Innovation Center, Shanghai Jiao Tong University、Shanghai AI Laboratory

项目地址:

https://github.com/chaoyi-wu/PMC-LLaMA 

https://arxiv.org/pdf/2304.14454.pdf 

相关研究

近期其他相关的研究包括“BERT for Clinical Text Classification: Is Finetuning Really Necessary”(作者:Yanshan Wang、Shuangyin Wang、Xiaolong Wang、Jingyu Liu、Tianxing Wu,机构:香港中文大学)、“ClinicalBERT: Modeling Clinical Notes and Predicting Hospital Mortality”(作者:Zhiqing Sun、Yue Wang、Xiaolong Wang、Tianxing Wu,机构:香港中文大学)等。

论文摘要

在医学领域,精度至关重要。然而,大型语言模型(LLMs)由于缺乏领域特定的知识,通常在日常对话或问答场景中表现良好,但在医学应用中表现不佳。本文介绍了PMC-LLaMA,这是一个开源的语言模型,通过在480万篇生物医学学术论文上微调开源语言模型来注入医学知识,增强其在医学领域的能力。我们在三个生物医学问答数据集上进行了初步评估,包括PubMedQA、MedMCQA和USMLE,结果显示我们的模型经过微调后,即PMC-LLaMA,对生物医学领域特定概念有更好的理解,从而在问答基准测试中表现出高水平的性能。该模型和代码以及在线演示均可公开获取。

PMC-LLaMA: 用医学论文微调LLaMA

© 版权声明

相关文章

暂无评论

暂无评论...