标签:大模型

Google DeepMind|强化学习中的概率推断

本文提出了一种基于贝叶斯处理的强化学习方法VAPOR,通过计算状态-动作对在最优策略下的后验概率来生成有效的探索策略。VAPOR方法具有与其他算法的强连接,并...

用视觉来做Prompt!沈向洋展示IDEA研究院新模型,无需训练或微调,开箱即用

IDEA研究院展示了基于视觉提示(Visual Prompt)模型的最新研究成果,该模型使用视觉来进行Prompt,只需手动框选目标即可实现目标检测,这是一种新的目标检测...

微软|多模态基础模型:从专家到通用助手

本文全面综述了现代多模态基础模型,包括视觉理解、视觉生成、统一视觉模型和与大型语言模型的训练/串联等方面。它倡导从开发特定用途的多模态模型,向能遵循...

书 |《人工智能基础数学:高效和成功人工智能系统数学》605页 | 2023年Hala Nelson编写

本指南介绍人工智能领域所需的基本数学知识,如回归、神经网络、优化、反向传播、卷积、马尔可夫链等。它专注于现实世界的应用,适合工程师、数据科学家和学...

ACC-UNet | 致敬ConvNeXt,全卷积结构UNet设计,超越SWin-UNet!

前研究工作旨在将传统的卷积神经网络与Transformer相结合,提出了一种新的网络架构Convolutional Transformer Network(CTN)。该架构在医学影像分割任务上进...

215篇【大模型医疗】论文合集(附PDF)

ChatGPT是一种生成式大模型技术,引发了医疗领域的热潮。通过大规模的数据和模型训练,医疗大模型可以预测、诊断和治疗各种问题。215篇医疗和大模型的论文供...

长文本信息准确率超过ChatGPT,Meta提出降低大模型幻觉新方法

Meta AI实验室提出了一种名为“验证链”的解决方案,用于解决大模型幻觉问题。该方案使得Llama-65B输出的信息准确率提升了一倍,超过了ChatGPT。大模型幻觉是指...

DualToken-ViT | 超越LightViT和MobileNet v2,实现更强更快更轻量化的Backbone

自注意力视觉Transformer(ViTs)已成为计算机视觉领域的有竞争力架构。与卷积神经网络(CNNs)不同,ViTs能进行全局信息共享。但其二次复杂性使ViTs计算密集...

刷榜13个暗光增强基准!清华大学联合ETH等开源Retinexformer:亮、暗都有细节 | ICCV 2023

Retinexformer架构可以端到端、单阶段解决过曝、伪影、低光等图像增强问题,超越了目前的暗光增强sota模型。该架构基于Retinex理论,但考虑了隐藏在黑暗中或...

大模型的最大bug!回答正确率几乎为零,GPT到Llama无一幸免

近乎为零,甚至还会给出完全错误的答案。这个现象被称为逆转诅咒,是指当模型在训练过程中接收到的数据具有一定的规律性时,模型会过度依赖这些规律性,从而...
1 2 3 4 21