标签:自然语言处理

数学能力超ChatGPT!上海交大团队登开源榜首

上海交大GAIR实验室发布了一款名为Abel的国产数学大模型,准确率高达83.6%,在开源模型中排名第一。该模型以挪威数学家尼尔斯·阿贝尔的名字命名,向他在代数...

GPT-4被曝重大缺陷,35年前预言成真!所有LLM正确率都≈0,惹Karpathy马库斯惊呼

一项研究发现,大型语言模型存在一种“逆转诅咒”,即使学习了“A是B”,它们也无法推理出“B是A”。这意味着,这些模型在处理自然语言时可能存在一些限制和缺陷。...

15小时、几千元训完中文版LLaMA2!低成本方案全面开源,包含代码权重,支持商用

QbitAI公众号发布了一篇文章,介绍了他们使用15小时、几千块钱、85亿token数据训练出中文LLaMA2的方案。该方案完全开源,包括全套训练流程、代码及权重。这个...

2023推荐系统论文合集

近年来,推荐系统成为热门话题,特别是在WWW会议上,其中70多篇接收论文与推荐系统相关。WSDM、AAAL、ICLR2023等会议上也有108篇推荐系统方向的论文。推荐系...

大模型前沿热点最新综述:大模型微调遗忘、Agent智能体、幻觉及RAG检索增强模型推介

本文介绍了当前大模型研究的热点问题,包括大模型微调遗忘问题、RAG检索式生成综述、Agent智能体综述以及大模型幻觉的综述。这些工作都具有一定的参考意义,...

​WWW 2023 | 药物组合推荐新方法—MoleRec

机器学习的预测模型在临床决策中具有巨大潜力,能够提高决策的准确性和安全性。这类模型通过分析大量的个人医疗数据,为医疗专家提供更准确的疾病诊断和治疗...

结束与开始:为什么 NLP 中间层一定会消亡?

本文摘要:Dan Klein在Simons Institute的LLM研讨会上发表演讲,解答了“中间层消亡史”并探讨了LLMs是否是NLP的开始或终结。通过宏观角度解释,文章得出结论。

Code Llama:Llama 2 学会写代码了!

Hugging Face 生态系统已全面支持 Code Llama,这是一组专为代码类任务而生的最先进、开放的 Llama 2 模型。Code Llama 可商用,使用与 Llama 2 相同的社区许...

贝叶斯优化 | Matlab BO-LSTM贝叶斯优化长短期记忆网络分类预测

该文章介绍了作者的个人主页Matlab科研工作室以及其主要研究领域,包括智能优化算法、神经网络预测、雷达通信、无线传感器、电力系统信号处理、图像处理和路...

「人与场景交互生成」新突破!天大、清华发布Narrator:文本驱动,自然可控|ICCV 2023

生成HSI的方法存在一些限制,如需要大量标注数据和复杂的人工操作。因此,研究人员提出了一种名为Narrator的新方法,可以从文本描述中自然可控地生成HSI,适...
1 6 7 8 9 10 16