视觉

是机器学习的范式和方法论之一,是智能体与环境不断交互,从而不断强化自己的决策能力的过程

MIT新研究:打工人不用担心被AI淘汰!成本巨贵,视觉工作只有23%可替代

MIT计算机科学与人工智能实验室的一项研究发现,企业不会因为成本太高而使用视觉AI取代人类工人,因此人类不必担心AI会很快夺走他们的工作。

Fashion AI|春节穿搭指南!看塔玑演绎初一到初五不重样穿搭!

本期Fashion AI栏目主题为春节穿搭,介绍了五种风格,让你的春节每一天都闪耀。其中,初一迎春纳福穿上饱含中国元素的马面裙,添一点金色配饰更显高贵典雅;...

内容整理人员招募|图机器学习峰会等

DataFun正在招募内容整理志愿者,工作内容包括挑选议题、对照整理资料,并在两周内提交稿件。志愿者将获得DataFun会员卡,可以免费获得视频回放、海量PPT等专...

开源 | 视频尺寸魔方:分层遮掩3D扩散模型在视频尺寸延展的应用

本文介绍了一种新颖的基于扩散模型的视频尺寸延展方法,称为分层遮掩3D扩散模型。与图像延展不同,视频延展需要考虑填充区域的时序一致性,这使问题更具挑战...

Yoshua Bengio演讲、NeurIPS对齐工作坊:避免AI灾难性风险的技术与协调挑战

第二届AI对齐工作坊在新奥尔良的NeurIPS会议期间举办,由非盈利性研究机构FAR AI主办,邀请了来自工业界和学术界150余位AI研究者就AI安全和对齐相关的研究主...

开门学术活动 | 城市大模型论坛——城市智能:从规划到具身

摘要:研究表明,新冠病毒能够在室内空气中存活长达16小时,对于预防病毒传播,室内通风非常重要。建议使用高效空气过滤器和增加室内空气流通性,同时减少人...

社区供稿 | 图解大模型推理优化之 KV Cache

本文介绍了KV Cache这种大模型推理加速的方法。KV Cache通过缓存Attention中的K和V来减少推理时间,同时提高推理效率。这种方法可以应用于各种大型模型中,例...

社区供稿 | 多轮对话推理速度提升 46%,开源方案打破 LLM 多轮对话的长度限制

麻省理工的研究人员最近推出了一种名为StreamingLLM的大型语言模型,该模型能够在不影响推理速度和生成效果的情况下,实现多轮对话总共400万个token的流式输...

社区供稿 | LMDrive: 大语言模型加持的闭环端到端自动驾驶框架

摘要:LMDrive是一个接收语言指令和多模态多视角传感器数据的框架,可实时输出决策控制信号以适应各种驾驶场景。大语言模型(LLM)是2023年最重要的人工智能...

北大、斯坦福、Pika新研究:“文生图”好过DALL·E 3和SDXL

北大、斯坦福、Pika最新研究表明,“文生图”比DALL·E 3和SDXL更好玩的AI。该研究使用了官方媒体和网络新闻的10个素材来源,发表于2024年1月26日。
1 2 3 12