视觉 | Ai导航

MIT新研究：打工人不用担心被AI淘汰！成本巨贵，视觉工作只有23%可替代

MIT计算机科学与人工智能实验室的一项研究发现，企业不会因为成本太高而使用视觉AI取代人类工人，因此人类不必担心AI会很快夺走他们的工作。

智源社区

2年前 (2024)

Fashion AI｜春节穿搭指南！看塔玑演绎初一到初五不重样穿搭！

本期Fashion AI栏目主题为春节穿搭，介绍了五种风格，让你的春节每一天都闪耀。其中，初一迎春纳福穿上饱含中国元素的马面裙，添一点金色配饰更显高贵典雅；...

智源社区

2年前 (2024)

内容整理人员招募｜图机器学习峰会等

DataFun正在招募内容整理志愿者，工作内容包括挑选议题、对照整理资料，并在两周内提交稿件。志愿者将获得DataFun会员卡，可以免费获得视频回放、海量PPT等专...

智源社区

2年前 (2024)

开源 | 视频尺寸魔方：分层遮掩3D扩散模型在视频尺寸延展的应用

本文介绍了一种新颖的基于扩散模型的视频尺寸延展方法，称为分层遮掩3D扩散模型。与图像延展不同，视频延展需要考虑填充区域的时序一致性，这使问题更具挑战...

智源社区

2年前 (2024)

Yoshua Bengio演讲、NeurIPS对齐工作坊：避免AI灾难性风险的技术与协调挑战

第二届AI对齐工作坊在新奥尔良的NeurIPS会议期间举办，由非盈利性研究机构FAR AI主办，邀请了来自工业界和学术界150余位AI研究者就AI安全和对齐相关的研究主...

智源社区

2年前 (2024)

开门学术活动 | 城市大模型论坛——城市智能：从规划到具身

摘要：研究表明，新冠病毒能够在室内空气中存活长达16小时，对于预防病毒传播，室内通风非常重要。建议使用高效空气过滤器和增加室内空气流通性，同时减少人...

智源社区

2年前 (2024)

社区供稿 | 图解大模型推理优化之 KV Cache

本文介绍了KV Cache这种大模型推理加速的方法。KV Cache通过缓存Attention中的K和V来减少推理时间，同时提高推理效率。这种方法可以应用于各种大型模型中，例...

智源社区

2年前 (2024)

社区供稿 | 多轮对话推理速度提升 46%，开源方案打破 LLM 多轮对话的长度限制

麻省理工的研究人员最近推出了一种名为StreamingLLM的大型语言模型，该模型能够在不影响推理速度和生成效果的情况下，实现多轮对话总共400万个token的流式输...

智源社区

2年前 (2024)

社区供稿 | LMDrive: 大语言模型加持的闭环端到端自动驾驶框架

摘要：LMDrive是一个接收语言指令和多模态多视角传感器数据的框架，可实时输出决策控制信号以适应各种驾驶场景。大语言模型（LLM）是2023年最重要的人工智能...

智源社区

2年前 (2024)

北大、斯坦福、Pika新研究：“文生图”好过DALL·E 3和SDXL

北大、斯坦福、Pika最新研究表明，“文生图”比DALL·E 3和SDXL更好玩的AI。该研究使用了官方媒体和网络新闻的10个素材来源，发表于2024年1月26日。

智源社区

2年前 (2024)

视觉

MIT新研究：打工人不用担心被AI淘汰！成本巨贵，视觉工作只有23%可替代

Fashion AI｜春节穿搭指南！看塔玑演绎初一到初五不重样穿搭！

内容整理人员招募｜图机器学习峰会等

开源 | 视频尺寸魔方：分层遮掩3D扩散模型在视频尺寸延展的应用

Yoshua Bengio演讲、NeurIPS对齐工作坊：避免AI灾难性风险的技术与协调挑战

开门学术活动 | 城市大模型论坛——城市智能：从规划到具身

社区供稿 | 图解大模型推理优化之 KV Cache

社区供稿 | 多轮对话推理速度提升 46%，开源方案打破 LLM 多轮对话的长度限制

社区供稿 | LMDrive: 大语言模型加持的闭环端到端自动驾驶框架

北大、斯坦福、Pika新研究：“文生图”好过DALL·E 3和SDXL

站点公告

最新文章

随机网址

热门标签