AI文库 | 第 848 页

Lumen5: AI 视频生成器

将博客、白皮书、书面内容快速转换为视频

AI工具

3年前 (2023)

Steve AI

短短几分钟内从文本制作引人入胜的实时或动画视频

AI工具

3年前 (2023)

Descript：像编辑文档一样编辑视频

一站式音频和视频编辑工具

AI工具

3年前 (2023)

Runway Gen-2-最强AI视频生成工具

一款优秀的图片和视频AI编辑软件，一句话生成你想要的视频

AI工具

3年前 (2023)

微软｜多模态基础模型：从专家到通用助手

本文全面综述了现代多模态基础模型，包括视觉理解、视觉生成、统一视觉模型和与大型语言模型的训练/串联等方面。它倡导从开发特定用途的多模态模型，向能遵循...

大模型

3年前 (2023)

书 |《人工智能基础数学：高效和成功人工智能系统数学》605页 | 2023年Hala Nelson编写

本指南介绍人工智能领域所需的基本数学知识，如回归、神经网络、优化、反向传播、卷积、马尔可夫链等。它专注于现实世界的应用，适合工程师、数据科学家和学...

大模型

3年前 (2023)

ACC-UNet | 致敬ConvNeXt，全卷积结构UNet设计，超越SWin-UNet！

前研究工作旨在将传统的卷积神经网络与Transformer相结合，提出了一种新的网络架构Convolutional Transformer Network（CTN）。该架构在医学影像分割任务上进...

大模型

3年前 (2023)

215篇【大模型医疗】论文合集(附PDF)

ChatGPT是一种生成式大模型技术，引发了医疗领域的热潮。通过大规模的数据和模型训练，医疗大模型可以预测、诊断和治疗各种问题。215篇医疗和大模型的论文供...

大模型

3年前 (2023)

长文本信息准确率超过ChatGPT，Meta提出降低大模型幻觉新方法

Meta AI实验室提出了一种名为“验证链”的解决方案，用于解决大模型幻觉问题。该方案使得Llama-65B输出的信息准确率提升了一倍，超过了ChatGPT。大模型幻觉是指...

大模型

3年前 (2023)

DualToken-ViT | 超越LightViT和MobileNet v2，实现更强更快更轻量化的Backbone

自注意力视觉Transformer（ViTs）已成为计算机视觉领域的有竞争力架构。与卷积神经网络（CNNs）不同，ViTs能进行全局信息共享。但其二次复杂性使ViTs计算密集...

大模型

3年前 (2023)

Lumen5: AI 视频生成器

Steve AI

Descript：像编辑文档一样编辑视频

Runway Gen-2-最强AI视频生成工具

微软｜多模态基础模型：从专家到通用助手

书 |《人工智能基础数学：高效和成功人工智能系统数学》605页 | 2023年Hala Nelson编写

ACC-UNet | 致敬ConvNeXt，全卷积结构UNet设计，超越SWin-UNet！

215篇【大模型医疗】论文合集(附PDF)

长文本信息准确率超过ChatGPT，Meta提出降低大模型幻觉新方法

DualToken-ViT | 超越LightViT和MobileNet v2，实现更强更快更轻量化的Backbone

内容正在努力填充

热门标签

最新文章