开源

转载整理自智子引擎量子位 | 公众号 QbitAI随着多模态大模型的快速发展，当前主流多模态大模型具备完成多种任务的能力（图文描述、视觉问答、文字识别、图标理解、目标检测等）。但是，这些不同的多模态任务往往具有完全不同的数据分布，导致在模型训练过程中遇到“多 ......

AI视界

开源文生文模型

腾讯混元视频生成大模型对外开放，并全面开源

12月3日，腾讯混元大模型正式上线视频生成能力，这是继文生文、文生图、3D生成之后的又一新举措。腾讯开源该视频生成大模型，参数量130亿，是当前最大的视频开源模型。用户只需要输入一段描述，即可生成视频，生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰 ......

DeepSeek开源推理大模型R1：纯强化学习实现接近OpenAI o1水平，成本降至1/30

AI视界

deepseek OpenAI r1

DeepSeek开源推理大模型R1：纯强化学习实现接近OpenAI o1水平，成本降至1/30

自此前发布了 DeepSeek-V3 和 R1-Preview-Lite 引发全网关注之后，DeepSeek 又发布了一项重磅成果。1 月 20 日，DeepSeek 发布了全新的开源推理大模型 DeepSeek-R1，在数学、编程和推理等多个任务上达到了与 OpenAI o1 相当的表现水平，同时将应用程序编程接口（API，Ap ......

AI视界

go语言开源开源eino

Go语言开发AI智能体有多丝滑？字节重磅开源Eino框架，内含保姆级教程

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyun ......

AI视界

altman GPT gpt-4.5

OpenAI内部已实现GPT-4.5？未来会走向开源？Altman透露发展路线

近期，OpenAI CEO Sam Altman 于东京大学内开展了一次访谈。期间，他透露了有关 OpenAI 新的推理模型、以及公司未来规划等关键信息。Altman 称，在内部，OpenAI 的模型已经开发到了相当于 GPT-4.5 的水平，并且要达到 GPT-5.5 的水平并不需要像过去那样将计算能力提升 1 ......