智子引擎开源多模态MoE大模型,可高效扩展模型容量,
转载整理自 智子引擎量子位 | 公众号 QbitAI随着多模态大模型的快速发展,当前主流多模态大模型具备完成多种任务的能力(图文描述、视觉问答、文字识别、图标理解、目标检测等)。但是,这些不同的多模态任务往往具有完全不同的数据分布,导致在模型训练过程中遇到“多 ......
腾讯混元视频生成大模型对外开放,并全面开源
12月3日,腾讯混元大模型正式上线视频生成能力,这是继文生文、文生图、3D生成之后的又一新举措。腾讯开源该视频生成大模型,参数量130亿,是当前最大的视频开源模型。用户只需要输入一段描述,即可生成视频,生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰 ......
DeepSeek开源推理大模型R1:纯强化学习实现接近OpenAI o1水平,成本降至1/30
自此前发布了 DeepSeek-V3 和 R1-Preview-Lite 引发全网关注之后,DeepSeek 又发布了一项重磅成果。1 月 20 日,DeepSeek 发布了全新的开源推理大模型 DeepSeek-R1,在数学、编程和推理等多个任务上达到了与 OpenAI o1 相当的表现水平,同时将应用程序编程接口(API,Ap ......
Go语言开发AI智能体有多丝滑?字节重磅开源Eino框架,内含保姆级教程
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyun ......
OpenAI内部已实现GPT-4.5?未来会走向开源?Altman透露发展路线
近期,OpenAI CEO Sam Altman 于东京大学内开展了一次访谈。期间,他透露了有关 OpenAI 新的推理模型、以及公司未来规划等关键信息。Altman 称,在内部,OpenAI 的模型已经开发到了相当于 GPT-4.5 的水平,并且要达到 GPT-5.5 的水平并不需要像过去那样将计算能力提升 1 ......
DeepSeek彰显开放精神:人工智能的“共享单车时刻”
想象一下,如果某天有人突然宣布:所有米其林餐厅的秘方都免费公开,任何街边小摊都能用这些配方做出顶级美食这大概就是DeepSeek在人工智能领域正在做的事。2025年初,这家中国初创公司开源了一款名为DeepSeek-R1的人工智能大模型,其性能堪比行业巨头 OpenAI 的最新产 ......