AI大模型即将陷入数据荒?专家:对空间数据、视频数据的学习利用才刚开始
近年来依托大模型驱动的人工智能(AI)已经渗入现代社会的方方面面,但它的高速发展离不开海量数据的支持,以至于业内将数据形容为推动AI发展的“燃料”和“矿产”。但美国人工智能巨头OpenAI公司联合创始人兼前首席科学家伊利亚苏茨克维尔近日公开警告“AI的训练数据如 ......
2024 大模型年度五问:等不来GPT 5怎么过?
这一年,AI领域经历了翻天覆地的变化,从大模型的分化发展到视频生成技术的突破,再到AI编程和智能助手的兴起,每一项进步都在推动着我们向更智能的未来迈进。在这篇文章中,我们将回顾2024年AI行业的五大核心问题,这些问题不仅定义了今年的技术趋势,也为2025年的发展 ......
冷眼与嘲讽之后,谷歌的AI大模型翻盘之路
“我认为2025年将至关重要。我认为我们必须意识到这一刻的紧迫性,并需要作为一家公司加快步伐。风险很高。这些都是颠覆性的时刻。在2025年,我们需要坚持不懈地专注于释放这项技术的优势并解决真正的用户问题。”12月18日举行的2025年战略会议上,谷歌首席执行官桑达尔 ......
大模型的2024,这可能是最早的一篇年度总结文
从某种意义上说,2024年不仅是技术突破的一年,更是行业走向成熟的重要转折点。这一年,GPT-4级别的模型不再罕见,许多机构都开发出了性能超越GPT-4的模型;这一年,运行效率显著提高,成本急剧下降;这一年,多模态LLM,特别是支持图像、音频和视频处理的模型,变得越 ......
Transformer作者初创重磅发布Transformer²!AI模型活了,动态调整自己权重
新智元报道编辑:KingHZ 好困【新智元导读】Sakana AI发布了Transformer新方法,通过奇异值微调和权重自适应策略,提高了LLM的泛化和自适应能力。新方法在文本任务上优于LoRA;即便是从未见过的任务,比如MATH、HumanEval和ARC-Challenge等,性能也都取得了提升。从章鱼 ......
三问“AI 2025”,五款大模型这样说
当前,以大模型为代表的AI技术正在快速融入我们生活中的每一个角落。2025年,AI技术发展将呈现哪些核心趋势?产业发展呈现怎样的特点?你最看好哪家中国AI企业?中国电子报记者向目前市面上的五款主流AI大模型应用提出了三个问题,让我们一起从大模型视角看看2025年AI发 ......
北京智源发布2025年AI十大趋势:世界模型有望成多模态大模型下一步
1月8日,北京智源人工智能研究院发布2025人工智能十大技术趋势。该预测认为,基于Scaling Law(尺度定律)推动基础模型性能提升的训练模式“性价比”持续下降,后训练与特定场景的Scaling law不断被探索。构建原生多模态大模型成为多模态大模型进化的重要方向,世界模型 ......
面壁智能发布多模态大模型MiniCPM-o 2.6,让AI一直“睁着眼”
AI未来指北特约作者 郝博阳编辑 郑可君在科幻电影《Her》中,主角Theodore爱上了一个能看能听、富有同理心的AI助手Samantha。这个故事上映时看似遥不可及,但在过去的十年里,AI领域的进展让这个未来逐渐清晰。2024年5月,OpenAI的GPT-4o让我们看到了一个能实现类似Sama ......
DeepSeek模型引爆AI应用热潮 智云健康股价飙升近15%
财联社2月6日讯(编辑胡家荣)近期DeepSeek热度居高不下,这引发相关个股的走强。比如智云健康(09955.HK)在昨日发布公告称,DeepSeek-R1模型接入其医疗人工智能系统"智云大脑"。值得注意的是,智云健康此次技术迭代涉及大数据分析架构重构。公司研发团队透露,DeepSee ......
AI的iPhone时刻真的要来了!DeepSeek将影响普通人
过去一周,围绕中国人工智能创新公司DeepSeek的讨论在各行各业展开,很多非人工智能领域人士也都下载了DeepSeek软件抢先体验。随着DeepSeek掀起新一轮AI热潮,AI的iPhone时刻也更近一步。不少普通人会问,未来我们的生活是否会因此而改变?正如苹果iPhone的发明被认为是 ......
中国大模型密集“上新”,中美科技股价值有望重估
中新社记者 夏宾乙巳蛇年,中国大模型密集“上新”,引发各方关注。一边是阿里云旗下大模型全新版本升级发布。1月29日凌晨,阿里云通义团队发布的Qwen2.5-Max,该模型是阿里云通义团队对MoE(混合专家模式)模型的最新探索成果,预训练数据超过20万亿tokens。该新模型展现 ......
谷歌更新多款Gemini 2.0模型 卖力挥舞硅谷AI性价比大旗
财联社2月6日讯(编辑 史正丞)美国搜索引擎和AI巨头谷歌公司周三宣布产品线全面上新,所有用户已经正式迈入“Gemini 2.0”时代。首先是Gemini 2.0 Flash模型。作为适用大规模、高容量、高频率任务的模型,自去年12月推出后,就被卷起“性价比风暴”的Deepseek-V3模型抢 ......