数字比你想得更复杂——一文带你了解大模型数字处理能力的方方面面
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyun ......
大模型已进入应用阶段 专家:算法脆弱性等问题仍待解
每经记者:王琳每经编辑:梁枭“百模大战”告一阶段,国内大模型领域开始进入到各行各业的应用探索阶段。12月6日,“2024 AI+数字笔迹创新应用发展论坛”在重庆举行。《每日经济新闻》记者在现场注意到,阿里云副总裁、产业智能首席科学家张磊表示,大模型真正变成生产 ......
谷歌史上最强大模型!Gemini 2.0正式发布
快科技12月12日消息,今天凌晨,谷歌正式发布了为新智能体时代构建的下一代模型Gemini 2.0。这是谷歌迄今为止功能最强的AI模型,带来了更强的性能、更多的多模态表现(如原生图像和音频输出)和新的原生工具应用。Gemini 2.0关键基准测试中相较于前代产品Gemini 1.5 Pro ......
GPT-4o再暴露「弱智」缺陷,大模型无一幸免!港中文等发布「视觉听觉」基准AV-Odyssey:26个任务直指死角问题
新智元报道编辑:LRST【新智元导读】多模态大模型在听觉上,居然也出现了「9.11>9.8」的现象,音量大小这种简单问题都识别不了!港中文、斯坦福等大学联合发布的AV-Odyssey基准测试,包含26个视听任务,覆盖了7种声音属性,跨越了10个不同领域,确保测试的深度和广度 ......
OpenAI员工意外泄露下一代ChatGPT!网友:故意的还是不小心的?
克雷西 发自 凹非寺量子位 | 公众号 QbitAIOpenAI员工发推介绍今天发布的新功能,结果意外泄露了未发布的模型?在Reddit上,被列文虎克附体的网友发现,OpenAI研究员Karina Nguyen展示的新功能界面中出现了一个陌生的名字ChatGPT ε(第五个希腊字母,读作Epsilon)。这 ......
专家:AI时代,人类独有的特质都将迎来价值重估
在AI时代,艺术将如何被打造、观看、教学?人与AI之间是种怎样的新型关系?12月18日,“AI时代的人文与设计”论坛在上海交通大学设计学院举行,探讨了人工智能时代高等教育与科学研究的新机遇、新挑战、新路径。12月18日,“AI时代的人文与设计”论坛在上海交通大学设计 ......
人机对齐:构建「可信赖」的AI系统
在人工智能飞速发展的今天,AI系统的决策可信度成为了全球关注的焦点。2018年美国亚利桑那州的一起自动驾驶汽车致命事故,不仅暴露了技术中的算法漏洞,更引发了对AI系统与人类预期不一致时可能带来的灾难性后果的深刻思考。2018年,一辆搭载自动驾驶技术的汽车在美国亚 ......
诺奖青睐AI的这一年,这些人工智能公司&人物&产品值得关注
组委会 发自 MEET2025大会现场量子位 | 公众号 QbitAIAI时代浪潮,在2024年奔涌到哪里了?当站在岁末年终来回顾,这依然是人工智能高歌猛进的一年,甚至代表人类科学最高荣誉的诺贝尔奖,一下子向人工智能发出了两大嘉奖。技术角度,一边是Scaling Law驱动的新范式开始 ......
美媒:中国足以重塑全球AI格局
美国《福布斯》杂志12月23日文章,原题:2025年的中国和人工智能:若想保持领先,全球高管必须知道的事情 中国制定了2030年成为世界主要人工智能(AI)创新中心的远大目标。到2030年,AI有望为中国创造每年超过6000亿美元的经济价值。2024年,中国AI企业数量超4500家, ......
解题智实融合、音视频交互新挑战,AI 2.0时代怎么做?
前不久,火山引擎利用3DGS技术把山西高平二郎庙和北京正乙祠两座珍贵的历史戏台建筑“搬进”了虚拟直播间,其应用于抖音戏曲直播的虚实融合效果得到了京剧专业人士的赞许。让技术有温度,火山引擎这些年一直坚持用新技术做文化传承。2024年被视为AI应用元年,生成式AI迎 ......
与AI相伴这一年
当地时间5月30日,瑞士日内瓦,在国际电信联盟(ITU)“人工智能造福人类全球峰会”期间,一台人工智能的机器人在展台上展示。视觉中国供图无论是否关注,AI都正在深入我们的生活。一年多以前,人们还惊异于ChatGPT的横空出世,如今,许多人已习惯于在工作生活中寻求人 ......
防AI误导:MIT团队开发新工具提升模型可信度
(来源:MIT News)AI 聊天助手功能多样,不仅可以作为字典、心理咨询师、诗人,甚至还能充当“无所不知”的朋友。这些助手背后的人工智能模型在提供答案、解释概念和总结信息时表现得尤为高效。然而,我们如何评估这些模型生成内容的可信度?如何确认某个陈述是真实的 ......