大模型从工具走向伙伴_每日播报
从“养虾”到“杀虾”,一款名叫“龙虾”的开源AI智能体OpenClaw近期持续成为社交平台热门话题。近年来,大模型驱动的智能体已成为人工智能开发机构争相布局的战略高地。从最初的“能对话”,到如今“可动手操作”,不断迭代的大模型将走向何方?
(资料图片)
提升推理能力是关键
在相继推出旗舰模型GLM—4.5、GLM—4.6后,去年12月,北京智谱华章科技股份有限公司上线并推出新一代视觉推理模型GLM—4.6V,核心目标之一是提升推理能力。
“让AI像人类一样综合感知、理解与决策,多模态推理能力的突破很关键,这也是大模型向通用人工智能演进的必由之路。”智谱联合创始人、董事长刘德兵说。
无论是通用大模型还是行业大模型,推理能力是打造未来竞争力的关键指标,一定程度上决定了其应用广度和深度。
北京航空航天大学人工智能研究院副研究员胡堃解释说,推理能力可理解为模型不仅知道“是什么”,还能判断“为什么”和“如何做”,并在复杂逻辑或跨领域条件下给出合理答案。“如果将大模型作为助手,传统大模型近似知识库型助手,回答用户提出的事实性问题;推理能力强的大模型更像策略型顾问,不仅能回答常规的经验问题,还能分析利弊、推演后果并综合多种因素给出具体建议”。
对科学基础大模型来说,推理能力尤为重要。一方面,在数学、物理等领域,推理能力是解决定理证明和理论发现的关键基础;另一方面,面向各学科领域的复杂科研任务,推理能力是任务理解和规划决策的重要前提。
“磐石·科学基础大模型一直坚持和重视推理能力的学习与强化。”中国科学院自动化研究所研究员张家俊介绍,如今磐石·科学基础大模型将数字幻觉(大模型生成看似合理但实则虚构或失真的信息)从30%降至11%,科学模态数据分析和理解能力全面提升。
“随着应用场景日趋复杂,用户更需要大模型在不确定的条件下进行综合分析并作出合理判断与决策。眼下,推理能力是大模型规模化应用的竞争焦点。”胡堃表示。
智能体成重要形态
智能体是一个由“大模型+记忆系统+工具调用+规划能力”构成的智能系统,已成为开发机构发力重点:磐石大模型新增创新评估科学智能体,为科研选题、技术方案等科研决策提供支持;海康威视将AI和大模型融入研发、生产决策全流程,打造了系列智能体;北航在智能无人机系统中引入智能体,使无人机自主完成复杂的飞行任务……
“当前,深化与拓展大模型核心能力,业内主要聚焦3个方面寻求突破。”胡堃介绍,一是进一步提升多步推理和因果推理能力;二是持续创新高效训练与推理算法,通过优化模型结构、改进训练策略等,显著降低大模型对高昂算力的依赖,推动其向更广泛的应用场景普及;三是不断增强大模型智能体化与自动化任务执行能力,让大模型能自主接收任务目标、规划执行路径、动态调整策略并完成连贯的复杂流程。
“智能体能力意味着大模型不仅能给出实际可行的方案,还可从被动的信息提供者转变为主动的任务执行者。”胡堃说。
在生产端,面对每日上万个订单,海康威视的计划智能体可快速下达生产计划和物料需求计划,实现订单24小时快速响应;其工艺智能体可自动推荐最优工艺,提升工艺设计效率。“大模型光有聪明的‘大脑’是不够的,从感知认知走向决策执行,智能体正成为大模型产品落地的重要应用形态。”张家俊说。
在科研和工业领域,智能体带来的变革同样深刻。例如,为改变材料研发“大海捞针”式的局面,中国科学院基于磐石大模型构建的材料逆向设计系统智能体,已成功从2000万种新型析氢反应合金催化材料候选配方中,快速锁定13种高性能材料,并将原本需耗时数月的材料设计周期缩短至30分钟。
提供更好交互体验
“今天,用户早已不满足于简单的文字对话或文本生成,下一代大模型不仅可以理解文本、图像、视频、声音等多模态信息,还可理解现实世界的因果关系。”刘德兵说,当它具备了多模态理解能力和因果推理能力,就可以感知环境变化并主动调整行为,为用户提供更自然、直观和沉浸式的交互体验。
刘德兵介绍,通用人工智能可分为L1预训练大模型、L2对齐与推理、L3自我学习、L4自我认知、L5意识智能5个等级。未来3年到5年,大模型领域的突破将主要围绕如何实现通用人工智能从L3自我学习向L4自我认知推进。最值得关注的是“沉思级”推理的实现,即模型能够自主分析复杂问题、生成优化方案,并在决策中进行自我批评和反思,而不再完全依赖人类输入。
这需要坚实的技术支撑。张家俊表示,除了当前备受关注的推理能力、智能体外,大模型还在朝着多模态、后训练、通专融合(通用能力与专业能力融合)、代码生成等技术方向演进。
其中,多模态旨在让模型从底层架构上学会同时理解和生成文本、音频、图像、视频以及其他模态信息;后训练旨在通过投入更多后训练资源,突破模型推理能力的上限;通专融合旨在充分利用超大模型的超强通用能力与领域模型的高效专业能力;代码生成既可提升软件研发等任务的效率,也是模型推理能力和智能体能力跃升的关键因素。
科技创新的落脚点是满足人民对美好生活的向往。胡堃表示,要关注大模型的安全可解释性、隐私保护,以及社会接受度。“在不久的将来,大模型将进一步成为人类可靠的智能伙伴。”刘德兵说。(经济日报记者 沈 慧)
(责任编辑:符仲明)关键词:
您可能也感兴趣:
为您推荐
中国红APP正式上线发布
第十二届东亚地方政府会议将在山东临沂召开 促进东亚地区交流合作
(乡村行·看振兴)山西柳林依托“数商兴农”打造乡村e镇 电商交易9个月达3.5亿元
排行
最近更新
- 大模型从工具走向伙伴_每日播报
- 贵金属全线收涨 白银本周涨幅居前
- 4月23日投海TechShow专场:下一个独角兽,可能就在这里
- 精彩片段|沧海忆忠魂,碧海铸新篇 最资讯
- 【图解】稳中有升!一季度消费市场“新”意盎然
- 每日报道:布朗尼:我看老詹比赛可真够多了 知道他喜欢怎么打
- 焦点消息!中国中铁(00390.HK):“铁工YK11”不行使续期选择权
- 含乘用炮/商用炮 长城炮Hi4-T版本将于北京车展开启预售|今日热议
- 《基金管理公司绩效考核管理指引》出台 鼓励适当延长薪酬总...
- 速递!海优新材(688680.SH):拟使用不超过5亿元闲置自有资金...
- 净利润超去年全年、总资产升至132亿元,舍得酒业长期成长性获...
- 中国有色金属工业协会锂业分会:3月全国碳酸锂产量约8.7万吨...
- 大盘反弹趋势不改 机构卖出力度强于买入-热点
- 合华驰ToB平台正式发布:专业助力核心企业上下游供应链破解融...
- 焦点消息!我国成功发射高精度温室气体综合探测卫星
- 亚洲水泥(中国)(00743)发盈警 预期一季度股东应占亏损约8128...
- 航天航空十大相关企业排行榜(2026年3月25日股票成交额排名)
- 扬农化工跌8.35% 周一中信建投喊维持买入评级
- 即时焦点:招金黄金(000506.SZ):董事高文龙辞职
- 追光之旅终章落定!「光从东方来・拾光上」音乐会定档4月20日
- 人民鉴真46期丨金螳螂:与越南Sun Group所签备忘录不涉任何...
- 当前热议!Truist上调美国银行目标价至61美元
- 智平方与西子联合达成合作 在多场景系统性应用具身智能机器人
- 出海进入“跨国经营”新阶段,蚂蚁国际万里汇做中国企业“全...
- 生意社:4月17日华鲁恒升碳酸二甲酯价格动态
- 大行评级丨花旗:贵州茅台在2025年重整业务 维持“买入”级
- 金螳螂:与越南Sun Group签署的备忘录中不涉及任何具体项目...
- 胸部下垂换什么内衣好?2026年修复型内衣品牌推荐
- 今日讯!2026年4月17日黄淮农产品股份有限公司价格行情
- 港股午评:恒生指数跌1.32%,恒生科技指数跌1.66%
今日要闻
- 4月23日投海TechShow专场:下一个独角兽,可能就在这里
- 【图解】稳中有升!一季度消费市场“新”意盎然
- 净利润超去年全年、总资产升至132亿元,舍得酒业长期成长性获多家机构认可
- 大盘反弹趋势不改 机构卖出力度强于买入-热点
- 合华驰ToB平台正式发布:专业助力核心企业上下游供应链破解融资信息不对称
- 追光之旅终章落定!「光从东方来・拾光上」音乐会定档4月20日
- 当前热议!Truist上调美国银行目标价至61美元
- 焦点消息!太平鸟2025年净利1.74亿减少32.57% 董事长张江平薪酬253.84万
- “龙虾出行”获近亿元天使轮融资,打造新一代AI出行助理
- 七问藏初心,百味致时光,如意三宝20周年宣传片重磅上线


