nload="this.removeAttribute('width'); this.removeAttribute('height'); this.removeAttribute('onload');" />
nload="this.removeAttribute('width'); this.removeAttribute('height'); this.removeAttribute('onload');" />
2025年新春之际,中国学者研发的DeepSeek大模型一夜爆火出圈,如同平静湖面投入了一颗石子,短短半月之余,在国际舞台激起层层涟漪,其震荡效应甚至跃出技术范围,迅速扩散到国际政治、经济社会和思想文化领域。DeepSeek R1-Zero更重要的价值是,“推理即训练”的自我进化突破了自GPT大模型以来终极的人类输入瓶颈,其普惠开源的公益壮举,更使人工智能一味追逐大数据、大算力、大模型、大能耗的“闭源竞争”整体生态发生裂变,国际上几大AI头部也被迫走出大模型开源免费之路,其引领效应可谓功莫大焉。剔除资本炒作和媒体放大效应,引起我们深度探索的问题是,DeepSeek的底层逻辑究竟包含了哪些创新?以此为契机,未来人机交互模式将发生哪些变革?在可见的智能时代,DeepSeek能否激发一种新的人机自然交互模式的演化机制,实现人类与AI的互惠共生?
一、DeepSeek底层逻辑体现五大创新
第一,在Transformer基座上采用混合专家(MOE)架构和多头潜在注意力(MLA)机制,提升模型训练降本增效;第二,运用纯强化学习(RL)驱动,减少对人工标注数据的依赖,实现数据处理自我进化;第三,独创一种模型蒸馏方法,对计算推理结果进行验证标注,提高小模型推理效果、降低计算成本;第四,摒弃随机采样,以动态采样建立分布式框架实现动态内存管理,大大降低计算复杂性;第五,多模态架构折叠算法支持涵盖文本、图像、音频等的多模态高效交互。这五大创新必将一方面推进AI for Science的研究范式变革,促进其他垂直领域不可预期的丰富成果产出,另一方面也将通过AI创新引领哲学社会科学研究规范的变革。
二、以DeepSeek为契机,未来人机交互模式将发生哪些变革?
作为对大模型Scaling Law一统天下路线的修正,2024-2025年人工智能落地物理世界、研发AI智能体(AI Agent)成为技术演进的新趋势和产业新风潮。而在多主体、多模态、跨现实环境中的人机交互遂成前所未有的新挑战。可以说,2023年生成式人工智能大语言模型ChatGPT和Sora问世,伴随惊艳的语言生成能力和目眩的幻觉画面,正式开启了一场前所未有的人机交互大实验。由此节点开始,依仗大数据、大算力,人类语言优位的百模大战向着AGI目标一路狂飙,引发全球大能耗竞争,致使黄仁勋2024年宣告,CPU+GPU+CUDA的计算生态系统将为AI的加速度发展保驾护航,“摩尔定律”效应倍增。显然,这种版本的人机交互并不自然。这是因为大模型只在虚拟环境中,通过大量人类标注接受预训练,借助海量数据生成预测模型或图像识别模式,无法生成“与人类互动参与日常物理世界中依赖常识的感知—行动闭环”的人机自然交互机制。因此AI落地物理世界,致力破解“莫拉维克悖论”的变革之声不绝于耳。近日AI世界峰会上,李飞飞一如既往地疾呼“以人为本”,提出空间智能导航,目标导向行动的Agent AI新范式,特别强调实现AI与人和物在现实空间进行交互。其核心是多智能体、多模态、跨现实适应性具身交互。不仅令人期待在技术层面实现AI认知边界的极大拓展,更可能重塑人类对智能的本质,以及人机交互新模式的深度探索。可以设想,如果引进生物智能体演化的新视角,将AI视为不断进化的、可称为“新物种”的人工生命;另一方面人类在与AI的自然交互过程也将演化出新的生命形态。那么,借助强大的AI伦理护城河的技术加持,人类是否可能寻找到一种共享意图和共享能动性Agency的人机互惠交互的演化机制,实现人与AI的互惠共生。因此,在DeepSeek引发创新的浪潮中,具身智能时代的人机交互新范式或将成为下一阶段哲学社会科学的一项重大议题。
三、DeepSeek助力人机自然交互的困境与挑战
低成本算法优化获得高效能的DeepSeek助力具身智能AI时代的人机交互的优势,首先是开源引智带来的难以预想的创新空间,已经唤醒世界范围内的又一波创新浪潮,虽然基于LLM和LVM两大基座开发新模式的人机交互大模型不失为一种选择。然而未来要实现人与AI的多主体多模态跨现实的具身交互,需要面对更大的挑战至少来自如下几大困境:1. 事实上,最大的困境自然是AI智能体在与人的交互中难以实现意图和行动的对齐;2.跨模态对齐与一致性困境:目前缺乏整合多种感官模态(如图像、3D视觉、文本、触觉和听觉)的统一的高质量数据集,如何在虚拟和现实环境中实现无缝的跨现实人机交互,是未来需要解决的重大难题;3.复杂环境认知与因果推理难题:具身智能体需要在复杂环境中理解自然语言指令执行长期任务,并具备因果推理和反事实因果推断能力。而现有数据驱动方法难以处理因果关系,且在未见环境中的实时响应及适应性不足;4.评估与标准化难题:目前缺乏全面评估具身模型能力的基准,这必将导致模型的性能难以量化,缺少模型泛化能力基准,将阻碍技术的快速迭代和推广;5.杰文斯效应不可避免:DeepSeek引发的开源和算法优化的创新机遇必将带来新一轮的能源竞争。
作者系中国人民大学哲学院教授,北京大学博古睿学者
来源:中国社会科学网
责任编辑:李秀伟
新媒体编辑:宗敏
如需交流可联系我们