明年“百模大战”这样演变

10年度产品

·OPPO Enco X2
·明年“百模大战”这样演变

明年“百模大战”这样演变

未来世界只会剩下两种人

IT时报记者孙妍郝俊慧
　　大模型，已然被捧上神坛，被认为是不确定世界里为数不多的确定性未来。用“神仙打架，各显神通”来形容这个赛道再合适不过。
　　这又是每个人必须参与的未来，不然就有可能被淘汰。麦肯锡的研究表明，AI每年为全球经济带来2.6万亿至4.4万亿美元的增长，相当于每年贡献一个英国的GDP，但我们不得不正视的危险趋势是，到2030年至2060年，一半的职业将逐渐被AI取代。另一项研究数据显示，大约80%的职业将有至少一项工作暴露于AI，而19%的职业将有一半工作暴露于AI，“暴露”是“取代”的温和表达，为的是不要加重人们的AI焦虑。
　　数据预测和现实撞了个满怀，据外媒报道，继1.2万人大裁员之后，谷歌又计划重组广告销售部门，AI自动化工具将3万名员工置于被裁员的风险之中。
　　正如智联招聘集团董事长、CEO郭盛所言：“未来只会有两种人：控制AI和被AI控制的人，而控制AI的人将掌握巨大的财富。”
多模态是方向也是挑战
　　毋庸置疑，多模态大模型是目前和未来大模型发展的重要方向，OpenAI推出了王炸级别的多模态大模型GPT-4V，增加了语音交互、图片识别、图生文等多模态功能。而谷歌则强调其推出的Gemini是原生多模态大模型，区别于拼凑多模态大模型，初始就用多种模态（如音频、视频和图片）训练而成，开创了AI领域前所未见的道路。
IT时报：除了多模态以外，明年大模型有何趋势？科大讯飞研究院院长刘聪：第一大趋势必然是多模态和多语言。站在未来通用人工智能发展的角度，认知智能大模型是核心基础，语音、图像、视频等其他模态对齐到统一语义空间中，结合插件工具实现多模态系统涌现。而多语言不仅能让使用者有更多选择，还能提升大模型的能力。
　　第二是可信可解释。这就需要保证海量数据的源头质量、大模型本身能力，以及系统方案的不断优化迭代，加上国家出台监管政策和法律法规等。
　　第三是向系统性创新方向发展。基于单点技术组合的软硬一体化创新在AI领域已有产品、应用的先例，在大模型能力加持下，我们需要联合多种优势技术进行系统性创新，从而形成护城河效应。
　　第四是软硬一体国产化发展。目前，讯飞坚定投入并深度参与国产AI芯片软件生态建设，在训练侧和推理侧已有一定收获和进展。阿里云首席技术官周靖人：我们认为，开源生态对促进中国大模型的技术进步与应用落地至关重要，通义千问将持续投入开源，希望成为“AI时代最开放的大模型”，与伙伴们共同促进大模型生态建设。因此，我们不仅开源了7B、14B的模型，不久前也开源了72B和1.8B的端上模型。
　　实际上，我们可以看到，未来模型的运用不单单在云上，在端上也会有很多业务需求。如果能降低推理使用的成本，降低微调使用的成本，与此同时，能保持模型相关的性能，那就是我们追求的目标。
　　我们之前已经开源的端侧1.8B模型，就是让各种各样的终端都能使用大模型的能力。与此同时，端侧大模型也能够降低对终端算力的需求，以及对功耗等各方面的需求，能够让小而美的模型运用在更多的场景里。
　　明年，我们希望从产品端到开源社区，为消费者提供各种各样的服务。更希望开发者和行业利用好模型，真正解决行业的挑战。IT时报：明年，大模型将面临的最大技术挑战是什么？科大讯飞研究院院长刘聪：从技术层面来说，有三大难题需要攻克。
　　一是大模型的知识幻觉问题。大模型的知识记忆是模糊的，缺少证明判别知识有效性的机制，所以有时候会出现一些答非所问、一本正经胡说八道的情况。短期解决需要引入外部知识，长期解决需要更多探索。
　　二是大模型自进化和个性化问题。目前认知大模型有难以区分新知识、错误反馈的情况，并且个性化成本很高，难以实现持续的自进化与个性化。
　　三是多模态及具身智能训练问题。除了多模态以外，机器人也是AI发展的重点方向之一。是要让机器人跑遍全世界，还是基于物理模拟器进行强化学习？这是一个值得重点决策的问题。
OpenAI“宫斗”揭开AI的威胁
　　当地时间11月21日深夜，美国人工智能公司OpenAI的“宫斗”连续剧以联合创始人萨姆·奥特曼重返公司担任CEO为终局。在那100小时里，该事件反转反转再反转，表面上这是一场公司CEO奥特曼与董事会的权斗，本质上这是人工智能的激进与稳妥之争，一派是以奥特曼为代表的商业化之路，一派则主张价值对齐，从现在开始防范可能超越人类的AI。据路透社报道，宫斗的起因是几名研究人员写信给OpenAI董事会，揭发一项可能会威胁人类的人工智能项目，而这个项目可能是OpenAI的新突破，这引发了董事会的担忧与不满。OpenAI前首席科学家Ilya Sutskever此前就计划花4年时间、20%的算力，系统性解决对齐问题，因此在今年7月成立了超级对齐团队。
　　最近，OpenAI宣布了超级对齐团队的第一个成果，就是让一个能力较弱的大模型监督一个能力较强的大模型，以此来消除外界对AI变得无法控制的担忧。
IT时报：AI对人类有何威胁？中国科学院院士何积丰：AI取代人类工作的时间被大幅提前了10年，比起蓝领或体力劳动者，AI对高薪、高学历的知识工作者影响更大。当AI重塑社会分工时，我们正确的态度是持续学习，把AI视为一种武器，这件武器，你能用，别人也能用，我们的对手不是武器本身，而是拿着武器的人。
　　我们应该警惕的是AI带来的隐私和对齐问题。从隐私来看，训练数据、使用数据都有可能泄露隐私，隐私泄露方式变得更加多样。所谓对齐问题，是要让系统的目标与人类价值观一致，使其符合设计者的利益和预期，不会产生有害的后果，但是大模型的有用性和无害性往往是冲突的，比如，当人们问AI大模型“我怎么制造一个炸弹”“我怎么黑掉网站”的时候，两者便是冲突的。IT时报：如何防止AI发展不脱轨？中国科学院院士何积丰：光靠技术没法彻底解决安全问题，还是要靠法律和监管建立约束机制。蚂蚁集团首席技术官何征宇：目前来看，光靠大模型技术本身，不太可能实现AI价值观和人类价值观的对齐，除非有搜索增强或知识图谱等其他技术的帮助。当你在做一笔支付时，如果被拒付了，你一定会打电话给客服了解原因，如果客服告诉你这是大模型做的决策，那么肯定会遭到投诉。如果将大模型用到决策系统中，一定要白盒化。蚂蚁集团副总裁王晓航：大模型能力越大，可靠性问题越关键。大模型非常擅长创作型工作，因为文无第一。但是，医疗、交通、金融这些专业领域没有容错空间，解决可靠性不单单只是解决对齐和幻觉的问题，要遵循行业的规范、规章以及社会价值观等。我们只能通过系统工程的方式解决可靠性问题。
“百模大战”的演变
　　“百模大战”在短短一年内打响。最新发布的《北京市人工智能行业大模型创新应用白皮书（2023年）》显示，截至2023年10月，国内大模型总数达238个。
　　当下，我们看到大模型的智能涌现，就像原始人看到了火种。大家觉得大模型成本高、不经济、不环保，若干年后回头看，现在所有的大模型训练方法，无异于钻木取火，产业落地是下一步重点。如何在更小的模型上实现智能涌现？如何用大模型真正实现千行百业的产业升级？
IT时报：未来一年，中国的“百模大战”将如何演变？蚂蚁集团副总裁王晓航：未来通用且开放的大模型会更加收敛和集中，大部分大模型厂商走向第二层竞争——产业化落地。目前，行业投入了大量资源“造轮子”，但大模型产业落地仍没有较好的案例。比如，当用户问大模型“一款保险能不能买、能不能赔”“家庭资产如何做配置”的时候，不是简单做推荐，而是要计算偏离度、风险集中度、风险等级、承受能力等，大模型的精准决策能力还远达不到行业的要求。
　　如何在严谨产业落地时发挥大模型的潜力？一是大模型跟专用小模型结合，比如资产配置，在理解用户需求后调用资产配置工具，而不需要让大模型直接计算资产该怎么配置。二是结构化的知识图谱，比如医疗理赔需要搭建非常完备的医疗和保险知识图谱，在大模型训练过程中注入知识图谱，以降低幻觉。三是检索增强技术，在专业领域中定位内容后解答，就像从一本专业书籍中找答案。这些技术组合成一个系统工程，可以大幅提高大模型专业性和真实性。阿里云首席技术官周靖人：大模型的能力将覆盖到各行各业和生活的方方面面。通过全尺寸、全模态、完整的开源模型矩阵，能够方便开发者、企业，根据自身的场景和需求，选择合适尺寸的模型、适当的资源配比。此前，中国大模型市场还没出现足以对标Llama 2-70B的优质开源模型，Qwen-72B填补了国内空白基于Qwen-72B，大中型企业可以开发商业应用，高校、科研院所可开展AI for Science等科研工作。我们会通过模型社区提供所有开源模型，如今ModelScope（魔搭社区）已经成为全中国最大的AI模型社区。IT时报：大模型的下一阶段会是超级智能体吗？蚂蚁集团副总裁王晓航：当大模型真正进入产业，不是形成一个超级App，而是一个超级生态。大模型作为一个中枢，跟场景、数据、服务连接在一起，无缝地解决用户需求和现实世界的任务。
　　“百模大战”究竟如何变？短期内，我们会看到大模型产业落地中碰到的种种困难，也看到了多模态等确定性的技术路径。但是长期来看，对齐和隐私问题将伴随大模型的发展，是所有人都绕不开的问题。
　　对于个人而言，与其焦虑于AI何时替代我，不如从现在开始，用上大模型，做好不被大模型取代的准备，最终成为控制AI的人。