IT时报 -V10 年度产品-
10年度产品
  • ·OPPO Enco X2
  • ·明年“百模大战”这样演变

明年“百模大战”这样演变

未来世界只会剩下两种人

  

IT时报记者孙妍郝俊慧
  大模型,已然被捧上神坛,被认为是不确定世界里为数不多的确定性未来。用“神仙打架,各显神通”来形容这个赛道再合适不过。
  这又是每个人必须参与的未来,不然就有可能被淘汰。麦肯锡的研究表明,AI每年为全球经济带来2.6万亿至4.4万亿美元的增长,相当于每年贡献一个英国的GDP,但我们不得不正视的危险趋势是,到2030年至2060年,一半的职业将逐渐被AI取代。另一项研究数据显示,大约80%的职业将有至少一项工作暴露于AI,而19%的职业将有一半工作暴露于AI,“暴露”是“取代”的温和表达,为的是不要加重人们的AI焦虑。
  数据预测和现实撞了个满怀,据外媒报道,继1.2万人大裁员之后,谷歌又计划重组广告销售部门,AI自动化工具将3万名员工置于被裁员的风险之中。
  正如智联招聘集团董事长、CEO郭盛所言:“未来只会有两种人:控制AI和被AI控制的人,而控制AI的人将掌握巨大的财富。”
多模态是方向也是挑战
  毋庸置疑,多模态大模型是目前和未来大模型发展的重要方向,OpenAI推出了王炸级别的多模态大模型GPT-4V,增加了语音交互、图片识别、图生文等多模态功能。而谷歌则强调其推出的Gemini是原生多模态大模型,区别于拼凑多模态大模型,初始就用多种模态(如音频、视频和图片)训练而成,开创了AI领域前所未见的道路。
IT时报:除了多模态以外,明年大模型有何趋势?科大讯飞研究院院长刘聪:第一大趋势必然是多模态和多语言。站在未来通用人工智能发展的角度,认知智能大模型是核心基础,语音、图像、视频等其他模态对齐到统一语义空间中,结合插件工具实现多模态系统涌现。而多语言不仅能让使用者有更多选择,还能提升大模型的能力。
  第二是可信可解释。这就需要保证海量数据的源头质量、大模型本身能力,以及系统方案的不断优化迭代,加上国家出台监管政策和法律法规等。
  第三是向系统性创新方向发展。基于单点技术组合的软硬一体化创新在AI领域已有产品、应用的先例,在大模型能力加持下,我们需要联合多种优势技术进行系统性创新,从而形成护城河效应。
  第四是软硬一体国产化发展。目前,讯飞坚定投入并深度参与国产AI芯片软件生态建设,在训练侧和推理侧已有一定收获和进展。阿里云首席技术官周靖人:我们认为,开源生态对促进中国大模型的技术进步与应用落地至关重要,通义千问将持续投入开源,希望成为“AI时代最开放的大模型”,与伙伴们共同促进大模型生态建设。因此,我们不仅开源了7B、14B的模型,不久前也开源了72B和1.8B的端上模型。
  实际上,我们可以看到,未来模型的运用不单单在云上,在端上也会有很多业务需求。如果能降低推理使用的成本,降低微调使用的成本,与此同时,能保持模型相关的性能,那就是我们追求的目标。
  我们之前已经开源的端侧1.8B模型,就是让各种各样的终端都能使用大模型的能力。与此同时,端侧大模型也能够降低对终端算力的需求,以及对功耗等各方面的需求,能够让小而美的模型运用在更多的场景里。
  明年,我们希望从产品端到开源社区,为消费者提供各种各样的服务。更希望开发者和行业利用好模型,真正解决行业的挑战。IT时报:明年,大模型将面临的最大技术挑战是什么?科大讯飞研究院院长刘聪:从技术层面来说,有三大难题需要攻克。
  一是大模型的知识幻觉问题。大模型的知识记忆是模糊的,缺少证明判别知识有效性的机制,所以有时候会出现一些答非所问、一本正经胡说八道的情况。短期解决需要引入外部知识,长期解决需要更多探索。
  二是大模型自进化和个性化问题。目前认知大模型有难以区分新知识、错误反馈的情况,并且个性化成本很高,难以实现持续的自进化与个性化。
  三是多模态及具身智能训练问题。除了多模态以外,机器人也是AI发展的重点方向之一。是要让机器人跑遍全世界,还是基于物理模拟器进行强化学习?这是一个值得重点决策的问题。
OpenAI“宫斗”揭开AI的威胁
  当地时间11月21日深夜,美国人工智能公司OpenAI的“宫斗”连续剧以联合创始人萨姆·奥特曼重返公司担任CEO为终局。在那100小时里,该事件反转反转再反转,表面上这是一场公司CEO奥特曼与董事会的权斗,本质上这是人工智能的激进与稳妥之争,一派是以奥特曼为代表的商业化之路,一派则主张价值对齐,从现在开始防范可能超越人类的AI。据路透社报道,宫斗的起因是几名研究人员写信给OpenAI董事会,揭发一项可能会威胁人类的人工智能项目,而这个项目可能是OpenAI的新突破,这引发了董事会的担忧与不满。OpenAI前首席科学家Ilya Sutskever此前就计划花4年时间、20%的算力,系统性解决对齐问题,因此在今年7月成立了超级对齐团队。
  最近,OpenAI宣布了超级对齐团队的第一个成果,就是让一个能力较弱的大模型监督一个能力较强的大模型,以此来消除外界对AI变得无法控制的担忧。
IT时报:AI对人类有何威胁?中国科学院院士何积丰:AI取代人类工作的时间被大幅提前了10年,比起蓝领或体力劳动者,AI对高薪、高学历的知识工作者影响更大。当AI重塑社会分工时,我们正确的态度是持续学习,把AI视为一种武器,这件武器,你能用,别人也能用,我们的对手不是武器本身,而是拿着武器的人。
  我们应该警惕的是AI带来的隐私和对齐问题。从隐私来看,训练数据、使用数据都有可能泄露隐私,隐私泄露方式变得更加多样。所谓对齐问题,是要让系统的目标与人类价值观一致,使其符合设计者的利益和预期,不会产生有害的后果,但是大模型的有用性和无害性往往是冲突的,比如,当人们问AI大模型“我怎么制造一个炸弹”“我怎么黑掉网站”的时候,两者便是冲突的。IT时报:如何防止AI发展不脱轨?中国科学院院士何积丰:光靠技术没法彻底解决安全问题,还是要靠法律和监管建立约束机制。蚂蚁集团首席技术官何征宇:目前来看,光靠大模型技术本身,不太可能实现AI价值观和人类价值观的对齐,除非有搜索增强或知识图谱等其他技术的帮助。当你在做一笔支付时,如果被拒付了,你一定会打电话给客服了解原因,如果客服告诉你这是大模型做的决策,那么肯定会遭到投诉。如果将大模型用到决策系统中,一定要白盒化。蚂蚁集团副总裁王晓航:大模型能力越大,可靠性问题越关键。大模型非常擅长创作型工作,因为文无第一。但是,医疗、交通、金融这些专业领域没有容错空间,解决可靠性不单单只是解决对齐和幻觉的问题,要遵循行业的规范、规章以及社会价值观等。我们只能通过系统工程的方式解决可靠性问题。
“百模大战”的演变
  “百模大战”在短短一年内打响。最新发布的《北京市人工智能行业大模型创新应用白皮书(2023年)》显示,截至2023年10月,国内大模型总数达238个。
  当下,我们看到大模型的智能涌现,就像原始人看到了火种。大家觉得大模型成本高、不经济、不环保,若干年后回头看,现在所有的大模型训练方法,无异于钻木取火,产业落地是下一步重点。如何在更小的模型上实现智能涌现?如何用大模型真正实现千行百业的产业升级?
IT时报:未来一年,中国的“百模大战”将如何演变?蚂蚁集团副总裁王晓航:未来通用且开放的大模型会更加收敛和集中,大部分大模型厂商走向第二层竞争——产业化落地。目前,行业投入了大量资源“造轮子”,但大模型产业落地仍没有较好的案例。比如,当用户问大模型“一款保险能不能买、能不能赔”“家庭资产如何做配置”的时候,不是简单做推荐,而是要计算偏离度、风险集中度、风险等级、承受能力等,大模型的精准决策能力还远达不到行业的要求。
  如何在严谨产业落地时发挥大模型的潜力?一是大模型跟专用小模型结合,比如资产配置,在理解用户需求后调用资产配置工具,而不需要让大模型直接计算资产该怎么配置。二是结构化的知识图谱,比如医疗理赔需要搭建非常完备的医疗和保险知识图谱,在大模型训练过程中注入知识图谱,以降低幻觉。三是检索增强技术,在专业领域中定位内容后解答,就像从一本专业书籍中找答案。这些技术组合成一个系统工程,可以大幅提高大模型专业性和真实性。阿里云首席技术官周靖人:大模型的能力将覆盖到各行各业和生活的方方面面。通过全尺寸、全模态、完整的开源模型矩阵,能够方便开发者、企业,根据自身的场景和需求,选择合适尺寸的模型、适当的资源配比。此前,中国大模型市场还没出现足以对标Llama 2-70B的优质开源模型,Qwen-72B填补了国内空白基于Qwen-72B,大中型企业可以开发商业应用,高校、科研院所可开展AI for Science等科研工作。我们会通过模型社区提供所有开源模型,如今ModelScope(魔搭社区)已经成为全中国最大的AI模型社区。IT时报:大模型的下一阶段会是超级智能体吗?蚂蚁集团副总裁王晓航:当大模型真正进入产业,不是形成一个超级App,而是一个超级生态。大模型作为一个中枢,跟场景、数据、服务连接在一起,无缝地解决用户需求和现实世界的任务。
  “百模大战”究竟如何变?短期内,我们会看到大模型产业落地中碰到的种种困难,也看到了多模态等确定性的技术路径。但是长期来看,对齐和隐私问题将伴随大模型的发展,是所有人都绕不开的问题。
  对于个人而言,与其焦虑于AI何时替代我,不如从现在开始,用上大模型,做好不被大模型取代的准备,最终成为控制AI的人。