IT时报 -V9 新闻产业-
9新闻产业
  • ·从开源框架到AI大生产平台
  • ·神预测:爱奇艺涨3元,我们两个月前就算到了!

百度飞桨晒出三年成绩单:

从开源框架到AI大生产平台

只用五分钟,这只机器狗便识别了新手势

  

IT时报记者郝俊慧
  “最近一个月,你见过盲人吗?”12月12日,由深度学习技术及应用国家工程实验室主办的WAVE SUMMIT+2021深度学习开发者峰会上,东北大学大四学生高鸿志向在场观众抛出一个问题。
  中国14亿人口中有1700万视障人士,占总人口比例达1.2%,但在大街上却很少看到他们的身影。“变色”和被阻碍的盲道,成了他们出行的障碍,而全国经过训练的导盲犬只有200多只,每只导盲犬训练需 3-5年,与需求相比,杯水车薪。
  “我们用不到半个月的时间训练出一只机器导盲犬。”利用飞桨深度学习开源开放平台和社区,高鸿志和他的团队让一只机器导盲犬实现了基于视觉的盲道导航、常见障碍物检测、红绿灯识别引导过马路等功能,而未来,通过AI训练,除了引导避障,机器导盲犬还可以为主人提供更温暖、更安全的语音陪伴,很多现有导盲犬无法做到的事情,都将通过它变成现实。
  年轻的高鸿志是一名飞桨开发者技术专家(PPDE),406万飞桨开发者之一。作为我国首个自主研发的产业级深度学习平台,截至目前,飞桨已经创建了47.6万个模型,服务于15.7万企事业单位,在中国深度学习平台综合市场份额第一。
  “人工智能呈现出‘融合创新’和‘降低门槛’的特点。”百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰认为,一方面,AI技术及产业的融合创新越来越多;另一方面,虽然AI技术越来越复杂,但AI开发与应用的门槛却越来越低。
  这意味着,深度学习正推动人工智能进入工业大生产阶段。
  峰会上,飞桨发布包括飞桨新版全景图——产业级模型库新增文心大模型、业界首个产业实践范例库、飞桨“大航海”2.0共创计划等在内的十大最新技术和生态进展。
一个人也可以完成的AI项目
  25岁的李桑郁,是襄阳铁路段的一名铁路工人,通过自学飞桨开发套件,他开发出一套“铁路货车车身字符及标识自动检测系统”,实现了铁路货运车号的自动识别。整个项目,仅凭他一己之力。以前需要人工核对几个小时的工作,如今只需要3分钟就能完成,为襄阳车辆段节省了20多万元成本。
  在飞桨平台上,和高鸿志、李桑郁一样的开发者有406万。飞桨是国内首个开源开放、功能完备的产业级深度学习平台,它将大量基础的、需要重复的代码固化为模型,利用预先构建和优化好的组件集合定义模型,深度学习研究者不需要深入了解底层算法,便可以自主快速实现从建设数据集、到模型训练、再到模型部署的整套流程,从而大大降低人工智能的使用门槛。
  峰会现场,百度AI产品研发部总监忻舟现场演示了一只机器狗的5分钟。飞桨全新发布的智能边缘控制台,仅仅需要5分钟,便让一只机器狗学会了识别手势的新技能。对于高鸿志而言,一款更人性化的机器导盲犬“出街”的时间,又可以缩短了。
  值得一提的是,通过多层次、低成本的硬件适配方案,大大降低了框架与芯片的适配成本。以寒武纪MLU适配为例,飞桨方案相比原方案,代码行数减少69.4%,修改的代码文件减少62.3%,人力投入成本降低60%。截至目前,飞桨和22家国内外硬件厂商完成了31款芯片的适配和联合优化工作。
AI进入工业化大生产期
  2019年4月第一届WAVE SUMMIT+ 2021峰会上,王海峰曾将深度学习框架定义为“智能时代的操作系统”,它下接芯片,上承应用,尤其在大生产阶段,能够将AI技术以标准化、自动化和模块化的方式输出给各行各业,实现规模化应用;同时以平台为基础促进融合创新、共同发展,凝聚各方,通过赋能广大开发者,有力支撑AI工业大生产,促进技术创新和产业智能化升级。
  飞桨源起于2018年7月,开源框架v0.14发布,百度官方首次开源CV/NLP/语音/强化学习等10个模型,提供了从数据预处理到模型部署在内的深度学习全流程的底层能力支持。
  经过三年的发展,飞桨持续突破了核心框架的创新。全新发布的开源框架v2.2,新增大量科学计算API,高效支持超大模型训练的端到端自适应大规模分布式训练技术;全流程加速文本任务,解决文本领域开发在性能和训推一体方面的痛点问题,在飞桨产业级模型库里,新增的知识增强文心大模型,可以让大模型真正进入产业应用。
  峰会现场,国家电网上海电力公司调度中心副主任肖飞讲述了国家电网对于“人工智能”的渴望。基于双碳的目标,风能和太阳能等可再生能源在电网中的占比正在逐步提升,但对整个电网的系统管理提出了非常大的挑战,尤其是因自然条件变化产生的不确定性,可能会对整个电网产生灾难性影响。这就需要利用深度学习、监督学习、非监督等模型,对可再生能源的消纳、负荷等资源的配比精准预测。
  肖飞介绍,通过百度飞桨平台,国家电网的新能源预测准确性提高了85%,智能安排从分钟级提高到了秒级,为整个电网运行奠定了非常好的基础。
  百度集团副总裁、深度学习技术及应用国家工程实验室副主任吴甜指出,近年来,全国各城市的AI开发者规模逐年增长,应用人工智能的企业数量,呈现出多地开花、多行业繁荣的景象。从推荐等通用场景,到客服系统智能派单等行业衍生场景,再到发电预测等行业关键场景……类似这样技术与产业的融合创新案例在飞桨平台上越来越多,也越来越专业。截至目前,飞桨服务了15.7万企事业单位,有力促进了产业智能化升级。
培育复合型AI人才
  对于人工智能产业而言,人才是永远不过时的话题。随着AI与产业的深度融合,需要越来越多既懂AI,又具备产业经验的复合型AI人才。“大学不要用昨天的知识教今天的学生,让他们去面对明天的需求。”上海大学计算机工程与科学学院院长谢少荣一直在思考,如何将产业界最新研发的产品及时纳入到人才的专业培养中。在他看来,对于本科生,在低年级需要做的是系统知识的培养,但到了高年级,有一定共性的专业基础后,便可以和百度这样的互联网公司合作,将先进的算法模型和开源平台引入高校,提升人才培养的联动效应。
  类似的思考,存在于国内大多数院校中,对于新一代AI人才的培养,不同高校都在探索。
  西安交通大学是国内知名的工科高等院校,早在十年前,便开始探索“菁英班”模式,和科技与产业前沿的龙头企业合作,由校企双方共同制定培养方案,共建课程体系,企业的导师参与学校的理论课程教学,指导学生的项目设计、科创计划,目前合作的企业包括百度、华为、中兴、360等。
  通过采用多学科交叉、本硕博贯通的选拔方式,西安交通大学选择一些学有余力的好学生,成立“菁英班”后进行小班制教学,并且将学生原学习的专业和“菁英班”的前沿方向有机地融合起来进行培养。截至目前,全校已经建立了23个“菁英班”。从结果来看,参加“菁英班”学习的应届毕业生普遍认为自身的创新意识、工程设计与开发实践能力都得到了极大的提升。
  互联网公司对于这样的复合型AI人才,也是无比渴望。一直以来,飞桨致力于复合型AI人才培养,与多家知名院校达成了多项人才培养计划。自2018年开始举办“全国人工智能师资培训班”以来,百度飞桨已累计培养了2900多位高校教师,覆盖690多所高校。2021年推出《AI人才产教融合培养方案》,从内容、专项合作、服务层面,为AI人才培养提供了可供参考的产学研实践方案。