IT时报 -V9 新闻产业-
9新闻产业
  • ·“教主”黄仁勋:GPU只是开始 留些惊喜给未来

“教主”黄仁勋:GPU只是开始 留些惊喜给未来

英伟达推出史上最强自动驾驶芯片每秒可运行200万亿次

  

IT时报记者郝俊慧
  2小时20分,NVIDIA(英伟达)创始人兼首席执行官、“教主”黄仁勋在2019 GTC China上的主题演讲,比预计时间多了20分钟,但他依然有点遗憾,“时间太短,我们还有更多产品。”
  一袭黑色皮衣、一句口头禅“The more you buy,The more you save(买得越多,省得越多)”、狡黠而天真的微笑……如果全球IT圈评选“最有魅力创始人”,黄仁勋一定榜上有名,他一手创办的NVIDIA,是当前人工智能领域最重要的推动力量,其主要产品GPU在深度学习训练中具有不可替代的作用,截至目前,NVIDIA已售出15亿块GPU。
  刚刚过去的1年,英伟达过得不算太顺利。2018年11月16日,GTC China 2018开幕前夕,英伟达股价创十几年最大单日跌幅,此后股价一路走低,今年6月,甚至探底至133美元。而11月英特尔推出GPU的消息,被认为NVIDIA迎来最强大的对手。
  这也许可以解释,黄仁勋为何在12月18日的GTC China 2019大会上反复强调,NVIDIA是一家“系统架构公司”,有统一、开放、可靠的架构,可以让开发者在此基础上去开发软件,甚至在他发布的“三个核弹”中,除了光线追踪技术RTX和NVIDIA全新自动驾驶芯片DRIVE AGX Orin与硬件搭边之外,最新一代推理软件开发套件NVIDIA TensorRT 7编译器和为机器人提供更新AI感知和仿真功能的Isaac SDK平台,都很“软”。不过,黄仁勋并不认为这种变化很突然,“我们是为未来做产品,有一些惊喜要留给未来。”
  计算机图形处理器(GPU)、高性能计算(HPC)以及人工智能(AI),黄仁勋在GTC China 2019上高调宣布的三个领域,或将推动英伟达重新成为“市场宠儿”。
  事实上,资本已给出了部分答案:截至12月18日(美东时间)收盘,英伟达股价定格于229.51美元,本月涨幅10%。
Orin:要做自动驾驶的“创世者”
  “你们知道Orin是谁吗?”黄仁勋狡黠地问记者们。
  众人茫然。“索尔的爸爸,众神之父,创世者。”
  恍然大悟。
  就在1个小时前,黄仁勋刚刚在GTC China 2019主题演讲环节,发布了NVIDIA自动驾驶和机器人的高度先进的软件定义平台——NVIDIA DRIVE AGX Orin,该平台内置全新Orin系统级芯片。
  Orin芯片由170亿个晶体管组成,NVIDIA 开发它用了4年时间。Orin系统级芯片集成了NVIDIA新一代GPU架构和Arm Hercules CPU内核以及全新深度学习和计算机视觉加速器,每秒可运行200万亿次计算,几乎是NVIDIA上一代Xavier系统级芯片性能的7倍。如此强大的算力,想必是Orin命名的由来。
  不管Xavier还是Orin,设计目标只有一个,实时传感器计算堆栈和本地化规划。也就是说,本地计算能力最够强大,从而使自动驾驶的车辆可以及时根据路况做出反应。
  这将真正打破束缚目前自动驾驶研发困境,毕竟,哪怕是网速足够快的5G,也很难保证能够覆盖所有的路段,靠云端计算做紧急判断,在自动驾驶时,是不现实的。
Isaac:让机器人自己会学习
  如果说大会上最受欢迎的是黄仁勋,那么,第二受欢迎的应该是英伟达推出的物体操控机器人——Leonardo。
  加速计算的终极目标,是人工智能。大会上,NVIDIA发布了全新版本Isaac软件开发套件(SDK),它将可以为机器人提供更新的AI感知和仿真功能。Leonardo则是训练的成果。
  每台有自我意识的机器人都始于感知。为了加快AI机器人的开发速度,全新Isaac SDK包括各种基于摄像头的感知深度神经网络。和黄仁勋一同成为舞台主角的Leonardo,可以通过摄像头模拟学习抓取方形彩色木块,并将其堆叠在一起。这是因为,Isaac SDK可以对自由空间进行分割,检测和分割外部世界,例如确定机器人可以在哪里行驶,并且对外界。“仿真,对于机器人从无限可能的场景中学习非常重要。”黄仁勋认为,人工收集和标注的数据不可能用于训练感知规划类型的人工智能,Isaac Gym,是Leonar
do的仿真训练空间,它模拟了RGB(红绿蓝)和景深摄像头及Franka机器人传动装置,在模拟世界中,机器人和物体变化同样要遵循物理规则,而Leonardo则通过在虚拟和真实世界中学习,成为一个真正意义上的机器人。
“黑衣教主”的朋友圈
  每年的GTC China,也是“黑衣教主”炫耀朋友圈的时候。
  一开场,黄仁勋便感谢了到场的6100参与者,这个数字比三年前增加了250%,同时到场的,还有64家赞助商和参展商,大屏幕上,罗列着百度、阿里巴巴、戴尔、浪潮、腾讯云等公司。
  当然,真正强大的朋友圈,是真金白银的合作。
  除了在微软畅销游戏《我的世界》中支持RTX(实时光线追踪技术),提供更逼真的图形显示外,英伟达还官宣了6部支持RTX的游戏,其中有腾讯北极光工作室开发的《无限法则》和大宇开发的《轩辕剑染》。实时光线追踪技术,是指芯片可以模拟光线在视觉场景中反射的能力,它有助于视频游戏和其他计算机图形更接近真实世界中的阴影和反射。
  国内最大的自助式云渲染平台——瑞云采用了RTX的方案,使在瑞云上渲染的速度提升了12倍,价格却低了7倍,原本需要花费485个小时渲染的场景现在只需不到40小时。
  同时,黄仁勋还宣布将与腾讯游戏合作推出START云游戏服务,通过这个平台,腾讯游戏的玩家,即使在性能不足的终端上,也可以通过与云端实时交互,获得与本地游戏一样的体验。
  有了T,B和A自然也不能落下。
  百度正在打造的AI Box深度推荐系统,采用的是Wide和Deep结构,有100多个推荐模型,这些模型每周都会更新,学习用户的潜在兴趣。如果依据用户偏好做推荐,至少有千亿个维度,10TB的内嵌表,而这样的计算量用CPU做基本上不可能。迁移到英伟达GPU后,百度的训练成本削减了90%,阿里今年的双11也用了NVIDIA AI。今年的双11,天猫单日销售额达到2684亿,每秒有几十亿次推荐请求,CPU很难满足这样的计算负载。“阿里巴巴的模型用CPU的话,每秒只能处理3个请求,而由于基于GPU的深度学习模型和传统的内容过滤不一样,它可以处理非结构化的数据,T4 GPU可每秒处理780个请求。”黄仁勋又重复了一次780,“The more you buy,The more you save”。
  另一个中国好伙伴是滴滴。双方宣布,滴滴将在数据中心使用NVIDIA GPU训练机器学习算法,并采用NVIDIA DRIVE为其L4级自动驾驶汽车提供推理能力。今年8月,滴滴将其自动驾驶部门升级为独立公司。
  作为滴滴自动驾驶AI处理的一部分,NVIDIA DRIVE借助多个深度神经网络融合来自各类传感器(摄像头、激光雷达、雷达等)的数据,从而实现对汽车周围环境360度全方位的理解,并规划出安全的行驶路径。
  与爱立信合作5G、为华大基因加速的Parabricks、基于ARM的首个参考架构NVIDIA HPC……这份名单,还很长。