IT时报 -V61 新闻产业-
V61 新闻产业 下载阅读 上一版 |
61新闻产业
  • ·联手华为 科大讯飞“抢跑”万亿大模型国产算力平台
  • ·中电信量子集团开门红:量子密话用户超百万

星火整体超越ChatGPT 明年6月前对标GPT-4

联手华为 科大讯飞“抢跑”万亿大模型国产算力平台

  

IT时报记者孙妍
  “星火大模型3.0已经整体超越ChatGPT,医疗领域超越GPT-4,2024年上半年,我们将实现对标GPT-4。”10月24日,科大讯飞董事长刘庆峰宣布讯飞星火认知大模型实现了既定目标,他相信,通用人工智能是未来确定的机会。
  10月24日,在第六届世界声博会暨2023全球1024开发者节上,科大讯飞发布讯飞星火认知大模型V3.0,并与华为昇腾生态共同发布“飞星一号”大模型算力平台,开启对标GPT-4、万亿参数规模的星火大模型训练。
星火整体超越ChatGPT
  讯飞星火在2023年5月6日发布,此后便一直加速。8月15日,讯飞星火V2.0发布。
  10月24日,讯飞宣布星火V3.0全面对标ChatGPT,中文能力客观评测超越ChatGPT,英文能力对标ChatGPT 48项任务结果相当,尤其在医疗领域超越GPT-4。
  国务院发展研究中心国研经济研究院测评报告显示,星火大模型V3.0综合能力超越ChatGPT,在医疗、法律、教育行业的表现突出。
  不过,刘庆峰也提到,国产大模型必须正视与GPT-4的差距,“国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距离GPT-4还有差距。”
  跟讯飞星火V2.0比,V3.0版主要提升了数学自动提炼规律、小样本学习等技术能力,同时提升落地应用能力。
  自5月6日星火发布以来,讯飞开放平台新增大模型开发者17.8万,并与10万多企业客户一起用星火创新应用。此次大会上,科大讯飞发布12个行业大模型,包括金融、汽车、运营商、工业、住建、物业、法律等行业。
与华为成立“特战队”
  如今,算力紧缺已经成为大模型发展的一大阻碍,高性能AI算力芯片的禁令升级,这也为国产算力芯片空出一片市场。
  “华为致力于打造中国坚实的算力底座,为世界构建第二选择。”华为副董事长、轮值董事长徐直军在大会上表示,“飞星一号”将为更大参数的星火4.0提供算力支撑。目前,华为公司全球所有智能终端的语音技术都来自科大讯飞,未来华为将与科大讯飞在大模型领域开展更多合作。
  “飞星一号”是科大讯飞联合华为发布的大模型国产算力平台,是基于华为昇腾生态打造的自主可控大模型训练平台,用来训练对标GPT-4的、上万亿浮点参数规模的星火大模型。
  半年内,讯飞和华为成立的“联合特战队”实现星火大模型训练和推理效率均翻番。“华为专门派了特战队入驻科大讯飞,中秋节都在合肥加班,同时也感谢中国电信给的环境保障。”刘庆峰在大会上提到。
  2023年8月15日,讯飞星火V2.0发布会上,科大讯飞和华为昇腾AI联合推出星火一体机,其底层算力、AI框架、训练算法、推理能力、应用成效等AI能力都能“开箱即用”,每家企业或机构都能在这一国产大模型算力底座上构建专属大模型。
  “讯飞跟华为共同推出的讯飞星火一体机,它的性能已经开始对标A100。”刘庆峰曾在9月20日华为全联接大会上表示。
医疗大模型超越GPT-4
  在整体追赶GPT-4的过程中,讯飞星火大模型跑得最快的领域是医疗领域。
  科大讯飞表示其医疗领域大模型能力已超越GPT-4,其依据是实际使用数据抽查12万例,以及国家科技信息资源综合利用与公共服务中心(STI)第三方测试数据,星火医疗大模型在医疗海量知识问答、医疗复杂语言理解、医疗专业文本生成、医疗诊断治疗推荐的问题回答率全面超越GPT-4。
  10月24日当天,讯飞星火医疗大模型发布,搭载该大模型的“讯飞晓医”App也同步推出。
  今年5月6日就发布了讯飞星火认知大模型,为什么要到10月24日才发布医疗大模型?刘庆峰表示,早在2017年,讯飞智医助理就已经通过国家执业医师资格考试,排名超过96.3%的人类考生,首先给基层医院和等级医院的医生提供帮助,曾在辅助过程中挽救了一个新生命,将患者“疑似妊娠”的诊断修正为“先兆流产”。
  如今,医疗大模型从医院走入普通家庭。据统计,国内全科医生缺口达30万人,等级医院的医生能分配给每个病人的诊疗时间只有3分钟,看病之前问讯飞晓医,将大幅提升问诊效率,健康自查有效度提升40%。每年零售药店买药人次达67亿,购买非处方用药占比达45%,用药有疑问可以问讯飞晓医,帮助普通人更合理用药,高风险用药召回率提升90%。每年体检人次5.5亿,5000字体检报告眼花缭乱,讯飞晓医可以马上生成重点及健康提醒,帮助人们“对症复诊”。
大模型也有“人设”
  中国首批大模型版号发放至今,11家国产大模型获批上线,科大讯飞星火大模型是其中之一。
  自9月5日向全民开放后,已有1200万用户使用讯飞星火大模型,他们对大模型提出两大需求:“不仅能回答问题还要能提出问题”、“不仅要有知识还要有个性”。
  如何打造一个像人一样主动提问、又有“灵魂”的大模型?
  星火V3.0新增虚拟人格功能,可以为大模型打造人设,该功能已在“星火友伴”上线,可以跟哪吒、诸葛亮等人物对话。
  除了在C端实现从回答到提问、从知识到个性的能力突破外,大模型正在向工业和科研领域渗透。
  在本次大会上,唯一独立发布的产品便是智能编程助手iFlyCode2.0。讯飞星火大模型的代码能力尤其突出,在编程设计阶段提效50%、开发阶段提效37%、测试阶段提效44%。
  目前,中国约有800万软件从业人员,2022年软件业务收入10.8万亿元,占GDP比重8.93%,2028年预测将达到20万亿元。大模型为科研人员、程序员提供了生产力工具,20万行代码从Windows移植到linux,用传统开发方式需要花3个月,在iFlyCode辅助下,只需1个月。
  大模型也降低了开发者门槛。在讯飞星火上,已有1.5万助手开发者,开发超2.9万个助手应用。iFlyCode发布以来,已在京东云、软通动力等107家机构实现深度对接应用。今年11月份,几乎所有“中国软件名城”都会和科大讯飞开展相关合作。