IT时报记者孙永会 潘少颖
AI,正在渗透到生活中的每个角落,让生活充满智慧。晨曦中,智能闹钟轻轻响起,新的一天开始了;厨房里,智能冰箱记录着食品的保质期,提醒主人及时消耗食物;办公室里,智能助手协助职场人士处理繁杂的工作;病房里,AI机器人细心地照顾着病患,减轻医务人员的负担;学校里,智能教育系统为孩子们打开了知识大门。除了可见,AI技术还可用、可控。手机内一些熟知的应用也加持了AI“基因”,既能为用户提供乐子,还能为上班族提供办公工具和点子,让工作增效,也让生活“有料”。于是乎,这些有“AI基因”的App成了我们生活中不可或缺的一部分。它们,不仅仅是一种工具,更是人类与数字世界之间的桥梁。做视频、写文档、玩游戏……希望这些App在新的一年中,助你在工作上锦上添花,生活中一路繁花。
大模型类:百模大战,有趣有灵魂
似乎没有哪个领域能离开大模型,更多的领域和大模型“亲密接触”,并且迭代速度不断加快,“硬核能力”不断提升,打造像人一样主动提问、又有“灵魂”的大模型。
文心一言:信息、知识、灵感一应俱全
文心一言是百度发布的大语言模型,2023年底,用户规模已突破1亿。该模型能够与人对话互动、回答问题、协助创作,高效便捷地帮助用户获取信息、知识和灵感。
时下,“AI贺新年”成为文心一言封面上的标识,近日,其还上线了数字分身功能。进入文心一言后,点击左上角的AI符号,即可创建“数字分身”。仅需一张照片,并依次填写姓名、声音、性格等信息,用户便可创建自己的数字分身。这个独特的虚拟伙伴,可以理解用户指令、与用户进行对话,并具备用户的个性化特征。
写文案、想点子、唠家常……在对话栏,《IT时报》记者以“写一句冬天的文案”为要求,几秒内便得出一句较有逻辑和画面感的句子——冬日里,雪花飘舞,大地银装素裹,一切都显得那么纯净和宁静。让我们在这个洁白的季节里,感受那份独特的宁静与温馨。
社区专栏亦有智慧,AI艺术字、AI全家福、AI人格测试、AI画肖像、AI科学分析姓名等,比如点击“AI科学分析姓名”后,出现的信息包括姓氏起源、姓名逐字分析、性格预测等,用户可以了解姓名的“前世今生”。新展望当然,文心一言会继续提升其自然语言处理(NLP)能力,包括更准确的语义理解、更丰富的对话生成、更精细的情感分析等。也可能会推出支持语音、图像、视频等多种输入方式的交互功能,让用户可以通过更多元化的方式与文心一言交互。
讯飞星火:会识图创作会做数学题
拍了美图想“秒发”一个图文并茂的朋友圈?张嘴就想画出脑海里突发奇想的图画?输入一段文字,一键就能生成声情并茂的短视频?
无论是图像描述、图像问答、识图创作还是文图生成、虚拟人合成,讯飞星火都能“拿捏”住。在经过几次迭代后,其能力也稳步增长,比如相较于V2.0,V3.0版主要提升了数学自动提炼规律、小样本学习等技术能力,同时提升落地应用能力。
不久前,科大讯飞发布了讯飞星火认知大模型V3.5,不仅在数学、语言理解、语音交互能力上有了提升,还在核心技术上有了突破。如在数学问题解决的能力方面,新版具有更高的计算和推理能力,它不仅能够准确理解自然语言的深层含义,还能够根据上下文进行合理的推断和回答。此外,在进行多轮对话时,它还能够更好地保持话题的连贯性。新展望“星火大模型3.0已经整体超越ChatGPT,医疗领域超越GPT-4,2024年上半年,我们将实现对标GPT-4。”这是科大讯飞董事长刘庆峰定下的一个目标。实际上,讯飞星火V3.5已经在多项能力上直接对标GPT-4,可以预见的是,接下去在更多领域会看到讯飞星火的身影。
剪辑类:AI新玩法,让创作更多元
简化视频剪辑的流程,释放创造力,实现智能化的视频分析和理解,让创意迅速转化为触手可及的作品,这就是视频剪辑类App的作用,用AI让每个人都能挥洒创意与情感。
剪映:AI功能“全而智”
作为一款视频编辑软件,剪映主打全能好用,可以一键剪切视频,自由掌控节奏快慢。此外,拥有海量的曲库和抖音独家歌曲,能让视频更加“声”动。在视频编辑和剪辑方面,用户可基于变速、变声、画布等基本视频要素进行编辑;在剪同款方面,用户可以根据卡点、美食、萌娃等模板进行创作;创作学院主要为用户提供脚本构思、拍摄、剪辑、调色和账号运营等方面的课程。
当视频软件和AI技术融合,会产生怎样的化学反应?
首页上的一键成片、图文成片、创作脚本、录屏、提词器、美颜、超清画质等要素体现了功能齐全和制作便利,而智慧则在AI作图、AI商品图、AI特效、智能抠图等功能上。以AI作图为例,《IT时报》记者以“一个山村,有一个老人,在农田,有阳光”为关键词,在极短的时间内呈现出一个带有这些元素的生动画面。当点击“再次生成”时,同一关键词则会呈现出新图案。
火热的“AI玩法”存在于“剪同款”功能区,如某一风格的AI写真、一键AI变回儿时、一键生成AI婚纱照等玩法,模板多样,可选择性多。新展望剪映的多个AI功能可圈可点,比如利用AI技术对视频进行智能分析,快速识别视频中的精彩片段并剪辑等。2024年,通过AI技术,剪映可能推出更加智能的语音识别功能,自动将视频中的对话转化为字幕,并支持多种语言;也可能会提供智能剪辑建议,根据视频内容,自动推荐适合的剪辑手法、特效和音效。
腾讯智影:数字人出镜
腾讯智影集素材搜集、视频剪辑、后期包装、渲染导出和发布于一体。不同于App模式,其无需下载,通过PC浏览器即可访问。
“大家好,我是腾讯智影推出的数字人小天,很高兴认识大家。”数字人功能是该平台的一大亮点。小天、浩辰、依丹、冰璇四个角色各有“人设”,如浩辰有百余种播报语音,依丹适用于各类场景播报,冰璇则能24小时不间断地进行电商直播。登录后可发现,数字人的角色更为丰富,用户选择角色后可定制专属数字人形象,输入文字即可生成视频,在教育培训、知识科普、直播带货和新闻资讯等方面,这些数字人深受欢迎。
文字配音是腾讯智影的又一亮点功能,可直接将文本转化为语音,并提供近百种仿真声线,风格涵盖视频配音、文章播报、新闻播报、有声小说、内容朗诵等。此外,用户还可以选择磁性、甜美、二次元、亲切、温婉等音色。
除了上述两大功能,AI绘画亦是重要功能。点击“进行创作”后,页面会提示输入关键词,以逗号分隔,同时,还会推荐画面比例和模型主题。新展望这是一个智能“工具箱”,有视频剪辑、智能抹除、文章转视频、写作助手、智能抠像、智能变声、智能转比例、视频解说等“魔法”。我们期待的是,随着VR和AR的发展,腾讯智影能将虚拟现实和增强现实技术融入视频创作中。用户可以轻松创建沉浸式视频内容,提供更真实的视觉体验。