解锁“魔搭”的强大“魔法”

14掌中乾坤

·解锁“魔搭”的强大“魔法”
·12306，可以买机票了！

解锁“魔搭”的强大“魔法”

你距离人尽皆知的大模型有多远？有人会说，不是“程序猿”，怎么能搞得出大模型，那是程序开发人员的事；有人会说，自己只擅长“调戏”大模型，用大模型找点乐趣。打个比方，如果说开发一个AI模型相当于做一道菜，AI大模型就像是提供“预制菜”，简单加热即食。对于程序开发人员来说，省去了开发AI模型从0到1的重复性劳动，大大提升开发效率，节约时间成本。不过，训练大模型并不简单，不仅需要“投喂”大量的数据，而且耗费的人工和费用都不菲，因此AI大模型都掌握在科技大厂或专门机构手中，公众的访问权限有限。2022年，在阿里举行的云栖大会上，AI模型社区“魔搭”ModelScope上线，并全面开源开放，点燃了AI 开发者们的热情。这是一个怎么样的平台？比如，开发者们可以访问全球的AI模型，感受它们的强大功能，也可以使用自己的数据对预训练模型进行调优训练（finetune），定制符合需求的个性化模型，而这一过程只需要十几行代码。甚至，开发者在社区里可以贡献自己的代码和想法，推动AI大模型的进步。
IT时报记者■潘少颖图东方IC
一键体验大模型
　　为了建好魔搭社区，达摩院率先贡献了300多个模型，包括自然语言处理、视觉、语音、多模态等各个方向，很多是预训练的多模态大模型。用阿里巴巴集团资深副总裁、达摩院副院长周靖人的话来说，“达摩院这次是倾囊相授了”。
　　魔搭社区分为模型库、数据集、创空间、讨论区等不同板块，每个板块都有对应的github代码链接和相关内容介绍，对于开发者来说，是一块“大宝藏”。
　　以“模型库”为例，包含了“LLM专题页”“智能通行”“基础视觉模型及应用”“信息抽取”等板块，点击对应的板块内容，找到所需要的模型，然后进入社区提供的github代码链接，找到对应的代码即可。
　　魔搭社区提供模型的索引和发现功能，每个AI模型都有自己的标签和相应的索引，让不同的模型使用者，能够根据自己的需求，快速地找到相应的模型。
　　语音合成是“大模型界”的基础，输入文字后，AI能够将文字转换为语音。如果希望AI朗读一段文字，应该怎么操作？
　　在魔搭社区，有两种方式可进行语音合成模型的体验：一种是使用“在线体验”功能，可以对每个语音合成模型进行体验。魔搭社区中的语音合成模型达上百个，选择任意一个模型，有关于该模型的介绍以及使用教程，比如要确保modelscope已经更新到1.4.0版本及以上，并通过指定命令下载安装依赖包等，一切准备工作完成后，输入文字，点击“执行测试”，等待片刻，便可试听语音合成的效果。
　　第二种方式是使用编程，通过简单的几行代码，就可以实现语音合成功能，并集成嵌入到具体的应用中去。值得一提的是，这些语音AI模型都配备了代码示例，可以在模型详情页的代码示例中找到。
　　对于开发“小白”而言，第一种方式更为简单。
　　其他的大模型操作方式也类似，从选择模型到体验使用再到生成模型，几步就能搞定。
　　“社区里面的模型实在是太多了，简直是学生党的福音！”一位学生开发者在参与魔搭社区测评阶段时表示。
一键实现“电子年货”自由
　　魔搭社区作为一个聚焦AI技术和模型的开发者社区，主要内容与AI技术的研讨、模型的使用与优化等更为相关。不过，这并不妨碍社区成员在业余时间进行一些富有趣味性和创意性的活动。
　　如果说上述生成大模型的功能更加适合于专业人士，那么魔搭社区上也有不少功能，可以给“非程序猿”带来乐子。
　　龙年春节前，魔搭社区上线了“AI年货工具包”，集合了一系列春节AI工具，可以制作新年表情包、生成龙年创意字体等。虽然春节已过，但这些玩法依然可以给生活加点“调料”，实现“电子年货”自由。
　　春节期间，记者在朋友圈里看到，不少好友发布的以龙为主角的图片中隐藏着自己的姓，这样的创意正是来自于魔搭社区。
　　在“AI年货工具包”中选择“龙年创意百家姓”，输入自己的姓氏，选择喜欢的创意风格和使用字体，就能生成创意百家姓。创意风格包括青龙迎春、赤龙贺岁等和春节相关的风格，也有奇幻卡通、复古油画、湖光山色等经典风格。其提供的字体除了楷体、宋体、黑体等常规字体之外，也有仿王羲之体、仿乾隆体、仿柳公权体等一些名家的字体。如果不喜欢官方提供的字体，点击“+”即可上传创意字体，展示个性化的艺术品味，不同的创意风格和不同的字体混搭，可以生成N种创意形式。当然，在有的图片中，要认出姓氏，需要眯着眼仔细揣摩。
　　还有“年画娃娃Cosplay”，提供男女各种不同的形象，有ACG风格、写真风格、可爱风格等。点击“创作形象”，上传自己的人脸图以及选中的模板图，即可生成造型，输出图像，让自己成为亲友群里最靓的仔。
　　不少大模型App提供拍摄全家福功能，摩搭社区也不例外，不过其生成的不是全家福，而是个人写真。上传自己的一张照片，系统就会检测脸部特征，并提取姿势，生成一张写真照片。如果上传的个人照片中有多个人，系统只会检测最大的脸部，此外，也可以上传第二张照片，第二张照片上并不一定是自己，系统只提取第二张照片中的人物姿势，把两张照片合二为一。