生产力的范式转移：一场AIGC带来的奇幻革命① | 创·享 CGC-XView_华创资本

邮箱 :news@@cgcvc.com

生产力的范式转移：一场AIGC带来的奇幻革命① | 创·享 CGC-XView

文章来源：发布日期：2022-12-02

AI-generated content（AIGC，即“AI生成内容”），被认为是颠覆现有内容生产方式的新一代技术，2022年8月，在美国科罗拉多州举办的新兴数字艺术家竞赛中，参赛者Jason Allen提交了一幅使用Midjourney完成的AI生成绘画作品《太空歌剧院》，他没有绘画基础但却获得了“数字艺术/数字修饰照片”类别一等奖，引发了全球科技界对AIGC的议论狂潮。

应用层快速爆红的背后则是预训练大模型的突破性发展。2020年5月OpenAI发布了GPT-3 语言模型，1750亿参数的GPT-3在问答、摘要生成、文本生成上展现出极强的通用能力；2021年，OpenAI为致敬《WALL-E》以及超现实主义画派达利，推出了新型人工智能模型 DALL-E，并快速优化到第二代。2022年9月20日，百度首次发布“2022十大科技前沿发明”，跨模态AIGC上榜。（编者注：跨模态通用可控AIGC提出语言与视觉统一的理解与生成模型，创新提出融合知识的生成，实现了文本生成、图像生成、视频生成、数字人生成的实用化跨越。可应用于图文转视频、高精度数字人生成、文生图等创新领域，大幅提升内容生产效率。）

随着海外迅速进入商业化和VC热捧的AIGC应用公司Jasper AI、Copy.ai、Stability AI等受到真实热烈的用户好评，以及被称为“模型届的Github”的Hugging Face的开发者生态崛起，AIGC正在逐步探索性地进入真实工业生产链条，应用到营销、游戏、代码、生命科学等多个领域。

11月19日，「创·享」CGC-XView AIGC专场线下闭门会，来自大厂、创业公司、学界以及投资机构的朋友们齐聚一堂，围绕“生产力的范式转移：一场AIGC带来的奇幻革命“进行了热烈的讨论。

本文摘取了当天讨论部分精彩内容，分享如下：

Outline：

AI是否真正进入应用爆发的时代，从研究模式转变为商业模式？
AIGC在文字、图片、视频等领域，能给业务流程带来更深刻的改变吗？真实生产环境中的部署会碰到什么问题？
模型开源化，下游及垂类应用将如何差异性发展自己的优势？
国内生态环境下，大厂会各自建立AI模型，还是会有中国的OpenAI？
海外由英伟达主导GPU和人工智能硬件，国内面临“芯片封锁”等问题该如何应对？
AI下一步有机会大幅提升效率的会是什么领域？挑战在哪里？

Q1. 中国会诞生自己的OpenAI 吗？
黄民烈：聆心智能创始人。自然语言生成、对话系统领域专家、清华大学计算机科学与技术系长聘副教授

中国和北美的商业和科技环境不一样，OpenAI这种技术见长的公司需要很多特别牛的工程技术人才，同时也非常烧钱。Open AI 现在收入应该比较少，远远覆盖不了支出，需要雄厚资本的支撑，这样的资本投入在中国还是挺难复制的，需要有远见的资金方支持。从技术层面来讲，中国人的技术不亚于欧美。在本土化实践技术、中文大模型等方面，我们甚至某些方面领先。

钟凯祺：某大厂数据科学家

AI技术的创新本质上是开创性的工作，背后一定要有一家大型的公司做资金支持，因为它是烧很多钱却看不到明确短期收益的事。如果要在国内做，问题就是谁来出钱。目前国内大厂暂时都更在乎经济上的表现。AI技术需要短期内用大的资本投入去引领未来开创型的模型，用短期的投入换10年后千倍收益的事。我理解大厂们现阶段很难是引领者或规划者，可能更多是技术追随者。当技术相对明确后，大厂的优势是能够快速跟上，找到落地场景，做大规模的落地，从而转变为企业内部价值和用户价值。

胡家康：就职于某大厂，负责AIGC/大模型相关的战略和投资

在我们的2C应用里，已经有不少内容是AI生成的了，甚至有一些广告的文案的撰写已经在大规模落地使用AIGC技术。我理解我们做这事的一个优势就是，投入资源做出来的一个大模型，它在内部是可以带来价值的。对外的价值点在于，一是，面向创作者或者广告主提供生产力工具；二是，技术引领；三是，开放API接口给应用层。不管做GPT-3还是DALLE2，其实都是开放了一个API 接口，让大家做应用。

Q2.当下是否到了应用大爆发的阶段？
陈雨恒：rct AI创始人&CEO

我在硅谷，接触的大部分投资人都很看重商业化落地，非常看重项目的metric，以及是否有很好的应用场景切入。例如，jasper.ai是具有标杆性的，它的增量做得非常好，一年收入做到了9000多万美金。我觉得未来5~6个月的时间，甚至是明年下半年，市场上才能迎来在产品侧或者商业侧的小高潮。大家还需要时间和资本来持续投入，总得来说行业都在追求实际的商业价值。

闫俊宇：计算机在读博士，北航 VR 国家重点实验室

从去年开始，学术界在多模态和AI生成方面有了比较大的突破，并且开始迅速迭代，一步步向业界演化渗透，今年上半年国内外很多比较好的案例和产品被快速推出，年中伴随着红杉美国的报告，AIGC在资本界迅速爆红，这里有明确的过程的演化。同时，如果我们横向看，去年底开始AI generative mode在不同的领域中也同样迅速发展，比如在蛋白质设计和电路设计等等都有了彻底超越传统方法，并且可以应用于实践的AI based mode。但在迅速发展的同时，我们也能看到这些尚处于相对早期，技术扩展是需要时间的。从理论、学术领域向其它领域拓展需要时间，从一个学术领域向其它服务领域的拓展的过程，也需要时间。现在最能够容易看到和离产品最近的，比如娱乐产业方面。向更深的工业领域渗透，塑造更大的变革不会是一蹴而就的。从现在开始算，明年下半年以及往后是一个持续扩张的浪潮，这个浪潮同时伴随着横向领域和纵向深度（和模式）的拓展，大家还是要从两个方面都进行关注。

王思捷：启元世界战略副总裁

AIGC应用的场景拓展，可能跟unity/Unreal有点类似，先在某一个比较直接的场景落地，比如游戏，再拓展到其他相似的数字孪生领域。启元提供的游戏策划端离线工具，可以用深度强化学习技术辅助策划生成游戏关卡、数值，也已经用到生成式大模型生成对话和做剧情创作。我们也在研究现在最火的文生图，如何真正地跟游戏美术结合在一起。文生图看上去很好，但可能对游戏美术画师来说没有多大价值。在整个生产流程中的前10%，即创意阶段，会有一定的参考作用，但仍无法嵌入到游戏美术生产流程，完整替代某一个环节。举个例子，比如线稿透视笔触，现在的技术根本无法在这个维度上去做调整，AIGC还理解不了。所以我目前感觉文生图大规模商业应用并不会那么快，未形成和场景的深度耦合。

Q3.真实生产环境中模型落地的问题是否有解决方案？

黄民烈：过去两三年，技术得到了很大的发展。AI模型在对话、智能写作、图像生成等领域已经接近甚至超过人类的水平。今天我们已经具备了做商业落地的可能性，找到比较好的场景。我们处在一个非常好的起点和时机，跟一些特定应用场景结合起来落地，商业路径上也会比较顺利一点。

闫俊宇：从商业的角度来看，关键是用好现有的技术水平解决需求，解决市场需求是第一位的。模型不能落地说明这个PMF是伪拟合的，这根本上不只是技术的问题，是商业逻辑就有问题。技术的发展是连续的，是一步步积累的，把需求的解决，寄希望于新技术的突然爆发是比较冒险的事。但整体而言，AI在越来越多的领域展现了可喜的进步，一个阶段的技术可以做出一个阶段的产品，满足一个阶段的需求，如果目前落不了地，那就去看看能用哪些落地的模型去解决其他问题。目前大型的工程，虽然使用了大量的数据，每个模块做了很多精巧的调整，看起来能解决很多通用问题，但是模型的作用、意涵、能解决哪些问题都是非常明确的，不能指望模型变大了，解决的问题更多更综合了，就更好落地了，落地不落地也不能单纯从技术侧去讨论。而且创业公司也不是要解决模型层的问题，是要解决技术和需求匹配的问题。

Q4：所以下游具体的场景和用户的数据是非常重要的。大厂的数据优势是否有助于解决方案？

钟凯祺：我理解当下AIGC的模型，创业公司也好，大厂也好，做的都是用产品去适配，让 AI 和人类之间能更好地互相理解，包括有很多 Prompt Engineering 的库，其实也试着在人类和 AI 之间搭桥，短期之内的突破肯定是来自于产品上的演进。
技术侧可以突破的点有两个，一个是可控性，一个是可解释性。当下的 AIGC 还有一定的黑盒性质，可控性决定着在工业的生产下，更加精准和稳定。可解释性，可以部分帮助解决版权问题。AIGC有一个很重要的关键点，就是版权和确权很多时候会出问题。过去的5 年，研究深度学习的人越来越多，如果把数据资产和数据的确权的问题给解决好，是一个比较重要的方向。

胡家康：我们去年年底已经发布了文生图，还有文本生成的demo，但当时用户量不及现在。今年4月份这一波火了之后，大家的应用场景越来越多。这个领域技术迭代的加速度非常之快，吸引了更多的创业者进入，相信大家会碰撞出更多的想法。
这个领域是一种全新的应用形态，对产品经理是个非常大的考验。整个创业生态一起探索创新，会给技术一个加速度。从技术迭代到应用玩法的加速度，这两波叠加在一起，我们是非常看好这一波机会的。

分享到：