当前位置:首页>货币平台

红杉资本:生成式AI 一个创造性的新世界

日期:2023-03-18

来源:玫瑰财经网

浏览:

    红杉资本:生成式AI 一个创造性的新世界

    文章:索尼娅黄和帕特格雷

    编译:深思熟虑

    AIGC(AI-Generated Content人工智能生成内容)是最近的热门话题,随着大量应用程序的下降,AI生成的照片、文字、音频、甚至视频等逐渐进入人们的日常生活。

    就在几个小时前,红杉文章网站上发布了名为《Generative AI: A Creative New World》的最新电影。这是否标志着新天堂Shift(范式转换)的开始(阿尔伯特爱因斯坦,美国作家)。

    让我们一起看一下这篇文章。原文作者是杉的两位合伙人:Sonya Huang和Pat Grady,有趣的是文章作者第一段,突然GPT-3的大名,文章插图也由Midder Journey生成。这篇文章本身是AIGC的落地表达。以下是原文的翻译。希望能给大家带来新的发现和思考。

    门人善于分析事物,但机器在这方面做得更好。机器可以分析数据集、检测欺诈或垃圾邮件、预测发货时间、预测应该显示哪些抖音视频等,找到很多使用案例模式。在这些工作中变得越来越聪明。这称为“分析性AI(AI)”或传统AI。

    但是人类不仅善于分析事物,还善于创造。我们写诗,设计产品,制作游戏,写代码。直到最近,机器在创造性工作中还没有机会与人类竞争。——被降级为只做分析和机械认知工作。但是最近,机器正在试图创造有意义的美丽的东西。这个新类别被称为“生成式AI(通用AI)”,意味着机器正在创造新的东西,而不是分析已经存在的东西。

    生成式AI更快、更便宜,在某些情况下比人类制作得更好。从社交媒体到游戏、从广告到建筑、从编程到平面设计、从产品设计到法律、从营销到销售,所有需要人类创作的行业都在等待机器重新创造。有些功能可以完全被生成的AI取代,而其他功能在人和机器之间紧密的重复生产周期中更有可能蓬勃发展。但是生成式AI在广泛的终端市场上需要解锁更好、更快、更便宜的创作。人们期待的梦想是生成式AI将创造和知识工作的边际成本减少到0,产生巨大的劳动生产率和经济价值,以及相应的市值

    红杉资本:生成式AI 一个创造性的新世界

    生成式AI可以处理的领域包括知识工作和创造性工作,其中包括数十亿人的手动工作。生成式AI可以将这些人工的效率和创造力至少提高10%,这比以前更快、更高效、更有能力。因此,生成式AI有可能创造数万亿美元的经济价值。

    01.为什么是现在生成式AI有更广泛的AI等“为什么现在(Why now)”的原因:更好的模型、更多的数据、更多的计算能力。这个类别的变化速度比我们能捕捉到的要快,但我们需要在大背景下回顾最近的历史。

    第一波浪潮:小模型(small models)占主导地位(2015年前),小模型在语言理解方面被认为是“最先进的”。这些小模型擅长分析工作,可用于从交货时间预测到欺诈分类的工作。但是,一般的生成操作缺乏表达能力。生成人类水平的文字或代码仍然是白日梦。

    浪潮2:规模竞争(2015年至今)、谷歌研究的开创性论文(attention is all you need https://arxiv . org/ABS/1706 . 03762)这些模型是可以相对轻松地针对特定领域进行定制的简单学习者。

    否则,随着模型的增大,他们开始输出达到人类水平的结果,然后就可以输出超人的结果了。威廉莎士比亚,《哈姆雷特》,新译本)从2015年到2020年,用于训练这些模型的计算量增加了6个阶段,结果在写作、语音、图像识别、阅读和语言理解方面超过了人类的表达水平。OpenAI的GPT-3性能尤为突出。与GPT-2相比,该模型的性能得到了显着提高,从代码生成到笑话编写,通过出色的Twitter demo得到了证明。

    所有基础研究都取得了进展,但这些模型并不普遍。它们巨大,难以操作(需要特殊的GPU配置),不能被更多的人广泛使用(无法使用或只进行封闭测试),而且用作云服务的成本很高。尽管有这些限制,最古老的生成AI应用程序也已经开始投入竞争。

    三波浪潮:更好、更快、更便宜(2022)、计算能力更便宜、扩散模型(diffusion models)等新技术降低了培训和运营成本。研究人员正在继续开发更好的算法和更大的模型。开发人员的访问权限从封闭测试扩展到公开测试,或在某些情况下扩展到开源。

    对于希望接触大型语言模型(LLMs)的开发人员来说,导航和应用开发的闸门打开了,应用程序开始大量出现。

    4波浪潮:随着杀手级应用程序(目前)的出现,随着平台层的稳固,模型将继续变得更好、更快、更便宜,模型获取将成为免费和开源,应用层的创造力已经成熟。

    正如移动设备通过GPS、摄像头、网络连接等新功能推出了新类型的应用程序一样,这些大型模型预计将引发生成的AI应用程序的新浪潮。正如10年前移动互联网的互联网被一些杀手级应用程序打开了市场一样,我们预计生成式AI的杀手级应用程序也将出现,比赛将开始。

    02.市长/市场结构下面是一个图表,显示了为每个类别提供动力的平台层和要构建的潜在应用程序类型。

    模型

    文本(Text)是最先进的领域,但自然语言很难正确使用,质量很重要。今天,这些模特在一般的中短篇形式的写作中相当出色。(尽管如此,它们通常用于重复或起草。) (阿尔伯特爱因斯坦,《Northern Exposure》,《艺术》)随着时间的推移,模型越来越好,因此应该能够期待更高质量的输出、更长格式的内容和更好的垂直区域深度。

    代码生成(Code generation)如GitHub CoPilot所示,可以在短期内对开发人员的生产力产生重大影响。此外,代码生成使非开发人员能够更有创意地使用代码。

    照片(Images)是最近才出现的现象,但已经像病毒一样扩散。分享推特生成的照片比文本有趣多了!我们看到,不同审美风格的形象模型和编辑和修改生成的形象的各种技术陆续出现。

    语音合成(Speech synthesis)已经出现了一段时间,但消费者和企业应用程序才刚刚开始。对于电影和播客等高端应用程序来说,听起来不是机械的,人类质量的语音是相当高的门槛。但是,与图像一样,今天的模型为进一步优化或实现应用程序的最终输出提供了起点。

    视频和3D模型远远落后,因为它们可以打开电影、游戏、虚拟现实、建筑、实物产品设计等大型创意市场。我们应该期待未来一两年内基本的3D和视频模型的出现。

    从音频和音乐到生物和化学,正在开发基本模型。下图是基本模型进展和相关应用可能的时间表。其中2025年以后的部分只是推测。

    应用程序

    下面是让我们兴奋的应用程序。这只是一部分。实际应用程序比我们捕捉到的要多得多。被创业者和开发者梦想的创造性应用迷住了。

    文案:越来越多的人需要个性化的网络和电子邮件内容,以促进销售和营销战略以及客户支持。这是语言模型的完美应用。这种文案往往是简单的,有固定的模板,这些团队的时间和成本压力会大大增加对自动化和增强解决方案的需求。

    垂直行业的写作助手:其中,产品差异反映在特定工作流的模型和UX交互的微调中。

    代码生成(Code generation):当前应用程序促进了开发人员的发展,大大提高了生产效率。在安装了Copilot的项目中生成近40%的代码。但是,更大的机会可能是赋予C端消费者编程开发能力

    红杉资本:生成式AI 一个创造性的新世界

    ,学习提示(learning to prompt)可能成为最终的高级编程语言。

    艺术生成(Art generation):艺术史和整个大众文化的世界现在都被编码成这样的大型模型,每个人都可以自由探索以前可能需要一辈子的主题和风格。

    游戏(Gaming):这个领域的梦想是用自然语言制作复杂的场景或可操作的模型。这个最终状态还有很长的路要走,但短期内有更直接的选择,例如纹理和天空盒艺术(天空盒艺术)的生成。

    媒体/广告:想象一下实现代理业务自动化、为消费者实时优化广告文案和创意的潜力。生成多模态的绝佳机会是将销售信息与互补的视觉效果相结合。

    设计:设计数字和实物产品的原型是劳动密集型的重复过程。AI根据大致的草图和提示创建高保真渲染成为了现实。随着3D模型的出现,生成设计的过程从制造和生产扩展到实物,你的下一个iphone应用程序或运动鞋可以由机器设计。

    社交媒体和数字社区:使用生成工具表达自己有什么新方法吗像Midjourney这样的新应用将像人类一样在社交网络上学习创作,从而创造新的社交网络。

    03.生成AI应用程序的解析生成AI应用程序是什么样子的以下是一些预测。

    智能和模型微调

    生成的AI应用程序基于GPT-3或Stable Diffusion等大型模型,随着这些应用程序获取更多用户数据,您可以微调模型,提高特定问题空间的模型质量和性能,同时降低模型的大小和成本。

    我们可以把big brain应用程序看作是一个UI层和大型通用模型“BIG brain”上面的“小BRAIN”。

    形成的因素

    今天生成的AI应用程序作为插件存在于现有软件生态系统中。例如,代码是在IDE中生成的,图像是在Figma或Photoshop中生成的,Discord自动机也是在数字社会社区中放置生成AI的工具。

    还有少量独立生成的AI web应用程序,如Jasper和Copy.ai用于文案,视频剪辑使用Runway,备忘录使用Mem。

    插件的格式可能是应用于初始入口点的生成AI,可以克服用户数据和模型质量方面的“先有鸡,先有蛋”问题。(具体来说,一方面需要分发足够的使用数据来改进模型,另一方面需要良好的模型来吸引用户。)。(译者:)我们已经看到这些战略在其他市长/市场类别中取得了成功,比如消费者和社交市场。

    交互范式

    今天,大多数生成的AI演示都是“一次性的”。也就是说,输入、机器输出、保存或丢弃,然后再试一次。以后,模型将支持迭代,您可以使用输出修改、调整、升级和生成更改。

    现在,生成的AI输出将用作原型或草稿。应用程序非常善于抛出各种想法,以便能够继续制作过程,如logo或建筑设计的各种选项,也非常擅长提供草稿,但需要最终修饰(例如,博客帖子或代码自动完成)。随着模型越来越智能化,部分依赖用户数据,在足够用作最终产品之前,应该预计这些草稿会越来越好。

    连续排业界领导地位

    最好的生成AI公司可以通过在用户粘度、数据和模型性能之间形成的飞轮获得可持续的竞争优势。为了胜利,球队必须通过以下方法实现这个飞轮。

    卓越的用户粘度更好的模型性能(及时改善、模型微调、选择用户作为标记培训数据)为了更多的用户增长和保存,使用优秀的模型性能。

    不是想解决所有人的问题,而是可以专注于代码、设计、游戏等特定领域。首先,您可能希望将深度集成到现有应用程序中,利用和部署自己的程序,然后用AI基本工作流替换现有应用程序。正确构建这些应用程序需要时间来积累用户和数据,但我们相信最好的应用程序会持续下去,机会会很大。

    04.困难和风险生成AI有很大的潜力,但在业务模式和技术方面有很多问题需要解决。版权、信任、安全、费用等重要问题也亟待解决。

    05.扩大视野的生成AI仍然很早。平台层刚好转不久,应用层领域才刚刚开始。

    我们要明确,不需要使用大型语言模型的生成AI来写托尔斯泰小说。这些模型现在足以起草博客文章并生成logo和产品界面的原型。这将在短期内创造很多价值。

    生成式AI应用的第一波与iphone首次出现时的移动应用场景——相似,虽然有点薄

    红杉资本:生成式AI 一个创造性的新世界

    ,但竞争差异化和商业模式不明确。但是,其中一些应用程序提供了有趣的观点,可以窥见未来可能发生的事情。一旦发现机器可以制作复杂的功能代码或精彩的照片,很难想象未来的机器在我们的工作和创造中不再起作用。(约翰肯尼迪)。

    如果允许我们几十年后做梦的话,很容易想象未来。生成式AI深深融入我们的工作、创作、娱乐方式。备忘录可以自己写,3D可以打印所有能想象到的东西。从文字到皮克斯电影、Roblox等游戏体验,可以迅速创造丰富的世界。阿尔伯特爱因斯坦,Northern Exposure,这些看起来像今天的科幻小说,但技术进步的速度惊人。从小型语言模型到代码自动生成,只用了几年的时间。如果我们继续跟随这个变化的速度,跟随“大模型模型‘s Law’”,那么这个遥远的场景就可以到达。

    单击下载

    European Exchange金融投资European Exchange(也称为Eurokx)是世界领先的数字资产交易所,为全球用户提供比特币、莱特货币、以太网货币等数字资产的现货和衍生品交易服务,并使用区块链技术为全球交易者提供高级金融服务。这是一个非常古老的数字货币交易平台,平台为我们提供安全、专业的数字货币交易经验,为新手提供完整的流程指导,使其易于启动,通过客服24小时在线回复提供最佳服务。

相关文章阅读

Copyright (c) 2022 玫瑰财经网 版权所有

备案号:冀ICP备17019481号

玫瑰财经网发布此信息的目的在于传播更多信息,与本站立场无关。玫瑰财经网不保证该信息(包含但不限于文字、视频、音频、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。
相关信息并未经过本网站证实,不对您构成任何投资建议,据此操作,风险自担。