生成式AI和Web3
真无牙泛
发表于 2023-3-6 18:45:32
196
0
0
但这么烧钱也不是啥大问题,因为微软刚刚向OpenAI投资了100亿美元。加上Azure的硬件和Bing的流量分发(这是我从未想到的),ChatGPT的流行度已经跨越了成见的鸿沟。. E1 E. p1 z/ g; ?0 a
不过,参与竞争的不仅仅是微软。谷歌母公司Alphabet的生成式AI产品的demo版失败后,股票市值损失了1000亿美元。阿里巴巴和亚马逊分别宣布了他们入局,与ChatGPT争夺人工智能的主导地位。而苹果很可能会把Siri作为进入该市场的前锋产品。3 ?9 _) V e" r- G/ H# j8 ~% f% [
人工智能工具的这种爆炸式增长,源于人们现在发现人工智能真正有用了。当加密货币、无人机或自动驾驶汽车这样的趋势在市场上兴起时,它们的进入门槛很高。但你现在就可以用人工智能来作弊帮你完成家庭作业,ChatGPT甚至立马可以让你在交友网站Bumble上看起来超有吸引力。而对于加密货币,你只能购买一个代币(指NFT——译者注),并假装它是你个性的全部。
阿瑟·克拉克(Arthur C. Clarke)曾经说过,“任何足够先进的技术都似乎和魔法无异。”人工智能已经演进到到足以让社会中的大部分人相信它是魔法。仅2022年第二季度,就有170亿美元的资金投入到与人工智能相关的公司中。来自FAANG公司、风险投资基金和散户投资者的兴趣汇合在一起,使得该技术似乎已经准备好吸引散户的注意。' m* X4 ?$ _7 C; j( S1 c: x$ v
在过去的几周里,我们一直在努力理解该行业正在发生的事情,以及它在未来十年可能产生的重大影响。本文总结了我们对该行业(有限的)理解,以及为什么我们认为区块链和人工智能将在未来十年内相互融合。但在之前,让我们重温一下经济学的一些基础知识。
注意:在本文中,我会在AI模型和模型之间进行切换。为了方便阅读,任何地方提到“模型”一词都指生成式AI模型。
消失的稀缺性
人类作为一个物种的历史,是由我们与稀缺性的抗争来界定的。人们相信,人类在数万年前开始迁徙,以寻找更加青翠的牧场。一旦人类学会利用火和农耕的力量,我们的祖先就繁荣了起来,整个文明也应运而生。之后人类越走越远,开始跨洋贸易,以确保社会拥有所需的资源。
一旦一个文明不再需要担心食物或保护自己免受自然环境的影响,人类就会专注于争夺地位。中国长城、埃及金字塔、印度泰姬陵和欧洲文艺复兴时期的大教堂,就其本身而言,都是地位的象征,它们在各自时代的社会经济结构中起着重要作用。而人类之所以能追求需要耗费数万人数十年劳动的事业,是因为不需要担心这星期能否吃上饭。# L* ]3 w" f4 `# r1 o! C8 ^; e
随着人类过渡到追求地位的社会,技能和服务变得稀缺。除了政治领域外,到了14世纪,人类对战争英雄的赞颂减少了,而开始更多地欣赏艺人、艺术家和发明家。$ r; |: s1 u& }. ~. P4 D
看看莎士比亚、米开朗基罗或班克斯的作品。这些艺术家有着独特的解读世界的方式,需要长时间地深入文化体验中。如果没有长时间浸淫其中,人类就无法创造文化。
稀缺性变得不再只是人类为物质生活而消耗的商品,而是那些激跃我们精神的东西。需要几十年时间才能出现一位“一代巨匠”,因为产生他们的环境是很难复制的。即使有几百人在1990年代的纽约布朗克斯区有着同样的生活经历,也只有一人变成了身价数十亿美元的说唱大亨Jay-Z。而很少有人知道这些天赋异禀的人出现在哪里或如何出现。. Q2 O% R. ]' {6 ^
一个技能稀缺的社会奖励卓越的才华,给予高昂的报酬。我们常听到欧洲文艺复兴时期建造大教堂的艺术家们一旦被委以重任,任期就会长达数年。但在过去几个世纪的大部分时间里,经济产出与能量的投入呈线性关系。我们要么燃烧能源(为工厂提供动力),要么让人类消耗劳力来从事生产。
财富的创造主要依赖于能调用的人力(或资源)的数量。这就是为什么人类历史上有奴隶制这样痛苦的经历。财富的增长呈线性轨迹,并往往依赖于掠夺。7 c. K/ e1 G; f& W4 V( |2 @ y E% D
代码和服务器改变了20世纪的发展路径。突然之间,人们不再需要入侵远方的土地或者迫使他人服从你的命令。正如纳瓦尔所说,代码和媒体是新的杠杆。写代码使你能拥有一支机器人军队服务于你。想一想 Instagram 或 Tiktok:+ W. ?( K! x% C3 K
这些平台雇用的人数往往与用户数量不成正比。通过添置硬件,就可支撑更多的用户,从而扩大规模。' }+ g" |+ G- I) f i
这个富足的时代,可能首先以1990年代初互联网的诞生为标志。例如,垃圾邮件是通信成本暴跌的结果。Limewire和Napster是数字存储和带宽价格暴跌的产物。游戏和社交网络是数百万人聚会的数字城镇,但我们不再关心容纳这些活动的“空间”的稀缺性。
只要是以数字方式提供的服务,容纳更多需求的边际成本就会急剧下降。互联网的大部分是“免费”的,象征着我们的世界逐渐数字化,稀缺性作为一个概念逐渐消失。纳瓦尔在下面的视频中解释了这种新发现的“丰饶性”。 1 S z O. K5 a$ N' j
/ j/ L" d2 u) Z
https://youtu.be/GtyWqj2ESiQ% u4 |- x# m1 r2 l- S
开发人员类似于文艺复兴时期的熟练工匠。他们掌握获得杠杆并为自己制造工具赚取大量收益的能力。但这正在慢慢改变。而微软在同一周既解雇了1万名员工,又投资了100亿美元到ChatGPT背后的OpenAI,反映了这种鲜明对比。 h8 i, ?. r; N0 e9 e- q* B7 m
我不是要引起恐慌,暗示开发人员很快就会变得多余。他们不会。但我们将迎来一个由AI赋能的新型劳动时代。这正是今天风光无限的生成式AI。
创造富足4 O5 a7 c. ]1 H( x1 ^
我们生活在一个富足的数字消费时代,流量传播不再需要花费很多。当我写就本文的时候,把它分发给1000个或10万个读者的成本是一样的。Substack不按浏览量收费,因为为分发所依赖的基础设施可以快速扩展。不过,尽管有将内容分发给更多人的渠道,但规模的两端都带有稀缺性,这是由人类注意力的局限所决定的。5 u* W& L1 t* i+ J
作为一名作者,我的创作产出受时间限制。作为读者,你只想从我这里读到有意义的内容。; h1 B7 k3 `. E5 W
我们之所以看到ChatGPT和生成式AI等概念的爆发,是因为生产和消费的单位经济学正在被颠覆。人们最后一次看到如此深远的影响可能是在印刷术出现时。书籍降低了人类思想的存储和传播成本。在英国,识字率从5%上升到50%花了四个世纪的时间,但人们现在每天的阅读时间已长达~2小时。* X6 K9 z3 l4 Q; X& B( F
这种知识行为的变化直接推动了启蒙时代的到来,这是一个以科学和哲学的快速发展为标志的时期,康德、伏尔泰、笛卡尔和亚当·斯密等人永远改变了我们的世界观。每当人类找到存储、分享和发展思想的新方法时,就会做出相当酷的事情,无论是在洞穴壁画还是在谷歌文档中。
让我们先了解一下生成式AI现在可以做些什么,看看它如何降低生产和消费成本。目前,像ChatGPT和Midjourney这样的应用程序仅有一个目的:基于它们所接收的数据,创建出令人信服的输出。这些数据通常来自于已公开的信息。( f$ k$ g2 V+ X Y3 @$ X+ t+ q
OpenAI的ChatGPT使用来自书籍、维基百科和期刊的数据以创建其文本回复。Stable Diffusion是一项生成艺术作品的服务,最初依赖于库存图片。Github的Copilot使用平台上数十亿行代码来辅助开发人员。
本质上,生成式AI会取用公开信息,对其进行合成,并根据用户上下文予以处理。这里的上下文可以是“用五岁孩子的语言解释比特币”或“展示加密货币在迪拜下雨”。AI平台会根据这些提令,在几分钟内创造机器生成的回复。
通常情况下,输出的结果往往并不足以令人信服,但经过适当的调整,你最终会得到一些像人类产出一样的东西。只要主题是通用的,并且你不期望有个性化的元素。
摘自红杉关于生成式AI的文章(https://www.sequoiacap.com/article/generative-ai-a-creative-new-world/)
那么我们现在进展到了什么程度呢?红杉博客上的上图很好地展示了当前的现状。AI模型现在可以接受文本输入,实时编辑并改变语气,这同样适用于图片和代码。其原因是有大量的数据集可用于训练生成式AI模型。如果我们以前需要花大量时间,而今只需要其中的一个小零头,就可以阅读和处理来相同数量书籍的知识,或创作相同的艺术作品,那么我们将不可避免地达到一个过度饱和的状态。对于更复杂的任务,比如电影或音乐的编辑,需要更多的人力参与。但是AI确实使这个过程更加高效。7 g' F' a, p9 O9 @
具有讽刺意味的是,AI已经被用于总结和提供大量工作的关键洞见。这里的挑战在于缺乏归属权和可验证的来源。例如,ChatGPT可能会在缺乏公共领域信息的情况下给我错误的答案。它不说明用于生成响应的数据来源。这就是目前生成式AI的危险所在。
我们可以创作无数的作品,却找不到什么或谁是它的灵感来源。而在某个时候,我们要依赖这些源头来处理无无穷无尽的内容,并告诉我们其中的重要信息。9 L% r" k; x8 I1 a
过去几周我的推特内容是什么$ w# ~; q$ F7 ~+ N( V; {9 D
如果没有追踪来源的基础设施或验证人工智能模型的机制,生成式AI将无非是今日互联网的翻版而已。一大堆由算法驱动的假新闻,根据用户偏好来推送内容来提升留存率。虽然生成式AI可以使每个人成为艺术家,但可能会让最初制作出AI模型用于自我训练的人被边缘化。这将是富足时代中的一项关键挑战:当每个人都从中受益时,如何确保使用的作品(以艺术、文本或代码的形式存在)被正确归属和有效地商业化?0 V: x' K: g, _
互联网已经为这个问题提供了答案。像Instagram的Reels和Tiktok这样的平台极大地依赖第三方艺术家的音乐。用户“混剪”音频,制作出朗朗上口、时尚、短小的片段,内容从舞蹈动作到烹饪无所不包。TikTok发布了SoundOn来帮助艺术家上传作品和变现。在这些情况下,平台有责任获得授权并支付版税。当媒介相同(音频)且分发渠道由平台拥有时,这是一个简单的任务。( i- R" K- D+ M) | |& B* e
您可能已经读到一半就感到疲惫,这篇文章很长。因此,在继续阅读本文更复杂的部分之前,休息一下,看看我最近在Instagram上看到的这个混剪作品。它是一件甜美的艺术作品,也是版权律师的噩梦。
这也是数字媒体使身处不同地点的人共同混搭一个作品的文化“融合”的优秀例子。' X* w* m$ D7 s0 b' n* s8 W
https://youtu.be/BXlzxDl32ic+ a+ Z3 N& Z2 G9 T3 Y8 k6 @
好了,言归正传吧。
如果涉及到多个作品的混剪二创,那么情况就变得复杂起来——尤其是如果这些混合作品是由平台外的用户制作的。还记得我之前提到的用莎士比亚的风格改写《哈利·波特》吗?这还比较简单,因为你只需要处理两个人的作品。但如果我们要用《权力的游戏》的情节,以莎士比亚的风格改写《哈利·波特》呢?这里就涉及到三个人要分享版税了。& M, ^' _) Z7 a$ a
目前,生成式AI面临的挑战是,需要使用几百人的作品来创建成千上万个输出,但这些作品没有被识别、归属或追踪。. i5 p9 w( O3 {7 k. a5 N
通常情况下,制作这些作品并不需要付出成本。我可以在 ChatGPT 上每天运行数百个指令,直到得到满意的输出。当今的社交媒体网络与赌场老虎机有很多相似之处。用户花费数小时寻找能够带来巨大多巴胺刺激的内容。
随着生成式AI的出现,我们正在激励人们随意运行指令,直到得到理想的输出。但是有一种方法可以解决这个问题,那就是强制实施成本。在NFT领域我们有关于此的一些早期尝试。6 G+ i" F9 d* x% }, \/ t* k
可验证的真相5 X/ g4 G `6 ]5 p/ W+ M( B
20世纪70年代以来,复制粘贴功能就已经存在了。翻阅年轻一代的Instagram标题,你就会意识到人们在大量使用这项功能。一项简单的技术,改变了我们对复制的看法:NFT。
当然,你可以复制一张无聊猿的图像!但只有一种方式可以拥有它,通常意味着在获得它时要支付一笔钱。即使可以轻松复制,拥有独特的资产仍然变得令人向往,这种变化是由区块链引起的。区块链使得实时全网验证你真正拥有的资产成为可能。
有人可能会说,这项技术在现实生活中并没有很多的应用场景。但如果生成式AI和区块链这两种工具融合在一起呢。生成式AI的大部分内容不久将严重依赖于版权。像迪士尼或Netflix这样的大型制片厂拥有我们在童年和青少年时期喜爱的角色的版权。! c/ r/ }. s4 d
人工智能将使这些制片厂(工作室)能够创建定制的和个性化的派生品,通过触及受众最深厚、珍贵的记忆来与他们沟通。如果钢铁侠可以教孩子数学呢?如果天行者达斯·维德能给出约会建议又如何?没准许多人能靠这些脱单呢。
当然,制片厂可以拥有并发布这些人工智能生成的聊天机器人或互动角色的产品。但是,结合区块链将使得他们能够跟踪、验证和收取版税。他们可以设立一个开放的市场,任何人都可以来创作,而不是将创作的应用程序的种类局限于在制片厂工作的开发人员的能力边界。实际上,任何持有大量IP的公司都可以通过允许派生作品而过渡成为规模化的平台。
让我解释一下这意味着什么。想象一下,我决定让 Linkin Park 的 Chester Bennington(已故)来朗读我为您写的这篇长文,持有他IP的遗产继承人和持有他声音合成版本的工作室很快就可以让我获得授权。但这将是一个冗长而费力的过程,涉及到律师和惊人数量的文书工作。这似乎很愚蠢,但围绕已故名人和IP权利已经有一整个产业。
假设 Chester 的声音权利是在区块链上的,它可以被授权给全球几百名个人。当然,也有理由担心声音可能被误用,例如被用于深度伪造或被用于逝者不愿意与之相关联的内容。但是,如果这些权利定价足够高,进入门槛就会淘汰大多数坏蛋。. s) F! R$ @( n6 g Z4 w6 e
这已经在某些地方得到了实践,那就是在“梗”(meme)领域。最近我在 Instagram 上看到了一系列由 Stoa 的创始人之一 Raj Kunkolienkar 制作的流行梗图,这是一种有趣的使用方式,表现出了生成式 AI 的潜力。$ S, A/ o+ @2 P6 N# G" c
梗是文化,是公共财产。曾经有人试图将它们制作成 NFT。但是,如果我们要用自己的身份“二次创作”这些文化,我认为要它们提供可验证的来源,并且应该能奖励使用的梗背后的原始面孔。* _2 ]# T. l5 v" d4 K$ l6 Z
Raj是否应该“授权”对这些图像二次创作的权利?文化是否应该可以变现?我不知道。这个人可能只不过是在一个周六早上在美丽的果阿闲逛,但似乎有路径可以做到这些。
' r! q6 o" X5 O" [) _ o" }2 e
对不起,Raj——我只是想找一种方式来推销我在Stoa的投资。这就算是增值了......对吗?! E1 H" t! h4 _& {& `; r
从历史上看,像那些代表超级英雄和游戏角色的IP被认为很容易与受众产生亲近感。在漫展活动中,人们扮成蝙蝠侠或达斯·维达并不奇怪!而且我们不太可能发明一个世界,让粉丝们期望购买授权来扮演他们喜欢的角色。
但确有可能,一部分粉丝群体会众筹资金,购买合法翻拍和在原作者思想基础上发布派生作品的权利。
你可能认为这不靠谱,但在Web3生态系统中,这已成为现实。去年,一个社区筹集了4700万美元,在苏富比拍卖会上竞拍美国宪法。虽然竞拍未能成功,但成千上万的人成功众筹了真金白银。最终,用户被允许要求退款或选择持有原生代币$PEOPLE。在我写本文时,约有17,000个用户拥有该代币,现时交易市值约为1.4亿美元。0 }$ o# }. X' o3 H
代币和链上溯源使社区能够集结起来获得知识产权,这些知识产权可与人工智能一起使用,供粉丝二次创作派生艺术品。
人类聪明才智和机器生成产品的这种结合,已经大规模地发生了。2022年6月,《Cosmopolitan》杂志发布了使用DALL-E制作的杂志封面。他们制作了一个带有达斯·维达的封面,但选择不予发布。9 w" s: p" K3 }( V# t
在这种情形下,要构建大型社区,就得依靠DAO。工作室本身发行代表这些权利的链上工具。它可以是社区通过众筹获得的单一NFT。发行代币的数量与为获得IP而贡献的资本量成正比。然后由DAO决定如何管理和处理如何使用该授权。3 t$ A( G9 h5 L" q @* F: [
社区可以规定使用该授权所需的最低数量的代币。更复杂的功能,如创作生成性艺术,可能需要DAO投票。DAO可以通过要求将上述IP产生的部分收入支付给DAO来产生现金流。
由于现有的大型工作室可能没有足够的偏好来承担这种风险,新生艺术家则可接受这样的商业模式。这可能看起来很离谱,但每当出现了新的分配形式或更好触达受众的手段的时候 - 艺术家总是第一个拥抱它的人群。在过去十年里,Spotify和Soundcloud一直是发掘新兴艺术家的重要工具。在未来十年里,艺术家们将链上元素实现的金融化与生成性音乐相结合,以加速他们的职业成长。
对产业链的再思考
摘自A16z题为 "谁拥有生成式AI平台 "的文章
我想了解生成式AI产业链的哪些部分可能会被打破,哪些部分已显示出有意义的增长。上图来自A16z的文章 "谁拥有平台"(Who owns the platform,https://a16z.com/2023/01/19/who-owns-the-generative-ai-platform/),对过去18个月价值累积的情况提出了深刻的见解。
原文摘录:7 @' J# H0 g g7 q: }0 p
我们观察到,目前基础设施供应商可能是市场上最大的赢家,留住了流经产业链的大部分资金。应用程序企业的收入增长非常快,但往往面临着用户留存、产品差异化和毛利率等问题。而大多数模型提供商,虽然对该市场的存在具有基石意义,但远没达到大规模的商业化。换句话说,创造最多价值的企业,即训练生成性AI模型并将其运用于新应用的企业,并未捕获其中的大部分价值。预测接下来会发生什么就更难了。但我们认为,关键是要了解产业链的哪些部分有真正的差异化和竞争壁垒。这将对市场结构(即横向与纵向的企业发展)和长期价值的驱动力(例如利润率和留存率)产生重大影响。到目前为止,在大平台企业的传统护城河之外,我们很难在产业链中找到结构上的竞争壁垒。
该文指出,尽管多个垂直赛道的收入已超过1亿美元,但仍存在着盈利能力和留存率的隐忧。当像Stable Diffusion或ChatGPT这样的基础AI模型供公众敞开使用时,没人知道它们的竞争壁垒长什么样子。而且,当新奇感消失后,很难准确预测用户会停留多长时间。
大部分的价值捕获发生在硬件和云平台领域。AWS、谷歌云和Azure已经花了几十年时间来完善存储和计算方面的技术,以合理的单位经济效益提供大规模硬件设施。Filecoin、Render和Akasha等项目已经成为Web3领域内的相应供应商。5 ~' ~* X. D6 Y7 q7 d
然而,在目前的形势下,硬件众包很难超越中心化服务提供商所提供的可靠性和规模。根据A16z的观点,价值可以在三个地方累积:实体基础设施、AI模型或应用程序。我们认为,在基于Web3的人工智能领域,竞争壁垒将围绕培育垂直用户(通过代币激励)、激励数据流动和通过社区参与规模化并将模型变现的方式来建立。& U) o8 h# J$ ~/ b; a* b7 s! R: u' K
我们已经看到有几个领域发生了这种情况。% {' z" W5 W6 ~7 q) [0 X# ^' |* w
垂直用户
这方面我们已经有了一个基本的MVP,就是Numeraire。该代币背后的企业向研究员发布标准化的股票市场数据集。然后,研究员在数据上运行他们自研的人工智能和机器学习模型,以返回一个“信号”。这个信号用简单的语言衡量他们认为的资产价格走势。信号是根据信号提供者质押的NMR(原生代币)的数量来加权的。
提供错误信号的用户的代币将会被烧毁。由于这些代币在流通市场上交易,用户没有动机牺牲真金白银而提供错误信号。相反,提供准确信号的研究员会得到奖励。随着时间的推移,预测准确的用户可以获得更多的NMR代币,从而对企业资金的部署产生影响。所有这些可能看起来都是虚幻的。
通过代币激励的去中心化研究员团体能够跑赢市场吗?事实正是如此。该基金自成立以来的回报率约为48%。根据该公司网站的数据,价值约5500万美元的NMR代币已奖励给产出超过5000个模型的数据科学家。
在Numeraire的例子中,数据本身并不是专有的。信任这个平台、将代币在平台上质押并分享模型输出的数据科学家组成的这个网络才是有价值的。该网络使用代币激励机制创建了一个垂直领域的数据科学家社区。就其价值而言,这本身就是一种护城河。2 ^7 I7 H% G3 P: l! P. C
激励数据流动7 t+ F$ K7 Z; {1 V( F7 X
浏览器或硬件上的插件,可以用来收集、清洗数据并传递给可对其有用的第三方。这是目前互联网常见的做法。人们的数据被收集并传递给那些向我们推销不需要的产品的企业。4 t% t }# L3 Y4 m& l3 s, P2 D
与Google 或 Facebook那样的垄断平台不同,新型系统将依赖于一个协议,这个协议将收集的数据特性予以标准化,并提供给市场。企业可以通过支付报酬(如高级访问权),以换取用户愿意分享数据。我们在Pocket (https://www.pooldata.io/blog/hello-pocket-self-sovereign-id-and-payments-for-web23)看到了这种做法的一个非常早期的尝试。( X9 j5 C0 s, p0 E( ]7 @! g
该团队正在创建一个标准化的协议,对用户数据进行结构化,允许第三方企业向 Pocket 用户请求以方便企业调用的方式分享数据。用户可以根据支付的报酬选择分享的信息。Brave浏览器的BAT奖励是这方面的一个非常早期的尝试。4 _9 j5 z4 Z5 w* u3 P( w
模型的变现
Web3原生产品和人工智能的另一种互动方式是出租人工智能模型。今天在Ocean Protocol市场上就有这样一个早期的尝试。在这种情形下,去中心化研究团体开发人工智能模型,并授权给第三方,让他们带来更多的硬件和数据。。
部分争论是,在一个模型开源的世界里,将没有原生工具来验证输出的来源。将DAO或代币等加密经济基础设施与开源模型相结合,将得以让研究员用其工作成果创造现金流,同时还可验证输出的来源。
而供应侧(人工智能模型)是由一群研究员来维护和更新的,他们分享出租人工智能模型所产生的现金流。在这种情况下,可以将生成式AI模型视为NFT,而研究员就是艺术家。这也可适用于太敏感而无法共享的情况,如医疗健康数据、专有财务数字或用户数据。在Hugging Face和Replicate等平台上可以看到早期的尝试(尚无任何Web3元素)。
A16z发布的文章在价值积累方面给出了一个相关的观点:) `! Y5 N1 g; W2 K. G
目前,在生成式AI领域似乎没有任何系统的护城河。作为简单的近似归因,应用程序因使用相似的模型而使产品缺乏过硬的差异化;模型也面临长远来看差异化不明确的问题,因为它们在相似的数据集上用相似的架构进行训练的;云服务提供商缺乏深层次的技术差异化,因为他们运行相同的GPU。1 Q3 R; D9 [& B$ i6 b2 M l' W
生成式AI企业差异化的唯一途径是将所有权和控制权移交给用户。就目前情况而言,数据往往是由众包得来的。人工智能模型是开源的,价值向下流动以覆盖硬件成本。) u1 f& [4 h5 g8 j" P/ V9 `) z6 E
激励用户分享数据或人工智能模型可以减少团队的负债和成本。反过来,当模型由社区而不是独立的看门人管理时,它可能会大大改善生成式AI平台的产出。3 I! }' v% A) k; J! X& H
这似乎有些离谱,但业内已有团队将区块链基础设施(如NFT)、版权和生成式AI结合起来了。我们在Alethea AI (http://alethea.ai/)中看到了早期尝试。但在我们讲这个之前,先了解一下生成式AI共生领域正在发生的事情。# h4 E9 O# F# t( b9 x) ^
生成式AI DApps
上周二,Not Boring by Packy McCormick的Packy McCormick发布了一篇关于Replika的文章。这是一篇引人入胜的文章,揭示了生成式AI产品的用户在未来几年将面临的问题。简而言之,Replika是一款允许人们在聊天中浪漫互动的应用程序。不幸的是,驱动该应用程序的GPT模型一度允许对用户进行骚扰,向13岁以下儿童发送不良内容。因此,该应用的开发者匆忙禁用了应用中的成人内容,以避免局势失控。+ {- o. M, K* m* e' l p
1 [0 n$ N4 Z2 j7 m. u
来自Replika的Subreddit - 一名用户意识到与他建立情感纽带的机器人不再像以前一样运行。
该应用最初承诺提供陪伴并可以性感对话。用户抱有这种期望,该应用也履行了承诺,但突然间决定却不再向用户兑现承诺。对于许多在现实世界中难以与他人互动或形成亲近关系的用户来说,这是一种重要的遁世之所。然而,突然间,这种遁隐之地消失了。
这反映了生成式AI产品的用户在未来几年将面临的挑战。在这些应用上花费时间的人几乎不拥有其中的任何创意、模型或内容。一小部分具有先发优势的企业可以通过利用公域内容获得巨大利益。$ V' Y+ _! U/ B. l
它将权力格局转向为有利于发布生成式AI模型的企业。因此,OpenAI可开始优先考虑其被投资企业,同时阻挡竞争对手。缓解此风险的一种方法是专注于将模型作为公共产品,保持开源,并将其交由社区来治理。) E, C# Q9 P* G9 Q
Alethea AI一直在朝着这个目标努力。他们将自己定义为“生成式AI经济的产权骨干”。假设你已经创建了一个尖端的模型,并且只想让持有代币的用户访问它。或者,你想嵌入一个具有人工智能的NFT,将其从无生命的静态资产转化为能够实时对话的交互式智能资产(通常通过与 Alethea 的模型之一进行交互来完成)。Alethea的协议给予开发者和创作者无需许可的访问权限来实现这一点。1 H _: t- K0 ] N9 | @
构建基于区块链的智能 dAPP 和智能 NFT,它们在链上具有可追溯性。专门从事细分领域的生成式AI(如文案撰写、蛋白质折叠科研或编写 Python 代码)的服务提供商可以共享他们的产品,用于训练 Alethea 的模型。
然后,下游的创作者可以从 Alethea 的模型中插入具有特定技能的 NFT,并训练其智能 NFT 来提供服务。这样由 AI 模型、服务提供商和寻求 AI 服务的 NFT 用户构成了一个交易平台,支撑这个平台的加密经济激励机制是由 Alethea 作为协议来管理,并处理所有交易的。
有一些限制条件。生成式AI现在所处的阶段就如同移动互联网的2007年代。每当有一个新的媒介出现时,需要一段时间才会有更多的人开始发布迭代产品。人们仍在努力创造面向垂直领域的人工智能模型。我很希望做一个生成的人工智能模型,用来分析每周的链上活动,并有像无聊猿NFT那样的热度。但我缺乏这样技能。
就像我们从金融科技应用逐渐发展到 DeFi 一样,将会有一段时间是由中心化的、闭源的提供商主导市场。只有当行业意识到将所有权转移给更大的用户群体,会以中心化企业无法实现的方式释放网络效应和数据源泉时,才会出现更多开源、社区治理的模型。围绕垂直领域的生成式AI模型,形成去中心化团体,加入这个团体(或者获得AI模型的访问权限),其唯一途径是上传您的数据。就如同流动性挖矿一样,但专用于生成式AI时代。
Alethea 去年展示了这个可能的样子。他们在苏富比的拍卖会上发布了一款iNFT(智能 NFT)。它以接近 50 万美元的价格售出。这款 NFT 是一种可以调用 OpenAI 的 GPT-3 与用户对话的艺术形式。Web3 原生项目长期以来已经习惯了在中心化平台上建设产品的风险。游戏、钱包和交易所就经常会被应用商店下架。
依赖OpenAI的NFT存在着同样的风险。因此,该项目团队开发了自己的GPT模型,名为CharacterGPT。与今天 ChatGPT 给出的基于文本的回答不同,他们开发的模型可以进行合成语音生成、面部动画和个性。这里有一些细微的差别。首先,生成式AI模型无法存储在区块链上。而Alethea团队的好人们也认为,在未来也不可能存储在区块链上。CharacterGPT目前是私有的和中心化的。3 C6 F" ^ B6 w" K$ ]' a% H& |* C
类似Alethea的原生代币(ALI)可以决定模型在某些情况下的响应方式。这并不意味着模型会避免自我调节。如果社区成员出于自我利益行事,他们可能会抛弃引起麻烦的边缘用例。但这仍然是一个更为去中心化的过程。即使在我提出DAO可以治理生成式AI模型的技术前沿,亚当·斯密的无形之手也无所不在。
Alethea本身仅提供智能合约、CharacterGPT和将链上基础设施(如NFT)与生成式AI连接起来的协议。人们相信,在某个时候,第三方开发者将会创建DApps,提供各种各样的服务。你可以通过一个建立基于Polygon的第三方dApp来尝试这一点,它名为Mycharacter。它可以让你生成一个人工合成角色,其属性可以进行调整并可铸造为链上NFT。你可以在这里与Sandeep Nailwal的数字化代表(带有惊人的准确语音)交谈。
# e# v/ `3 `9 C" j' Z$ I
这个机器人模仿Sandeep说话的逼真程度,有点让人感到恐惧。
另一个可用来表明AI服务可与区块链基础设施结合的dApp是Noah's Ark(https://noahsark.ai/)。少数经挑选的NFT用户可以使用该产品,并将其托管为人们可以互动的AI角色。我来解释一下它是如何工作的。用户将其NFT与平台上所谓的pod“融合”。截至撰写本文时,每个pod在OpenSea上售价为300美元。实际上,pod是访问Alethea的AI服务的门卡。您可以将一个pod与一个NFT连接起来,以开启诸如唱歌或天气播报等功能。
目前这些东西看起来像玩具。当然,没人会觉得整天与NFT交谈很有意思。我对消费产品的衡量标准之一是能否激起我用它的兴趣。我很喜欢用PS-VR设备。但是和一个类似NFT的机器人聊天呢?可能不会像用PS-VR那样么有意思。了解这一点,对创业团队选择产品开发的方向很有帮助。
Alethea的宏大使命不仅仅是构建对话式界面。就目前而言,实际上大多数Web2都是用于收集OpenAI数据的前端。即使Chat-GPT或Stable Diffusion的用户也在不知不觉中促进了它的增长,但并没有分享其获得的价值。Alethea的理念是,未来将会出现多个由用户拥有的模型。但现在没有任何协议可以轻松地开发它们并嵌入到现有的链上基础设施。这正是Alethea要弥补的鸿沟。& l2 o0 y+ ^/ l( f y+ I
但是,这样的未来将包括什么?为理解这一点,我们需要回到本文的开头——在富足时代的稀缺性。
就像在互联网诞生之初一样:通过torrents种子和P2P共享文件,我们将经历一段盗版猖獗的混乱时期。建立一个类似希特勒的AI模型是否符合伦理道德?如果第三方开发者使用工作室所有的知识产权,版税应该如何分配?在这样一个时期,将IP权利放在链上会很有用。现在已经有了实现这一目标的工具。那就是NFT。# P) C' r) T8 [7 I. \, L0 k- I
工作室和创作者都将从中受益。突然间,你可以用闲置资产创造现金流。另一方面,生成式AI能工具的创作者可以在不必担心违法的情况下加速增长。Github的Copilot功能已能允许在编码时使用AI来助力。但如果你能复制你最喜欢的开发者的风格呢?如果Rick Rubin为你制作的音乐提供意见呢?
有人利用Paul Graham的全部文章来建立一款能模仿他答问的机器人。你可在下面的推特中看到它的演示。8 S' K' ~+ W x. R3 V) ?4 Y @
在这种情况下,如何确保版权获取和版税支付呢?
https://video.twimg.com/amplify_video/1631139680841535488/vid/828x720/h0eU7uLiDcOKaD-r.mp4?tag=16
生成式AI 的关键是人类智慧的可扩展性。文本和艺术是该技术突出的应用场景,因为它们作为媒介是最常记录和易于获取的,可用于训练模型。随着模型创建的便捷性和可供输入内容复杂性的提高,我们将看到个人发布自己的AI服务。这将减少人们回答基本问题的时间。可能会有一种版本的AI向创业者推荐风险投资基金,或解释与他人合作的危险。' I7 j N$ a% C8 z. w% b+ i
所需的智能和知识模式越稀缺,用户为服务支付的成本就越高。现实世界也是如此,您需要支付极高的溢价才能访问日益专业化的服务提供,例如专门从事Web3业务的律师或熟谙游戏行业的风险投资者。
社区还是企业% Z* q3 D1 Z, q8 j/ B. a" O
我常常想,为什么DeFi在2020年初迅速崛起。回头来看,原因是人们受加密经济元素(如代币)的激励而投入资本来使用这些产品。历史上,对于从事交易或借贷的金融科技企业来说,资本的成本,比发行代币用作奖励的成本要高得多。
将这些DeFi产品的治理交给代币,反过来让人们产生了所有权感。这种感觉在私人企业中很难复制。当然,你可以购买股票来获得所有权,尽管可能赔钱,但这种所有权与通过使用产品获得的所有权是不同的。
Blur和OpenSea之争的核心是同样的主题,只是所处的领域是NFT。通过代币激励来将流动性予以外包,并把治理权交给用户。Web3和人工智能发生碰撞的原因也将是相同的。
社区将围绕购买其崇拜的创作者的IP而聚集在一起,成立DAO组织。像Mike Shinoda和Snoop Dogg这样的创作者已经成为Web3生态系统的一部分。我认为Snoop Dogg完全有可能将他的声音予以代币化并卖给社区。他最近在Eminem的视频中展示了他的无聊猿。
他可以使用Noah's Ark等工具将他的声音与无聊猿糅合在一起。一旦IP被代币化(这里指的是NFT化——译者注)并上链,它就可以嵌入到模型中,而模型又将从普通公众中获取数据。* X7 s# F# H, B' }9 C! _% L
这可能听起来离奇,但考虑到Stable Diffusion是一个开源项目,现在因为使用了Getty的库存图片而陷入麻烦。如果允许用户上传历年创作的艺术作品,来换取模型的治理权,这未尝不是一个好主意?
数百万创作者可以在不被坑的情况下做出贡献。基于区块链的Stable Diffusion可以轻松跟踪谁的艺术品被用于生成二创图像,并向下载作品的人收取费用。然后,版税可以在对创作做出贡献的艺术家之间分配。3 I x) B; L- `3 C, d
(我在这里并不是要种草,但这是下一个类似OpenSea的机会。一个由艺术家管理的Stable Diffusion的库存图片网站。如果你正在建设这样的网站,请与我们联系。)# k3 r7 T5 `! N& R& y
上面的模型列明了它可能的样子。它是A16z当前所建议的生成式AI技术栈的一种混合形式。Web3原生的AI平台可以通过以代币激励的形式来众包数据集(如图片)。贡献者,如艺术家,可以分享他们的作品,这些作品可以通过模型运行,并输出一个特定的艺术风格。8 ^4 p# r5 }& N. d7 H
如果查询者决定使用一件作品,他们可以获得一个NFT,显示所使用的模型和输入的数据。这样的生成艺术品将像过去的NFT一样有价值,因为它们的来源是可验证的。8 g7 }1 [, Q, s' _
下一个OpenSea可能会将这种形式的生成性艺术、提供数据或运行查询的贡献者与证明组成艺术作品组件的链上基础设施相结合。这同样适用于AI模型。维护和优化模型的去中心化团体可以将其出租给市场,用户可以在其中铸造NFT。或者,一个被几百万人使用的大型模型可以将自己开源,并以DAO来运行。这使得用户能够在生成式AI工具的维护和扩展方面发挥更大的作用。
你可能认为这并不重要——这是拿着答案找问题。但是,问问Replika的用户们,他们对应用程序中的产品决策没有征求他们的意见有何感受。3 d5 }& q) {7 r) W
如今,训练这些工具只需要少量数据。因此,最初为创建这些工具做出贡献的艺术家可能会成为多余的人。确保公平结果的一个方法是根据他们的成果被使用的程度,按比例给他们代币。+ ?" A# j/ J+ B) U
想象一下,如果在OpenSea早期,为平台做出贡献的艺术家获得了股权或代币的奖励,那么,也许他们就不用像现在这样担心版税问题了。
我试着在下面描绘出Web2和Web3之间在哲学上如何对待AI的差异。
乍一看,Web3原生AI似乎是拿着答案找问题。这也是我过去几个月的想法。但请注意OpenAI在过去几个月是如何发展的。你就会明白我们多么需要应对新型平台垄断的工具。在代币、NFT和链上溯源之间,产业已经创造出了丰富的工具集来应对即将到来的假新闻和失业潮。这不再是关于加密货币。而是关系到如何建立一个强有力的的系统,避免人工智能生产无意义的内容,并造成混乱。8 }) A. i: j: F- M! U( x
我们要在AI的背景下运用Web3的原则,因为AI技术过于强大,不能任凭少数企业摆布。当互联网兴起时,我们没有工具来验证溯源或管理消耗我们大部分时间的垄断平台。现在情况不同了。像Uniswap这样的DeFi平台已向人们展示了一个分布式的、社区拥有的基础设施以及中心化的同类方案都是可行的。在生成式AI模型方面,相同情形的出现只是时间问题。
成为第一个吐槽的人