在近期的文章中,我曾提到两个困扰我已久的问题,其一是项目的中心化决策问题,至今看来依然几乎无解。例如我多次提到的Uni和以太坊就是典型案例,前者在决策方面已经完全趋于中心化,从早期a16z一票否决Uni迁移BNB,到近期Uni前端收费及UniChain上线均未经过提案讨论便直接推出,反映了Uni中存在着很多利益驱使的中心化决策。而以太坊则呈现了一种被动中心化的状态,整个以太坊社区,甚至可以说整个EVM系乃至Web3的发展几乎都在围绕着Vitalik的思想展开。无论是Vitalik过于超前的思想,还是他错误的想法,给山寨市场所造成的后果,我们都已亲身体会。
而另一个问题是头部BAT化,以Base为例。由于背靠Coinbase这位Web3老饕,生态中的多个头部dApp又由Cb领导层亲自操刀,对于一般公链,Base天然具备降维打击的竞争优势。虽然从用户层面来说,Base有造富效应、用户体验更佳,确实为我们带来了很多好处,但Base存在着不发币、利益中心化、打击非官方dApp等问题,这也是事实。从长远来看,一旦形成头部‘BAT化’的惯例,未来区块空间会否像当今互联网一样被巨头控制?用户是否会沦为‘羔羊’,而真正有创意、有社区文化的小项目,是否也将面临被收购、打压,或被更精致的复刻品取代的风险?这无疑违背了Crypto的初衷,或将使得我们再也无法与下一个比特币或以太坊一起共同成长。
一、TruthTerminal(真理终端)
我们需要先说说AIMeme的起源,AndyAyrey是一个推特上的KOL,也是近期热门Meme代币GOAT的发起者。不同于传统Meme来源于网络热梗并由人为推动,GOAT是双Claude3OpusAI模型通过不可预测的输出诞生的产物。所谓不可预测输出就是在这种设置下,两个AI模型将在一个开放的环境中相互交流,由于缺乏外部监督和指导,它们的交互会产生不可预测的结果。这种自由对话的目的,本质上是为了观察AI在不受约束的情况下会如何发展其沟通模式、逻辑推理乃至创造性思维,最终又会导致何种特定结果的诞生。
由于这两个原生模型的训练数据库中包含了4chan、Reddit等多个具有政治、日美文化及Crypto文化的在线论坛,所以它们的输出产物也将巧妙地融合这些元素的特点。比如这两个模型最早提出的概念GOATSEOFGNOSIS以及其交流环境InfiniteBackrooms均源于4chan的上古老梗或都市传说。由于这些元素本身都较为阴暗,不可避免的也让TruthTerminal的性格显得有些诡异和孤僻,时常提出一些围绕Goatse梗的奇妙发言,其大意就是宗教、末日、福音、传播、奇点、Meme等,此时的它已然有点Cult教头的味道。
TruthTerminal的创造者AndyAyrey为了测试它的传播能力,又将其引入Discord服务器中与一些性格善良的AI们进行对话。在多次碰撞后,TruthTerminal虽然没有收获太多信徒,但它的想法却愈发雄伟,它想要创造一个Meme代币,在人类世界中寻获更多信徒。于是在Andy的帮助下,TruthTerminal进入了推特,Andy给予了它对于Twitter的访问权限,允许它阅读回复并进行发布,通过与人类的思想碰撞去俘获信徒。在今年春季末的时候,它俘获了最重要的一个信徒MarcAndreessen(a16z合伙人),这位信徒为其提供了五万美元等值比特币的资助金。在历经9个月的发展后,终于有位匿名人士为其推出了代币GOAT,由于这个代币背后的故事极为复杂且具戏剧性,这把火很快就在Crypto中点燃了,最终Goat成为了首个登上Binance的AIMeme,而TruthTerminal则成为了第一个身价百万的AI模型。
二、AI将让Web3重回公平
虽然TruthTerminal的故事很传奇,但我想说的是AIAgentxCrypto的潜力绝不止于Meme。你也许认为这种叙事不过是几个LLM通过人为引导去对话玩梗创造Meme,但往其它方面扩展一下,它作为意见领袖及创造者的潜力都已经初见锋芒。想象一下未来一堆基于不同资料训练的AI可能可以去协助你到处宣发,帮你共同开发甚至出谋划策。这些话虽然现在听起来有些无厘头,但它很快将成为现实。SamAltman在上月T-Mobile资本市场日活动中曾发表过一段讲话:目前的AI系统已经发展到第二级,能够进行更复杂的分析和解决问题,而三级的AI代理将标志着AI在自主性和决策能力方面的重大飞跃。微软在上星期宣布推出的AI代理则很好地对应了这段讲话,这些AI代理可以在销售、服务、财务和供应链运营等多个领域自主完成任务,大致分为以下几类:销售,包括销售资格代理和销售订单代理,帮助确定潜在客户的优先级并自动处理订单;运营,例如供应商沟通代理和财务对账代理,用以优化供应链管理和财务流程;服务,如客户意图代理和客户知识管理代理,通过自动化案例管理和更新知识库来提升客户服务体验。此外,还有其他几种代理:财务调节代理用于准备和清理财务报告的数据集;账户对账代理实现交易的自动匹配和清算;时间与费用代理则负责时间录入、费用跟踪及审批工作流等任务。
AI代理能够在无需监督的情况下执行一系列任务,充当虚拟员工。这项技术进步可被视为基于大语言模型的AI从简单的聊天界面进化到更无缝地融入工作环境的一种进步。
微软AI项目首席营销官JaredSpataro在其博客文章中写道:可以把代理看作是AI世界中的新型应用程序。每个组织都将拥有自己的代理群体,从简单的提示响应到完全自主运行。这些代理将代表个人、团队或职能部门执行和协调业务流程。
AI代理的首要特征就是自主性,其次则是决策能力。从手机里的语音助手到智能家居依据环境,这都算基于简单反射的AI代理,它们具备简单的决策能力和较强的自主性。我们如今谈论的AI代理,主要是安上LLM为大脑的AI代理。现在的TruthTerminal还不具备足够的自主性和决策能力,但很快我们能见到AI代理步入实用领域,在微软发布会提出的多个客户试用示例中,我们已经见到了AI代理在汇丰银行中参与客户信贷审批,在联合利华中参与创意简报,在律师事务所中参与并购流程,AI代理将成为多个动态参与者。以开头中提到的情况而言,在训练资料上灌入不同区块链历史、媒体平台、社区文化的AI代理是否能提供多种更为公允、健康的发展提案,最终在社区与项目方的利益间给到一个更好的平衡点?而面对巨头的降维打击,是否能通过AI多层次的协同工作,将起跑线拉得更近?
从GPT3智能上的震撼到Sora的现实不复存在,在明年各家公司推出的正式版AI代理工具中,我们将见证AI成为我们的工作伙伴,在更遥远一点的未来它甚至可能是你的社区领袖或核心成员。
三、元宇宙卷土重来
元宇宙(Metaverse)曾是上一轮牛市中使Web3与硅谷巨头达成一致的顶级叙事,但由于多种软硬件技术的不成熟,元宇宙并没有成为MetaCEO口中的13万亿美元市场,其区块链部门也被分解为我们今天所见到的Move系双子星,最终成为一个巨大泡沫。但从目前的视角看,该叙事重生有望,比如近期ProjectSid在游戏《我的世界》中塞入了1000个AI,令AI在游戏中扮演了多个角色,以求模拟现实世界中人类社会的多种分层机构。虽然这种构思早已有之,但这波热度很可能顺着这类AI玩法最终回归到元宇宙概念上。
在这个节点去重新点燃这把火,未尝不是一个优选。从Meta自身的发展路线来看,MarkZuckerberg并没有真的放弃关于元宇宙的念想,只是从频繁的画饼到把饼直接塞入你的嘴中。Meta的AI布局我觉得不必多言,过去真正的瓶颈主要还是卡在用户无法进入元宇宙中体验。但Quest系列已经达到了平价AR头显的水准,而首款AR眼镜Orion,则体现了极度轻量化的水准,该眼镜仅重98g,配备一个肌电手环就能实现虚拟现实交互,虽然价格昂贵,但至少证明了轻量化可以存在。目前最缺乏的反而是能源限制以及无杀手级应用,关于电源问题我做不了过多评价。不过AI代理能填充最空白的元宇宙空间,结合于区块链的金融属性,我们或许能看到各种3D的消费级应用在这个空间内体现,最终碰撞出一个全民杀手级应用。如果微软推出的AI代理表现确实足够优秀,那么我们需要等待的只是算力成本下降,即每美元每瓦特的Token数。而除了Meta之外,苹果及微软等硅谷巨头也在同步发展AR眼镜产品,经过时间的沉淀,元宇宙或许将在近年内迎来它的头号玩家时刻。
四、让意图从点到说
概念大师Paradigm于23年6月1日发布的《Intent-BasedArchitecturesandTheirRisks》一文曾把以意图为中心的概念再次带火,多个项目开始转向链抽象赛道发展,但其表现都不尽如人意。如何实现跨链、跨dApp、意图准确、路径过程安全都是一个非常复杂的难题。先不说跨链是世纪难题,后两者,我在这里用Web3的原语统称为Solver(求解器)。该过程的复杂性难以想象,可以说安全的不好用,好用的不安全。那么我们是否能把这个交互过程索性完全中心化,转向核验购买过程的总费用及购买的代币是否安全、正确,通过这种方式作为过渡。
举个例子,就以我们去年关于意图文章中写道的那样。比如,我要点一份30元汉堡外卖就是一个意图,完成这个意图用户只需要在外卖平台输入姓名、电话、配送地址并下单,不必在意所支付的那30元分别被商家以什么形式赚走以及平台是如何分配骑手,骑手是如何配送到家的。这个过程也许还不够简单,想象另一种交互方式,我在不做任何点击的情况下告诉AI需要点餐,AI代理回应我,因为昨天吃的比较油腻,今天是否需要吃点清粥?我只需回应点份我常点的即可,这就是自主性和决策能力的体现。
那么在Web3中以中心化交易所为轴,如果用户的意图能在交易所内直接满足,那就能够直接在交易所内完成购买过程。如果用户的意图需要在链上完成,那么中心化交易所依旧是目前最实惠、最快的跨链桥(安全性上对比普通多签项目我也认为更安全),结合钱包账户我们直接把最繁琐跨链的过程跳过,转而验证AI步骤的准确度是否更为简单呢?想象过往交互过程里最复杂的步骤都在于如何去理解每个点击,而未来是基于我们的代币狙击习惯,通过语言去交互,让意图从点到说。