🔥 Gate 动态大使专属发帖福利任务第三期报名正式开启!🏆 第二期获奖名单将于6月3日公布!
👉️ 6月3日 — 6月8日期间每日发帖,根据帖子内容评级瓜分 $300奖池
报名即可参与:https://www.gate.com/zh/questionnaire/6761
报名时间:6月3日10:00 - 6月8日 24:00 UTC+8
🎁 奖励详情:
一、S级周度排名奖
S级:每周7日均完成发帖且整体帖子内容质量分数>90分可获S级,挑选2名优质内容大使每人$50手续费返现券。
二、A/B 等级瓜分奖
根据各位动态大使发帖数量及帖子内容质量获评等级,按评定等级获奖:
A级:每周至少5日完成发帖且整体帖子内容质量90>分数>80可获A级,从A级用户中选出5名大使每人$20手续费返现券
B级:每周至少3日完成发帖且整体帖子内容质量80>分数>60可获B级,从B级用户中选出10名大使每人$10手续费返现券
📍 活动规则:
1.每周至少3日完成发帖才有机会获奖。
2.根据发帖天数和整体发帖内容质量分数给予等级判定,分为S/A/B等级,在各等级下选择幸运大使获奖。
💡 帖子评分标准:
1.每帖不少于30字。
2.内容需原创、有独立见解,具备深度和逻辑性。
3.鼓励发布市场行情、交易知识、币种研究等主题,使用图例或视频可提高评分。
4.禁止发布FUD、抄袭或诋毁内容,违规将取
深度好文:AGI时代的产品版图和范式
来源:李建忠研思
一、深度认识 AGI 时代特点 二、科技创新之“范式转换立方体” 三、AGI 产品未来发展的六点思考
第一部分:深度认识AGI时代的特点
首先,我们来通过下面这幅图,认识一下大模型技术的整个发展脉络。
我本人由于追踪研究人工智能相关技术的原因,正好和上述这条发展脉络上的几个关键人物有深入的交流和探讨。2018年我们在上海举办全球机器学习大会,邀请了机器学习之父、UC伯克利的著名教授迈克尓.乔丹作为keynote演讲嘉宾,和他有深入的交流。2021年4月,我们在北京举办机器学习大会时,因为疫情的原因,我们线上邀请了Google Transformer模型的共同创始人之一Lukasz Kaiser,他在那次演讲之后不久跟我说他离开Google去OpenAI了,后来就知道他是投入做GPT 3.5了。当时还邀请了另外一位深度学习元老级人物,LSTM之父Jurgen Schmidhuber。到今年4月份我去硅谷,和OpenAI的首席科学家Ilya Sutskever也做了很多深入的交流。总的来说,在AI的发展道路上,我们一直在保持和业界前沿的深度探讨和交流,这些让我本人收益良多。
然后到1946年第一台计算机ENIAC诞生算起,人类技术革命又进入一个“计算”的钟摆。包括50年代的大型机、60年代的小型机、70年代的微型机、到80年代的PC。以冯诺伊曼架构为核心,都是围绕“计算”这一命题进行的。这一历程进行了大约50年。
接下来是1994年到95年互联网的出现,以Netscape和Yahoo为标志,WWW互联网将人类技术革命又推到了“连接”的钟摆上,接着是2004年的Web 2.0,2007以iPhone诞生为标志的移动互联网,2013年的云服务。都是在极大地发展和丰富“连接”这一命题。这一历程大约持续了30年。
时间来到2017年,Transformer模型的论文发表,2018年GPT 1.0诞生,然后2.0、3.0、直到去年底的GPT 3.5带来的ChatGPT横空出世,为整个人类带来通用人工智能AGI的曙光。这一轮大模型又进入“计算”的钟摆,时间大约从2020年算起。
很有意思的是,如果大家看第一次“连接”革命,我将其命名为“连接1.0“,它经历了大约100年;而第二次”计算“革命,我将其命名为”计算2.0“,它经历了大约50年;然后是第二次”连接“革命,所谓”连接2.0“,它经历了30年。大家有没有看出来时间跨度呈指数级下降的趋势?所以很多人认为,我们接下来可能要不了15年左右,到2035年,可能这一波大模型带来的”计算“钟摆就会到达顶峰。
有了产业的时间线认识之后,我们接下来看看**“连接“时代和”计算“时代的底层逻辑**有什么不同?这个其实非常重要。因为很多人这段时间经常会使用移动互联网的各种各样的范式,来推演大模型时代的范式。我认为这种认知是错误的。因为移动互联网属于“连接”逻辑,而大模型时代属于“计算”逻辑。我们来看看下面的表格:
而计算逻辑下,其实没有这样的一个双边效应,它的核心是一个单边市场。一端是算法算力,另一端是消费者。比如在Midjourney里面,没有设计师网络,算法直接出图给用户;比如到自动驾驶时代,如果去颠覆滴滴,滴滴的司机-乘客双边市场形成的护城河根本没有用,因为不需要司机了,是算法在开车。
再来看商业模式,在连接逻辑下,它的边际成本是非常低的,所以很容易做免费的商业模式。但在计算逻辑下,算法算力的成本是需要均摊的。那么绝大多数的商业模式还会像互联网、移动互联网时代的“免费为王”吗?大概率不会,这也是大家现在看到Midjourney,ChatGPT Plus这些纷纷收费的原因。很多硅谷投资人都提出,大模型时代“直接向用户收费”将是主要的商业模式。而不再是连接时代的“羊毛出在猪身上“的免费模式。
然后用户体验呢?互联网时代,连接逻辑是信息越多越好,不可避免出现的一个信息过载的问题。但是计算逻辑呢,其实是触点越少越好,效率为先。就是我下一个命令把我的结果给我就行了,中间过程不要让我参与。
从决策机制来讲。连接逻辑是“机器将信息给我,我来决策“。而计算逻辑是人给机器信息,也就是数据,机器来帮我做决策。
通过以上这些对比,大家可以看到这两个逻辑在我们的产品思维里面是非常不同的。接下来我们来谈谈,同样是计算逻辑,1940年到1990年的计算1.0和我们目前所处的计算2.0有什么本质区别?来看下面的图:
所以你会发现在计算1.0下面,无论是PC还是手机软件上很多用户体验稍微不注意的地方,就容易让非行业的人士、包括老人、小孩陷入一种心智负担的困境。为什么有这种困境?
因为左边是人类大脑的生物神经网络,而右边是由“与、或、非”构成的数字逻辑电路,你要去适配它。任何Input输入先要转换成数字逻辑电路能理解的东西;任何电脑Output输出的东西,也要再经过一层转换变为生物神经网络能够理解的东西。这样来回的转换,就是没有经过训练的普通用户陷入困境的原因所在。
但是我们如果看看下图所描述的大模型所主导的计算2.0时代。
我四月份在硅谷跟OpenAI的首席科学家Ilya Sutskever交流时,我记得他重复了三遍在强调,从数学原理来看,现在的数字神经网络和人脑的碳基神经网络,已经没什么不同。除了生物有机体的生存方式不一样外,运算逻辑是一样的。
这时候,人类和大模型的交互,其实就是生物神经网络,和数字神经网络之间的互动,特别自然,没有任何别扭,因为大家的输入输出是一致的,运算逻辑也是一致的。
它不再是计算1.0时代的那种数字电路的0-1思维,而是一个概率思维。大家知道你可以调整ChatGPT的temperature(温度值)那个参数。将temperature调高让它很有创意。用temperature这个词也很有意思,温度高的意思就是大脑发烫嘛,大脑发烫就比较有创意。也可以将temperature调低让它的回答很平庸俗套。概率思维本质就是神经网络的模式,它也是我们人脑的决策方式。大家仔细想一想,其实我们大脑的每一次思考都是在计算概率。计算2.0整个导向的结果是让机器来适应人的思维。
有了以上对整个AGI技术及其背后的逻辑的深入认识之后,我们下面来谈谈在AGI时代,如何做产品的一些方法论。
第二部分:科技创新之“范式转换立方体”
先谈谈范式转换,英文叫Paradigm Shift,由托马斯·库恩最早在《科学革命的结构》一书中提出,它指的是科技领域的基本概念和实践的根本性变化,它打破了原有的法则和界限,为人们的思想和行动开创全新的天地。技术领域我们常常谈的革命,其实都是发生了范式转换,比如从单机到互联网,从互联网到移动互联网,都是范式转换。
在中国互联网领域,很多朋友知道美团的王兴在2009年左右曾经有一个很著名的四纵三横论。当时互联网的很多人听到这个理论就特别兴奋。因为王兴的这个分析,当时看起来比较符合那时候的现状,2009年是移动互联网刚爆发的时候。跟现在AGI爆发这个点非常像。
王兴当时指出来,人类在技术行业基本由四大需求主宰:信息,沟通,娱乐,商业。所谓四纵。三横呢,王兴给出了自己的分析:搜索、社交、移动。然后四纵三横的交错点,就诞生了新的机会。对于“四纵”我非常认同,但是三横,我觉得这个分析方式是有问题的,因为社交、搜索其实都是人类需求,和移动互联网不在一个维度上。
我猜当时王兴把社交放在和移动一个维度上,是因为当时社交网络太火了,导致社交成为一个巨大的流量入口,在很多领域一旦碰上社交,就会有新的玩法。但是流量入口并不等于技术。搜索也是,因为也有流量入口效应,所以王兴觉得它在很多领域也引起过变化。但是王兴当时对搜索除了Google/百度这种模式之外,在沟通、娱乐、商业等领域并没有给出具有说服力的产品模式。所以我觉得王兴“四纵三横”这个方法论的“三横”是放错了位置。
接下来我来谈谈我提出的一个分析框架,这个分析框架我觉得对于我们分析AGI时代的产品范式很有帮助。我将我提出的分析框架命名为**“范式转换立方体”,英文命名为ParaShift Cube**,其中Para就是Paradigm的缩写。
x轴代表技术轴,代表着技术范式的转换,这里面有连接1.0、计算1.0、连接2.0(这里面又包括PC互联网,移动互联网)、计算2.0,也就是我们说的AGI智能时代。
Y轴代表需求轴,涵盖人类需求的方方面面,包括王兴谈的部分:信息、娱乐、商业,同时我也把社交、搜索都放在Y轴里了。社交和沟通,我把它们合并了,虽然它们有细微的差别,但是它们的共性显然大于差异。
Z轴代表媒介轴,因为信息的表达需要特定的媒介,人类也是通过媒介和周围的世界交互的。媒介轴包括:文字、图片、音频、视频、以及三维空间计算(这是苹果在VisionPro最新提出的)。Z轴我觉得是很多人都忽视的一点。包括对计算机发展影响巨大的GUI图形用户界面,也是计算机图像这样一种媒介在事件驱动下的交互结果。
这三个轴线组成了一个立方体结构, 三个轴线,每一个轴线上的变化点,和其他轴线的交汇点,就是产品出现“范式转换创新”的地方。应用“范式转换立方体“来分析产品领域的创新机会,逻辑上就很顺了。
接下来,我们使用“范式转换立方体”来分析一下连接1.0时代的PC互联网,连接2.0时代的移动互联网、以及预测一下计算2.0 AGI智能时代可能的机会。至于计算1.0、和连接1.0时代,其实也可以使用“范式转换立方体”分析,只是年代比较久远,我在这里就不讲了,但大家有兴趣可以回溯历史来分析,你会发现也非常符合逻辑。
我在表格中把需求轴分为两个部分:红色和绿色。红色的部分,在AGI智能时代,是范式转换发生比较剧烈的部分,创新、甚至掀翻巨头的机会很大;先看信息需求,PC到移动的转换中,新浪搜狐等门户模式被今日头条等打败,而到AGI智能时代信息的生产方式又会面临巨大变化。现在信息过载很严重,有时候阅读十篇文章,得到的其实就一个信息。那么大模型可不可以根据我的偏好帮我把前一天的几十篇的信息做整合,然后给我一些简短精炼的摘要出来,这是大模型非常擅长的。这就很容易形成对信息产品的范式转换。再来谈娱乐,娱乐是非常需要内容的,而内容生成是AIGC非常擅长的,娱乐的形式、载体、供应等多链条都会被AIGC重塑,所以也存在很多范式转换的机会。
最后聊聊搜索。搜索是互联网领域一个很大的产业,也是人类一个很大的需求。但是大家如果用了ChatGPT这些大模型产品之后,你会发现搜索行为的比例会显著下降,为什么?因为很多时候,我们搜索十几篇文章,翻好几页,就是为了寻找一个答案或者决策。这款产品好不好?那个景点值不值得去?这个药解决不解决问题?这些决策性的、答案性的需求是ChatGPT 这类大模型产品非常擅长的。所以说,搜索在AGI时代会面临巨大的被颠覆的可能。而很遗憾,四五月份从硅谷回来,我感觉到Google还躺在搜索的功劳簿上数钱,对ChatGPT带来的巨大范式转换的威胁反应麻木。
有人说,Google不是推出了很多大模型相关的技术和产品了吗?我的回答是,不要看表面推出的几个产品。这些防御性的动作在范式转换来临时,都是毛毛雨。想想看Yahoo当年是怎么轰然倒下的?当然Google有没有机会,我觉得有,但前提是Google上下必须拿出类似当年马化腾和张小龙举腾讯全公司之力All in 微信,来打米聊的那场战争的决心;或者比尔盖茨在1995年举微软全公司之力All in IE,来和Netscape打那场浏览器战争的决心,才有可能阻挡范式转换的颠覆性力量。而Google做了什么呢?创始人躺在加州的沙滩上晒太阳,让雇佣来的拿年薪为主的CEO和OpenAI的 Sam Altman与Ilya Sutskever等这样胸怀诗和远方的联合创始人来对打,接着后脚又把技术大神Jeff Dean从Goolge Brain老大的职位上拿掉,把深度学习之父Jeffrey Hinton委婉劝退。靠Google I/O大会上几个PPT大模型就想赢跑AGI时代吗?顺便批评一下Google这些年大兴PPT产品的浮躁之风(很多之后都没有正式发布),而大家看看OpenAI这些创业公司什么时候需要开发布会?产品release就是发布会,最多配一篇Blog解释一下。拿产品(而不是拿PPT)说话才是创新的王道!
最后说一句,颠覆Yahoo的不是另外一个门户;颠覆Google的也不会是另外一个搜索,而是范式转换带来的结构性颠覆,而这就是大模型时代搜索领域正在面临的棋局。
谈完红色的部分,来谈谈绿色的部分,相对红色部分来讲,绿色部分由于仍然具有连接时代的“双边市场”效应,所以护城河比较深,即使在技术发生范式转换时,我认为也不是有很大的机会。比如从PC互联网到移动的转型中,即使当时有米聊、陌陌等一众公司强攻社交,但是活下来还是腾讯(虽然从QQ换了个名字叫微信),因为腾讯在QQ时代建立的社交护城河太深了。整个中国的社交关系,不是简单的双边结构、而是网络结构,都掌握在腾讯手里。
很多人前段时间也在问在AGI时代,微信会被颠覆吗?我们用上面的范式转换立方体分析,结论是不会。首先AGI时代,人们的社交需求会变吗?不会。其次人和人的社交模式,会变成人和虚拟人的社交模式吗?我觉得也不会。在硅谷有一种说法,未来机器人都是人类的奴隶,人们使用机器人的目的很明确“让它干活“。社交的需求来自人类社会关系的结构:朋友、亲戚、同学、同事…… 除非人类社会结构里以后没有这些社会关系了。没有人愿意和机器人社交。所以,微信在全中国、准确说应该是全世界华人的社交关系网络的优势,即便在AGI大的范式转换的时代,也不会被颠覆。至于微信里面,具体交互的一些更新,比如文本、图片生成啦,更智能的信息优化啦,这些都属于小的交互改进,这些事情以微信的能力分分钟都会做好,轮不着任何创业公司来颠覆它。
我记得在2019年1月份的同一天,字节推出多闪、罗永浩推出聊天宝、快播创始人王欣推出马桶MT,想合伙颠覆微信的社交王者地位,但没过两个月就偃旗息鼓了。如果当时几位创始人看了我的“范式转换立方体”就明白了,此事不可为。何况2019年也不是一个技术范式转换的时代,即便是碰上PC互联网到移动的范式转换的时代,雷军的米聊、国际上的WhatsApp、Talkbox等一众应用也没有颠覆腾讯,因为社交的护城河是最深的。AGI时代大家不要想打微信的主意,门都没有。
再来说商业,其实指的是电商。大的颠覆机会不多,原因也是“连接时代”双边市场的护城河仍然在电商领域继续存在。任何商业形态都离不开买家和卖家,AGI大模型只能在商业闭环上优化一些小环节(比如淘宝的图片、虚拟试衣间等),但这些永远脱离不了买家、卖家、物流这些基本电商属性,而在这些领域传统巨头的优势还很大。就是从PC互联网到移动互联网的转换中,淘宝、京东的优势基本都是平移过来的。
不过有一点需要指出,在移动互联网领域,半路杀出了个拼多多和抖音电商,但这是微信和抖音的流量入口效应带来的,是很好的补充,但构不成颠覆,而且拼多多打的是下沉人群,是新的上网人口结构变化带来的(这个有机会再分析)。我的判断是,随着大模型可能带来新的流量入口,电商领域也许会冒出类似拼多多、抖音电商的新机会,但是淘宝、京东的既有优势仍然会存在。毕竟,电商的盘子太大了。太平洋容得下中美两国,电商领域更可以容得下很多小巨头。
最下面的蓝色轴线,主要是我们前面说的媒介:文字、图片、音频、视频、以及三维(空间计算)。很多人很容易忽视这一块,不同媒介背后蕴含的产品力量是非常不同的。我们在做任何产品的时候,都要想一想我们要在这里面主打什么样的媒介载体。
从媒介逻辑上,图片优于文字,视频优于图片,音频有它特殊场景。早期移动领域那些做笔记、文字类的产品,估计很多都消失匿迹了。一个手机摄像头养活了很多图片类产品。国外有Instagram、Pinterest等。大家说国内的图片产品呢?其实我有好几位朋友之前都是做图片产品的,但都做得不大,为什么?中国最大的图片产品其实是微信朋友圈。
很多人其实都不知道微信朋友圈怎么发纯文字,只知道用它发照片(不信,你找身边十个人问问,看看有几个知道?其实微信朋友圈有这个功能,只是隐藏起来了,需要长按相机按钮)。 朋友圈默认的按钮是一个相机按钮。微信为什么这么做?为什么张小龙在很多人呼吁下,还是没有将发文字的按钮和发照片按钮并列呢?很简单,你如果在上海的地铁站随便圈100个人,你问问这100人多少人会发图片,多少人会发文字? 我想这个差距会非常惊人。99%的微信用户都会用朋友圈发图片。但是能发文字的用户,我觉得不超过10%。写文字是需要技能的,而发图片妇孺皆知、毫无门槛。这就是不同媒介的产品力量。
再来说视频,我在硅谷的时候,有好几位Google的朋友都提到,TickTok对Google的威胁比ChatGPT大。为什么?因为TickTok的用户在线时长很高,在挤压Google的用户时长。国内版抖音更是现在的流量之王。如果微信这几年不做视频号,早期不做朋友圈。我想中国互联网的版图肯定不是今天这样子。作为对比,大家看看WhatsApp的今天,价值可能连微信的二十份之一都不到。微信在很正确的时间,抓住了图片的红利(朋友圈),视频的红利(视频号),每一步大旗踩的都很准,所以张小龙无愧中国第一产品经理的称号。
所以媒介也是一个很重要的变化轴线。那么视频之后呢?就是苹果前两周发布的VisionPro,所谓的三维(空间计算)。文字是一维的媒介,图片和视频是二维的媒介,而空间计算是三维的。二维一定超越一维,三维一定超越二维,这也是我之所以看好VisionPro的原因。
所以未来最大的两个范式转换的力量,第一是AGI大模型在技术轴带来的范式转换;第二是空间计算在媒介轴带来的范式转换。第一个已经到来 ,第二个根据VisionPro产品的成熟速度,估计要晚2~3年。两轴交汇,我觉得未来5~10年一定非常精彩。
但大模型也不是在所有领域都有巨大的产品范式转换,我们来看下图
而另一类属于渐进增强型,所谓AI-Copilot副驾驶模式。比如生产力工具(Office Copilot),代码生成(Github Copilot),设计增强(Adobe Firefly),等等。这一类都是原有产品在某个环节使用大模型进行的增强。
顺便提一下微软,AGI来了之后,微软一直在摇旗呐喊,很多人觉得微软走的是范式转换的路子。但我要说,从大的格局上来看,微软其实选择的是AI-Copilot的渐进增强模式。因为微软已经是个2.5万亿美金的公司了。它不需要革命,它只需要乘着AGI的东风缓慢增长。让它的Office、Windows、Azure核心产品增长30%左右,几年之后就可以变成一个4万亿,甚至5万亿美金的公司。它不需要赌上身家性命,去All-In 范式转换型的AI-Native产品,因为范式转换虽然有高收益的可能,但是也是高风险的。微软在AGI时代的产品战略选择,也是值得很多赛道里的成熟公司参考的。
第三部分:AGI 产品未来发展的六点思考
**第一个思考是2C还是2B。**2C由于是端到端的产品,用户路径通常比较短,非常适合做AI-Native的范式转换。而2B由于客户路径比较长,AI的能力只是整个商业闭环的一个环节,所以适合做AI-Copilot的渐进增强。
而在2B领域,价值逻辑完全变了,客户的决策大于效率,效率大于内容。企业产品并不追求很多内容,反倒要求效率最大化,最好能辅助我快速做决策。
第二个思考是做平台,还是做应用。大模型一热起来,又燃起了很多人的平台梦。我给一上来就哭着喊着要做大模型平台的朋友破盆凉水。我就引用Midjourney 创始人 David Holz最近讲的一个话。他说他在前一个创办的公司Leap Motion学到的最大教训是,大家一上来就奔着生态系统的平台梦,后来失败了。但他做Midjourney时就吸取了这个教训,一定要做一个用户真正喜欢的产品,将它先做成超级应用。
这个路径对我们产品人非常重要。最近经常碰到一些人说,我们的目标是做XXX大模型平台,我都忍不住想吐,你的产品是啥还没有呢,从来没有人用过,哪来的勇气做平台啊,梁静茹给的吗?没有人会因为你号称自己是平台,就去支持你的。只有你有了超级应用,有了巨大的用户池,你才有平台的号召力,大家才会把你当作平台来支持你。
第三个思考是UGC VS. AIGC。UGC曾经是Web 2.0里很重要的一个策略。但大模型带来了AIGC的能力。
第四个思考是创新者的窘境:创新 vs. 守成
历史上每一次范式转换时,守成巨头都会面临创新者的窘境。比如拿Google现在的情况来说,OpenAI就是巧妙地利用了Google面临的“创新者的窘境”。
举一个反例,当年雷军做米聊,各种惊天动地的宣传惊动了腾讯,但没有提前做好应对巨头竞争的战略设计,从而让腾讯上下同仇敌忾、团结一致All in 微信,短短一年多时间,就基本上把米聊灭了。当然,反过来从腾讯的角度来说,在范式转换出现时,守成巨头如果能足够重视、足量All in ,也是能够摆脱“创新者窘境”的宿命。
第五个思考是AGI 如何跨越鸿沟
《跨越鸿沟》也是非常著名的一本书。它描述的多个阶段的鸿沟,是很多创新产品需要特别注意的。
第六个思考是大模型只是一扇通往AGI的门
如果我们回顾整个技术产业历史的话,很多技术刚出来的时候,我们就觉得这个技术很厉害。蜂拥而上这个技术,而忘了这个技术带来的各个领域的范式转换。比如当年浏览器和Web服务器刚出来的时候,很多人都会抢着做浏览器和Web服务器,因为很多技术人当时都认为浏览器和Web服务器就代表了互联网。最惨烈的战争是微软举全公司之力去开发IE和Netscape抢夺浏览器市场。我对这段历史比较清楚,因为我们全球产品经理大会的老朋友、《启示录》的作者Marty Cagan就是当年Netscape的产品高级副总裁,我之前请他来过很多次中国,经常聊起这段历史。
微软和Netscape在这件事上是两败俱伤,因为大家争斗的时候,全然忽略了人类进入互联网之后更大的战略机会,比如后来的eBay、Google、Facebook每一个产生的价值规模都远超浏览器和Web服务器市场。
好,我今天的演讲就到此结束,希望整个内容,特别是**“范式转换立方体“即ParaShift Cub 和 “连接与计算时代”**的分析对大家在AGI时代进行创新创业有帮助,谢谢大家!