个人AI计算机
我们是KMind,志在发明个人AI计算机
摘要
本文的主要贡献在于首次提出了:
个人 AI计算机的概念和 kOS架构。
AI精度的概念和数据脱水与浸泡技术。
ACT的概念和可编程 AI的实现。
AI互联网的概念和信息反向流动的实现。
特别的,本文还明确指出了企业垄断数据对社会的危害,并从技术变革上提出了建立一个更健康网络经济环境的可能性。本文长达三万字,读者可以选择感兴趣的部分自行阅读:
对技术浪潮的独家剖析在“第1章 计算机的两次革命”。
原创技术发明在“第2章 我们的答案: kOS-1.0”。
我们的使命愿景和对未来的判断在“第3章 AI互联网:连接所有个人 AI计算机”。
我们要推出的产品在“第4章 半个宇宙诞生:人工智能的中国方案”。
目录
两个月前,我和公司新来的实习生杨子乐进行了首次谈话,我对他说的第一句话是:“我们是一家伟大的公司”。子乐看了一眼公司里正在工位上埋头敲代码的十多个员工,面部肌肉开始扭曲,然后再也憋不住,捧腹大笑起来。他的反应把我也逗乐了,我马上意识到了他的想法,和他一起足足笑了五分钟才喘过气来。
我们是一家成立了仅仅 4个月,只有 16个员工,但是却很“伟大”的公司。伟大的公司不在于能赚多少钱,而在于我们的目标很伟大,一旦实现,世界将因此而改变。而我作为创始人,将确保公司会一直在实现这个伟大目标的道路上坚持下去。
第1章 计算机的两次革命
数字计算机自 1946年诞生以来,在不到一百年的历史上,有两次大的革命深深震撼着我的心灵。这两次革命都有一个共同的使命:让先进技术的大型计算机实现小型化和普惠化,使得人人拥有一台个人计算机。
1.1 第一次革命:人人有台计算机
1.1.1 个人计算机的发明
第一次革命发生在 20世纪七八十年代,以苹果公司发明一体化的个人计算机为标志。在苹果公司发明个人计算机之前,计算机是只有政府、银行或大企业才买得起、用得起的大型专用设备, IBM把计算机卖到了几百万美元一台。在那个年代,计算机是一个庞然大物,人们需要通过在纸片上打孔来编写程序,排队去机房操作大型计算机。计算机当时主要用于处理一些大公司、银行的账目数据,或者是政府、高校的一些科研数据。
此后有三项关键技术在 20世纪七十年代出现,带来了改变的契机,成为个人计算机出现的基础。首先是在 1969年,英特尔( Intel)公司接受了日本一家做计算器的公司 Busicom的订单,要求制作一个用于计算的处理器,而此前 Intel的业务仅限于存储器。当时 Intel的董事长摩尔要求这个产品不能只服务于一家公司,应当尽可能的通用。这激发了当时 Intel的马西安·霍夫设计了世界上首个微处理器结构,最后在费根带领的团队下完成了实现,即称为 Intel 4004的首块 CPU,它将一个完整的计算机结构做到了一块芯片上,拥有将近 3000个晶体管,具有通用编程的能力。此后几年英特尔陆续研发了 Intel 8008和 Intel 8080型号的微处理器,并基于这些芯片,推出了 x86指令集,在市场上大获成功。微处理器的出现也启发了乔布斯和沃兹尼亚克发明一体化的个人计算机。因此个人计算机又叫微机。(计算机领域里“小型机“一般特指 IBM小型机,它的体积依然很庞大,造价昂贵)
另一项关键技术是图形化的人机交互界面( GUI, Graphic User Interface),它由施乐公司发明。施乐公司最早是做复印机的,他们发明了多项相关专利。在 20世纪七十年代,施乐集中了大量计算机科学人才,并在实验室中制造出来了个人计算机,它包含完整的微处理器、鼠标、显示器,甚至还出现了互联网的雏形。 1979年乔布斯在参观完施乐的实验室后大感震惊,立刻将苹果的研发方向调整为了图形界面,并一举挖角了施乐公司的大量人才。两年后,比尔盖茨也借鉴施乐的思路推出了图形化界面的操作系统。可惜的是施乐公司缺乏足够的眼光,始终未进入个人计算机领域,从而将这个巨大的机会拱手让给了苹果和微软。可以说,苹果公司和微软公司都是抄袭了施乐的图形界面这一发明,应用在自己的操作系统中。尤其是微软后来的 Windows 3.0和 Windows 3.1在市场上大获成功,从而证明了图形界面( GUI)的易用性对个人计算机来说是至关重要的。
此外 Intel 8080微处理器的出现还激发了比尔·盖茨和保罗·艾伦为它写一个高级编程语言 BASIC语言的编译程序。 BASIC语言是一个对新手友好的简单易用的高级编程语言,苹果最早的个人计算机产品 Apple II也搭载了 BASIC语言作为编程语言。一个简单易用的高级编程语言,可以带来丰富的软件开发生态,是个人计算机所需要的第三项关键技术。
因此个人计算机的发明,有三个主要的关键技术基础:微处理器、图形界面、高效的编程语言。它们分别代表了计算能力的普惠化(普通人买得起了)、使用简单(普通人能看懂、用懂)、可编程的通用计算平台(功能灵活以及强大)。没有这三个关键技术作为前提,个人计算机是无法被发明的。
也因此最终在 1977年,苹果公司的乔布斯和沃兹尼亚克将所有的计算机相关组件、技术组合封装为一个整体,发布了最早的一体化个人计算机产品: Apple II,它将计算机的运算器件装在一个盒子里,并带有独立显示器和键盘。这是一台完整的个人计算机。而比尔·盖茨和保罗·艾伦在那个年代则创立了微软公司,以开发软件为主,通过售卖软件授权的方式,微软公司最终成功的让每个家庭拥有了一台计算机,家喻户晓。
可以说,诞生自 20世纪七八十年代的个人计算机,让以前只能服务于大企业的计算机走向了普惠,最终让每个家庭拥有了一台计算机,计算机从此能够为每一个人创造价值。先进技术从高端走向了民用,带来了深远的影响。
1.1.2 互联网的诞生:连接所有个人计算机
有了海量用户为基础,将所有的个人计算机连接起来,才诞生了今天的互联网。谈到互联网的诞生,往往会追溯到 ARPANET、 Web的诞生、 TCP/IP协议、以及 GNU自由软件运动等伟大创举。但是我想强调的是,如果仅仅只是一些高校和科研机构连接起来,是无法形成今天意义上的互联网的。截止到 2023年,全球互联网上的用户规模达到了 48.8亿。互联网也成为了电报网、电话网之后最重要的信息高速公路,彻底的改变了人类世界的面貌。如果只有几百个科研节点连接到一起组成的网络,必然曲高和寡,是不可能达到这种影响力的。所以个人计算机的普及直接促成了互联网的蓬勃发展。也就是说,把所有的个人计算机连接起来,就形成了今天的互联网。
在这里尤其值得一提的是,在历史上苹果公司两度发明了个人计算机。第二次是在 2007年 1月 9日苹果发布了第一代智能手机 iPhone,互联网迎来 iPhone时刻。 iPhone拥有先进的触控屏操作,搭载了 iOS操作系统。到了 2008年 AppStore出现后,在新型的移动计算机上开发 App变得蓬勃发展起来。
iPhone的优雅体验带动了一个时代,众多手机厂商纷纷效仿,最终成功的让每个人拥有了一台智能手机,即人人有了一台个人计算机,这台计算机是可移动的,小到能装进口袋。除了能打电话外,还包含了摄像头和地理位置定位系统,能够便捷的采集全新的数据,因此有了全新的应用场景。最终将智能手机全部连接起来,就形成了移动互联网。
如果说微软成功的让每个家庭拥有了一台计算机,那么由于苹果公司的贡献和影响力,在 21世纪的前二十年成功的让每一个人拥有了一台计算机。如果以前的互联网只需要连接每个家庭的计算机,那么现在的互联网就需要连接到每一个人,互联网里的节点数因此成倍增长,于是有了“移动互联网”的说法。全球的数字化信息在互联网里高速流动,出现了前所未有的盛况。
1.1.3 当前互联网的主要矛盾:数据垄断必将走向崩溃
互联网改善了人类的生活水平,纵观历史,在拥有互联网的今天确实是人类最好的时代。但是互联网依然存在着许多结构性的设计缺陷。比如在技术上,作为互联网心脏的域名根节点相对脆弱; TCP/IP协议设计的缺陷导致了拒绝服务攻击频出; IPv4地址资源耗尽,等等。但在这里,我想重点讨论一个更加隐蔽、更加本质,且更加致命的结构性设计缺陷:信息的流动方向带来的数据垄断问题。
当把所有的个人计算机连接到一起互联互通以后,人们很自然的有了信息访问的需求。那么人们怎么找到所需的信息呢?早期的互联网公司发现了这个商机,无一例外都提供了某类的信息的聚集服务。 Yahoo的类目聚合了当时的互联网里的主要网站和网页,同时它还发明了搜索引擎; Google发扬光大了 Yahoo的搜索技术,并开创性的提出了新的排序算法和大规模计算技术,它聚合了全世界的公开网页;在中国,第一代互联网公司搜狐、新浪、网易都是新闻聚合为主的门户网站,此后百度学习了 Google的搜索引擎,开展了全网搜索业务,阿里巴巴则推出了电商业务,聚合了全网的商品信息。
因此可以说,早期的互联网公司,提供了信息聚集的服务,方便人们在互联网上快速找到信息,这种模式我称之为 “人找信息”。在这个模式下,久而久之,互联网上的信息在某些超级节点形成了聚集,最终导致了数据垄断。一旦数据积压在某一点,数据量一大,访问的人也多,信息检索结果的排序就会成为一个关联着巨大商业利益的问题,那么最自然而然能想到的赚钱模式就是卖信息检索的排序结果,也就是广告。因此在互联网信息流动方向为“人找信息“的模式下,必将导致信息聚集,以及由此带来的广告商业模式。信息聚集的极端情况,就是数据垄断。这个模式直到今天依然无比强大,诸如 Facebook、字节跳动这些数千亿美金市值的商业帝国,依然是走的垄断数据,广告盈利这个路线。
客观的说,信息聚集这条路在互联网发展的早期确实提供了很大的价值,方便了所有网民。但是一旦信息聚集走向了垄断,就导致了失控。简单来说,有以下几个非常明显的弊端:
首先,大互联网公司垄断了数据,但数据都是老百姓们贡献的,最典型的比如用户的访问行为偏好数据,所有互联网公司都需要依赖这份数据来实现广告的精准投放,可是最终广告变现的钱却跟老百姓们一毛钱关系都没有,都被大公司赚走了。可以说老百姓们被收了一道数据税,这道数据税是广告主出的,但是羊毛出在羊身上,这抬高了所有商品的售价。如果这个钱是合理区间内的中介费还能说得通,但目前却是一种暴利。就好比高速公路建设完,一般二十年收回成本,三十年后就免费了,结果投资方在这里把两百年后的钱都收完了,这就是互联网流量生意被称为“印钞机模式”的由来,一旦垄断了数据,就垄断了用户流量,这些公司就等同于躺着印钞票。
其次,数据垄断带来了互联网的割裂。现在的互联网和十年前的互联网有着巨大的区别,变得越来越地盘化,泾渭分明。最典型的比如视频网站,想看一部电影,往往是找了优酷没有,再去爱奇艺、腾讯视频找,还没找到,再继续去其他视频网站挨个找。所有内容提供方都得给这些渠道平台交高额的内容分发费用,这些掌控了流量的渠道平台互相之间森严的数据壁垒把互联网拆的支离破碎,他们在自己的地盘边界上竖起了一道道的高墙,让数据不再互联互通,最终影响的是老百姓们的效率和体验。
最后,垄断一旦形成,就将瓦解互联网的自由属性,在互联网上不再有自由和平等可言。小的个体在互联网上永无出头之日,而大的巨无霸公司因为垄断了资源,也将失去进取的动力,最终腐朽。这就是为什么一个自由职业者或者是小微企业在流量型平台上越来越难做生意的原因,赚的那点钱还不够交流量费。
比如 2017年暴露出来的天猫和京东为了大促活动争夺商家,逼迫商家签订排他协议,就限制了商家的自由。类似的,近日李佳琦借助流量优势,控制商品的市场价格,属于典型的店大欺客行为。互联网本应是用户做主,但用户却做不了主。数据都是用户创造的,但最后用户变成了被数据操弄的对象。就像你买了套房子,请了个装修队来装修,但是里面怎么装却不是你说了算,而是由装修队来控制。
所以当李佳琦在直播间对消费者说出的那句:“有时候找找自己原因,这么多年了工资涨没涨,有没有认真工作?”的话时,就扯下了资本在数据垄断上的最后一块遮羞布。这句话深深的刺痛了广大网民的心。同样都是劳动者,同样的付出了努力,有的人因为垄断了数据资源、垄断了流量,就赚到了普通人一辈子都花不完的钱,而有的人却只能挣扎在养家糊口上。既不公平,也不合理。李佳琦现象背后本质的原因,是因为他依托的直播平台完成了短视频的信息聚集,从而垄断了数据,进而垄断了流量,而李佳琦是这种流量红利的既得利益者。他身处其中而不自知,所以才会说出这么幼稚的话。数据垄断让互联网里的人们不再平等。
一个社会的财富总量在一定时期内总是有限的,有人靠垄断资源攫取了暴利,那么普通老百姓得到的财富自然就少了,这就是为什么现在工作越来越难找,老百姓收入一直高不起来的原因。互联网产业是近 20年来全球 GDP增长的强劲动力来源,但互联网巨头和背后的资本攫取了过多的暴利,从公开的财报就可以看到这些数据,新闻里每日鼓吹某某互联网公司上市又诞生了多少个千万富翁。而中国有 14亿人,超过一半的老百姓的月收入不到 2000块,他们的千万富翁越多,老百姓就越穷。这些暴利已经远远高于社会人均收入值,超出了合理范围。
( 2022年全国及分城乡居民人均可支配收入与增速,数据来源 www.gov.cn)
由此可见,原本自由的互联网,不再是净土。通过信息聚集这一手段,在资本的加持下,一旦互联网公司形成了数据垄断,也就形成了市场垄断,而最终受苦的是所有网民。垄断数据和垄断土地没有本质区别,高净值财富都是来自于垄断资源,而非劳动。因此可以说,数据垄断是资本在互联网时代的剥削行为,剥削了所有网民。
我们不反对用数据来赚钱,互联网的价值来自于数据,我们鼓励数据创造价值。但我们反对用数据垄断来赚钱,尤其反对垄断数据后,还利用垄断地位阻止和打压其他人提供同类服务。因为一旦无法遏制资本对利润不断攫取的贪婪,垄断的最终结果,贫者愈贫,富者愈富,必将导致崩溃。因此我认为,当今互联网最深层次的主要矛盾在于:“信息聚集导致的数据垄断”和“人们对自由、开放、共享、平等的网络环境的向往”之间的矛盾。
为了解决这一矛盾,实现资源的重新分配,有许多工作需要做。首先可以想到的是调节网络结构。现代网络科学的结论告诉我们(请参考拙作《计算》),在一个无标度网络中,其规律服从幂律分布,有着“富者愈富”的现象,自由发展则必将涌现出超级节点。而在一定初始化规则的约束下,则可以涌现出我们想要的任何网络结构。这意味着宏观调控的手段是有效且必要的,需要制衡资本的无序扩张。
从网络结构的角度来看,将互联网设计成一个类似于人类社会关系网络的模型,将会是一个更加公平的网络,因为这种网络是去中心化的,是局域化的,通过长程连接把各个局域连接起来,不存在超级节点。事实上微信就是这样的网络结构,在微信里一个人只能加几千个好友,而不可能用一个微信号加 1000万人。这种网络模型称为“小世界网络”,在小世界网络里,没有超级节点可以影响大部分的其余节点,因此它更加的稳定,适应性强。但小世界网络损失了效率,因此可能需要找到小世界网络和无标度网络之间的某种网络结构,这是宏观调控的艺术。
但调节网络结构,以抑制或迟缓超级节点的出现,是治标不治本。我认为还有做出更加彻底的改变的可能性,因为最近这五年的技术发展,已经让我们站在了一个百年一遇的十字路口上:我们有机会改变互联网的信息流动方向,从而消除信息聚集。
1.1.4 技术垄断:大型专用AI计算机
大互联网公司之所以能够做到信息聚集,是因为在传统的互联网结构里,用户有一个需求之后,无法高效的找到对应信息,而互联网公司提供的信息聚集,恰好满足了这种高效寻找信息的需求。从这个角度来说,我从未否定信息聚集的价值。
但这样的模式存在两个问题,第一个问题是数据垄断问题,如前所述;第二个问题是“人找信息”的模式效率依然低下。由于互联网已经被大公司之间的数据壁垒割裂了,人们不得不耗费更多的时间在不同的平台上寻找他们想要的结果;同样的,由于受到了商业广告的干扰,人们不得不从一大堆检索结果中排除这些干扰,从而找到他们需要的那个最优答案或者近似最优答案。
如果能改变信息的流向,就能解决这些问题。即从“人找信息”,向“信息找人”发生转变。当人有一个需求之后,应当是信息主动找上来,自动给出一个全网最优解,而节约大量的时间和精力。这个最优解,不应该有商业广告的干扰。
这在以前是天方夜谭,但现在是有可能的。因为这些年的技术进步,我们有了 AI这一新工具来实现这件事情。如果互联网中的每个节点(每个企业、组织、以及个人)都拥有一个 AI, AI知道它的主人拥有什么样的信息和数据,再通过一个中立的搜索推荐算法,当人有任何需求时在网络内进行“广播”,询问每个节点的 AI是否有所需的答案,一旦有,就由中立的推荐算法将其推送给需要的人。这样就实现了“信息找人”。当然一切过程需要在安全的情况下完成,需要建立完善的隐私保护、授权、内容安全机制。
这样的“ AI互联网”是一次大的飞跃,将提升人类社会的整体效率,我们将在第三章讨论。但实现这样的AI互联网的前提是每个人或组织都拥有了AI计算机,现在先把注意力放到 AI计算机本身上来。
在做创新时,遇到的诸多困难中的一个,就是很多概念缺乏精确的定义。 AI(人工智能)就是一个没有被精确定义过的概念。自从 1956年达特茅斯会议上,麦卡锡创造了 AI( Artificial Intelligence)这一名词以来, AI依然是一个综合且模糊的概念,它综合了许多学科,包括计算机科学、心理学、神经科学、认知科学、逻辑学、数学等等。在此我并不打算对 AI下一个精确的定义,那只会把我拖入无止尽的辩论中。在此,我所指的 AI特指那一类具备自动化、自适应能力,尤其是在数据处理上具备这种能力的系统。
如果从这个概念出发,那么这样的 AI系统已经出现了很多年了。大型互联网公司如 Google、 Facebook、百度、淘宝、抖音等在处理信息聚集的大数据时,尤其是他们在做广告的推荐算法时,就已经建立了一套这样的系统。广告的精准投放和“千人千面”都已经做到了可以基于用户的实时访问行为,改变接下来用户会看到的推荐结果。这是一种自适应能力,基于输入的变化而改变自身的行为,这就是 AI的能力。
因此可以说,大型互联网公司在处理大数据的能力上,已经建立了“大型专用 AI计算机”。首先它是大型的,数据量很大,可能大至上百 PB;用到的服务器数量很多,一个集群可能有上千台高性能服务器。其次它是专用的,因为这样的系统只能用在搜索、推荐、广告投放的特定场景,而无法实现对于任意任务的通用计算。最后它是智能的,基于环境的自适应能力是一种被称为 Agent(在人工智能领域 Agent不应当被翻译为“代理”,翻译为“智能体”勉强可以接受)的能力,而且麦卡锡正是用搜索路线来做人工智能的先驱,因此将搜索推荐技术纳入到 AI领域本身是合理的。
这样的大型专用 AI计算机,帮助互联网公司完成了信息采集和聚集,高效的处理了大数据,提高了商业效率,榨取了数据创造出的价值。由于大型专用 AI计算机的成本高、实现门槛高,因此这种先进技术创造出来的价值,被这些大公司垄断了。他们既垄断了数据资源,又垄断了处理数据资源的所需要的技术,最终垄断了数据创造的价值。一个耳熟能详的比喻是“数据是石油”,那么“大型专用 AI计算机”就是石油开采、提炼的整套技术。在我国早期的一些油田探明了巨大的储量,但是当年却只能和欧美的拥有石油开采技术的公司合作开采、利润分成,就是吃了没有先进技术的亏,所以坐拥资源,只能任人宰割。
现在连普通老百姓都已经知道了数据是石油,意识到了数据的价值。但是非常奇怪的一点是,在一个路人皆知“数据有价值”的社会里,普通老百姓却从来没有用数据赚到过钱。所有的数据都是老百姓们创造的,但最后数据赚到的钱和老百姓们一毛钱关系都没有。数据只是大公司的石油,不是老百姓的。原因在于老百姓们被技术剥削了。
因此我们就有了变革的动机:互联网从诞生之日起就代表着平民的胜利,而不应该被垄断,因此为了维护这个良好的网络环境,回归初心,就迫切的需要有一个新工具,来帮助个人用户、小微企业用户能够处理数据、创造价值。这个新工具应该是开放、自由、共享、平等的,即“个人 AI计算机”。这个新型的计算机将再一次把大公司垄断的“大型专用 AI计算机”给小型化、普惠化,让每个人都用得起。在这样的“个人 AI计算机”模式下,人的在线时间不再受制于睡眠和休息, AI会帮你时刻在线,只要提供了数据, AI就能开放式的回答所有问题,永不停歇的服务、沟通、协同。
一个可预见的结果是“AI互联网”将消灭精准营销广告,把精准营销广告商榨取的万亿级别人民币利润返还给供应商和老
登录后可查看完整内容,参与讨论!
立即登录