返回列表 回覆 發帖

[原創作品] 上帝游戏:可能性的湮灭与泛起

上帝游戏:可能性的湮灭与泛起

孩童:为何天上有流星坠落?
老人:因为大地上有一个人逝去。

“星际争霸是上帝借暴雪之手赠予玩家的礼物”。AI系统的加载,却真正地将星际争霸缔造为上帝游戏的翻版。

上帝游戏的规则是,上帝之手推动一切,我们只是找寻、发现、创造可能性,一如星际争霸。一个可能性的湮灭,不过是众多可能性的再一次泛起。周而往复,直到新的可能性的诞生。不然,则有“弱者,道之用”,“反者,道之动”。故有,无为而治,顺其自然。

你将之称为宿命,我却归结为全部意识推动下的无意识演进。

存在皆被感知,正如,一个人的逝去,是一道流星的划落。
概率论:完全可能性的理论与现实图景

这篇文章的标题可以用来命名一本小册子,小册子的内容与中国现行的概率论教材,以至绝大多数中国人见到的外国概率论教材给出的基础理论大相径庭。应当如此说,在绕行了两千多年,经历无数的谬误和荒诞后,终于再次来到前人划定的理论框架。不同之处是,由于有了社会理论和具体自然科学理论的突破所提供的坚实基础,先前的理论观点已经开始得到正确的理解。这次,将是人们整体思想观念的彻底变革。

一、明道红的卦:爱在贝叶斯定理的没有交集处

本世纪初的电视剧《少年张三丰》里,明道红几乎事事占卜问卦。她不知道,她的卦有时灵,有时不灵,一切都是导演的安排。后来,我才明白,若非刻意或凑巧,明道红和现实中人们的卦永远不会灵验,因为贝叶斯定理很难灵验,更何况贝叶斯定理的成立依赖于条件概率,计算条件概率的两个条件事件,前事件A和后事件B,必须要有交集。她不知道,她的那些卦与问的对象从来都没有必然联系。后来,我才明白,我们见到的世界全部是由条件事件组成的,它们无不是对一个样本空间的取样,不妨将它命名为:元样本空间。

元样本空间纯粹由数字0和1的排列组合构成,所有排列组合的个数可以由一个无穷级数来表达,即2^1+2^2+2^3+2^4+2^5+……。它是一个互相相容的完备事件组,用G(N)来表示各个事件组,则有G(1)=2^1=2,G(2)=2^2=4,依此类推。也就是说,你所看到的教材上未明白告诉你的“样本空间是一个事件组”,实际上是错的。“互不相容的完备事件组”同样错得离谱。

元样本空间提供给整个世界用于取样,产生我们看得见、看不见的事件。在元样本空间的层面上来讨论相容性与不相容性,一目了然。例1,在同一个时间点上,一名中国消费者购买一瓶饮料,一名日本消费者购买一台电脑,十名韩国消费者在网站上团购千袋食品,它们可以用不同的0-1数字组合来表示,即对元样本空间进行取样。

任何一个样本空间均可以化归为元样本空间。例2,可以分别用001、010和100来描述黄种人、白种人和黑种人,即在由三个数字构成的组合上,用第三个位置上的1来表示取样到黄种人,第二个位置上的1来表示取到白种人,第一个位置上的1来表示取到黑种人。

传说中,计算机是某个外国人根据易经创造出二进制而发明的。当然,中国的有关方面做出了辟谣,一如他们在教材上告诉中国人,使用n这个通项来计算无穷级数。用来表示元样本空间的无穷级数可以直接用错位相减法进行计算:设G(N)为X,则2X-X=X=(2^2+2^3+2^4+2^5+2^6……)-( 2^1+2^2+2^3+2^4+2^5+……)=-2。是的,你没看错,结果是负2。用概率论来描述整个世界时,其计算性逐步丧失。

二、基于概率论的虚拟世界:一种创造现实的游戏理论

假设我们拥有一台资源足够的计算机,为我们制作一款完全不需用户来参与的自动化游戏。游戏里的对象包括人类、其他动物、植物、水、空气、阳光、泥土、矿产,等等,即创造一个与我们周围的世界没有本质区别的世界。它们被创造的规律是全部从元样本空间中取样。例3,创造一名人类,赋予其性别(假定只有2种:男和女)时,从事件组G(1)中取样,取到0创造一名男性,取到1创造一名女性。例4,在创造一名人类的同时创造一条狗,先从事件组G(n+1)中随机取一个0-1数字组合,当这个数字组合取到距离全部为0或全部为1的数字组合附近的3%或者5%区域(该事件组内全部数字组合构成100%的区域)内的数字组合时,再从事件组G(1)中取样,赋予狗的性别属性。G(n) 可以用来规定一个事件列表,包括人类日常生活中的各类事件及其发生顺序,事件的发生也从G(n+1)中取样产生,但是当取到3%或5%区域时,则不按照规定的顺序发生,而是另取一个事件发生,类似于:一个人早上起床后,本应洗漱一番,但他直接去上了班。取样方法可以但不限于此。小说是依据写作者的意志来创造现实,归根到底不是创造现实,这里却是依据一个普遍适用于现实世界的规律来创造现实。创造这款游戏的人,对于这个游戏世界来说,就是“创造一切的主体”。

《道德经》四十二章云,“道生一,一生二,二生三,三生万物”。二十五章又云,“有物混成,先天地生。寂兮寥兮,独立而不改,周行而不殆,可以为天地母”,“人法地,地法天,天法道,道法自然”。“天”、“地”合为现今的小自然(地球、星球),“自然”则为大自然(宇宙)。我不知道,在这些理论变异为所谓宗教的道家或被划归唯心主义的范畴时,历经了怎样的变故。可惜,它并非唯心主义,也非唯物主义,因为真理只有一个。它认为,世界上存在一个普遍适用的规律,上帝用它来创造一切。哥德尔不完备定理认为,形式系统是不完备的。但概率论在数学上是完备的——元样本空间是“一”,二项分布是“二”,多项分布是“三”——它甚至完全地描述了整个世界。当中,没有不可能性。

毫无疑义,这个虚拟世界与现实世界有本质区别。虚拟世界没有意识。物理计算机不可能创造出意识,生物计算机才能。而我们恰恰拥有一台资源足够的生物计算机:宇宙。假如,我们仍然处在唯物论的错误层面上,没有认识到是意识在推动社会发展前进,而不是物质决定意识,我们就不可能得到最后一个用来对抗概率论的武器,一件用来证明我们不是处于虚拟世界的证据:“小概率事件”可以普遍发生。现实世界里的完全可能性是如何发生的呢,人们不是明明见到许多不可能发生、发生不了的事?是在通往无穷大和无穷小世界的道路上发生的。物质与意识、主体与客体的合一,导致了完全可能性。

三、现行理论:让人们永远呆在远离真相的泥沼

在阅读中国几千年历史中诞生的文学作品时,我感到,它们的存在,掩盖了太多现实生活的苦难。唐朝引进佛教,用意是极为深刻的。《道德经》作为一部当今被认定为唯心主义的典籍,不适合用做实施愚民政策的工具,因为它竟然宣称“道大,天大,地大,人亦大”,不说“王大”。这无疑会引发统治阶级的不满和恐慌。甚而相反,它阐述了一系列自然科学理论和社会理论,让人们接近真相的理论。封建统治者标榜自己为真龙天子,号称民贵君轻,自己却从来不会、不敢(也的确没有能力)去真正相信《道德经》。事实上,唯物论和唯心论、贝叶斯学派和频率学派,就如同江湖中的名门正派,没有一个代表正义,那不是它们的主要功用。

大数定律。它是在说,谎言重复n遍即为真理。国外教材有一种观点是均数定律,倒是与马克思主义不谋而合。马克思主义认为,商品价格围绕价值上下波动,而不是围绕市场上的多数价格波动。中国在对待标准差和标准误上讳莫若深,用方差代替标准差,并且对标准误一笔带过。而元样本空间的出现,推动了进一步对均数定律的否定。

正态分布。“正态分布”是与均数定律紧密联系在一起的。做一次取样,落在三倍标准差(误)以外的数据(样本)很少,是均数定律的观点。增加抛硬币的次数至100次以上,硬币的所有可能性组合绘制成长方形的概率直方图,再用连点法将这些概率直方图连接起来,就得到了一条正态曲线,正态曲线下的面积可以用来拟合计算“概率”(实质是条件概率)。结合本文前面的阐述,可以看到,根本不存在所谓的“正态分布”。“正态分布”是二项分布(一般形式即为0-1分布,全部用0和1来表达的样本空间即为元样本空间)的象,二项分布是“正态分布”的体;“正态分布”是离散的,不是连续的。我也不知道,“服从正态分布”的总体是何意。因为在概率论看来,总体是对元样本空间在不同层次上的划分。例5,对手机产品进行市场细分的人,与对电脑产品进行市场细分的人有可能会将同一名消费者划分到不同的事件组。“正态分布”是对一个集合的形象描述,很容易令人误解的是,一个数字组合就被看作是一个“正态分布”。因而,线性的世界(总体)被贴上了“正态分布”的标签。每个相对于概率论而言的研究对象,都是一枚抽象的硬币。即便事件组内的数字组合都是同时被取到的,你应该知道,它们是在描述不同的对象。“正态分布”和所谓的其他分布,是为了掩盖人们对二项分布和多项分布的认知。

小概率原理。它说,“小概率事件”在一次实验中不可能发生。例6,假如全世界出足够多的钱给一千名能够连续抛出100次硬币正面的人,那么,别管它是怎么发生的,它一定会发生。例7,微软的windows视窗操作系统在中国过去的某些时期里,一直占据了几乎所有的个人电脑,整体上来看,如果说那时99.9%的个人电脑装的是windows,你会认为这个推断是错的吗?如果说只看某个单位,则可以断言100%都装的是windows。也就是说,在装windows还是不装这个事件上,99.9%或100%的对象选择了1,它们在数字组合上表现为99.9%或100%的1。“小概率事件”可以普遍发生,有的正在普遍发生,因为在现实世界里,是意识,或者说是人们的所思所想、所欲所求决定了事件如何发生,如何向事件组中聚集。例8,据说美国调查机构仅抽取相对于全部选民来说极为少量的样本,就能预测总统人选,你应当知道这是怎么回事。

测度论。一条曲线为什么会不可以测量它的长度呢?因为“这条曲线弯曲得非常厉害,我们无法测准它的长度,或者设想它离我们非常遥远,即使用最先进的仪器也无法对它进行测量”。测度论得出这样的结论,无非是投入了不可知论的怀抱。假如世界是不可知的,他们又是怎么知道测度论的这个结论是正确的呢?

误差。假如我们给一块金块称重,不同时间、不同仪器、不同情境下的称量,会出现或大或小的差异,这是误差吗?用问卷调查一名对象,访问人员填错了对象的回答,这是误差吗?不,它们只是对样本空间取了不同的样。在概率论的眼里,世界上不存在误差。另,社会系统的迁移和变革、语言、思维,都能用概率论来描述。

因果论和决定论。仅仅是出于语言习惯的原因,我们用“因果”和“决定”的字眼来描述世界。概率论的观点是,世界是条件的,一切事件的发生都需要条件。又,世界是不确定的,它是在无数枚硬币的抛起与落下中诞生。我们不知道硬币何时抛起,何时落下,最后展示给我们哪一面,所以,我们无法去算命,尽管我们可以从一个类中找出一个类的相同性。在湖中捞些鱼上来,给它们做上标记,然后放回去,再捞一次,看捞上的带标记的鱼有多少条,通过公式计算测定湖内鱼的数量,这就是在算命。使用条件概率,而不去寻找具体的原因和条件,注定了要出现错误和悲剧。例9,20世纪可口可乐耗资数百万美元进行的口味测试的失败。例10,对某种商品进行消费者购买意愿调查,形成调查结论,消费者行为并不一定(或者说往往如此)与结论一致。有很多因素在影响研究对象,使他们在某个时刻落入不同的事件组,与其他对象排列在一个数字组合里。

是的。区别了虚拟世界与现实世界,也无法否认概率论在描述世界上的完全性。由于不愿意相信身而为人,却没有自由意志,生活在一个类似美国电影《黑客帝国》中虚构的matrix系统里——尽管人们应该明了,现实世界与之非常非常非常之相似——所以,必须从哲学上作出界定,提出两个哲学的基本问题:1、世界是一(个),还是多(个)?2、世界是可知的,还是不可知的?人们应当明了,前面的两个信念与本文前面的论述一道支撑起一个我们认为正常的世界,后面的两个信念则告诉人们这个是荒谬的世界。
星际争霸1的AI设计思路:以人族开局为例

现在看来,伯克利分校的星际争霸1AI—— “主宰”充其量是个微操机器人。它一如既往地没有认识到,AI能够“随机应变”这个问题的解决,最终的答案就是问题本身——随机地应变。

星际争霸1是一款即时策略类游戏。我们就从策略入手,以人族的开局为例说明如何设计真正的AI。电脑AI选定人族后如何发展自己呢?不妨将它视为一连串策略的发生、执行与完成,这一切又都由AI自己随机决定。为何要随机的理由很充分,任何一种无论多么成功的策略体系出现一次后都会被针对,一旦如此,AI就不再是AI了,人们发现那变成了愚蠢的行为。相反,有时看似愚蠢的行为,随着事情的发展却变得很聪明。

1、主动型策略
(1)采矿;
(2)建造:
放BS;
放BB;
放BR;
放BC。
(3)训练(比如,造SCV);
(4)探路;
(5)攻击;
(6)野BB。

2、被动型策略
(1)穿矿聚团攻击;
(2)散点围攻。

3、偶发型策略
(1)野BS;
(2)封气矿。

这些策略属于基本策略,是不完整的,你还可以将其归为两类供选择。不管怎样,我们将它们的集合统称为策略集。重要的是还有一类:

4、优化型策略
(1)先定分析
如同一名人类选手新学星际这个游戏,AI需要对地图、兵种等进行基本的分析,依据有关数据确定每个时段的必须完成的任务、基本的发展路线。能做到这一点是因为,星际的资源、兵力和科技在一定时间内是有上限的。

(2)指令序列
指令序列必须具备策略集(供选择策略)、计算和比对功能。进入游戏后,AI为每个SCV建立一个指令序列(相当于一个独立的电脑进程或应用程序),来控制SCV。假如随机取到采矿这个策略,那么,四个SCV可以同时去距自己最近的水晶采矿。与之同时,为大本建立起的指令序列训练一个SCV。假如电脑在拥有9个SCV时选到探路策略,那么就随机选一个SCV,计算出一条路线,出去探路。假如这个SCV在探到对方后遭遇攻击,指令序列根据先定分析中的数据比对攻击与防御,决定攻击还是躲避。假如这个SCV不幸地遭遇散点围攻(类似于6条小狗合围)后阵亡,则该指令序列删除。

(3)策略中心
控制线。对(1)的问题做出回应的就是它。在游戏进行到某个时间,依据自身采集的资源情况、侦查情况,修正或继续执行原来的策略。例如,当水晶达到100时,大本返回(或控制线直接读取到)这个信息,控制线从自身的策略集中选择策略,决定是放BS,或是等待,继续训练SCV,满150水晶时放BB。这些信息返回给大本。水晶达到150时,控制线随机选一个SCV放BB。当探路的SCV探完对方后,返回信息给控制线表示任务完成,控制线决定这个SCV的下一步动作,比如,此时对方探路农民同样到达了AI家中,AI家中尚未造建筑,则控制线有可能选到野BS或野BB。理由是,从人类选手的操作可以知道,一个要放建筑的农民可能很长时间都放不下。所以,指令序列给出的任务应当是有时间属性的,超过某个时点则交由控制线处理,这同样可以用来对付对方的封气矿策略。控制线还应当有个某个时段占据某个有利地形,或某些兵种前往某地的策略,等等。它决定了兵力部署、站位。
交叉策略中心。SCV遭遇对方探路农民的骚扰性攻击后,可能选择攻击策略(穿矿聚团攻击或散点围攻),这需要多个指令序列的协同,因此可以选择创建一个新的指令序列来进行控制。我们将它称为一个交叉策略中心。

(4)分析中心
先定分析属于这部分的内容。只是它如此重要,以致将它提前了。分析中心又应当具备更多的功能。
学习。也就是对AI自身的整体性训练,包括自我对战训练、与其他选手的对战训练和调整策略集、控制线等。策略集一开始是不完整的,但可以通过与一个同自身一样的程序来对战,扩充和优化策略集。分析中心通过对对战录像的分析(当然只能是代码形式的),读取有关数据,切分各时段资源、兵力和科技等情况,选取较优的部分纳入策略集,删除不合理的策略。如有必要,为策略赋予时间属性。这样,就可能出现一个AI学习到的大招。其他也是如此。

基于随机性的电脑AI不会每次都胜,因为世界是公平的。但是,随着电脑AI的强大,完全可以预言,星际争霸1的平衡性将被彻底打破。公平将不再是对一个人类选手和一个电脑AI而言,而只是对一个AI与另一个AI而言。我们需要的将是1024线,看到的将是真正的不夜城。3个枪兵旋转打地刺不是奇迹,也许,我们打开AI间的对战一看,一个AI正在甩枪兵。
返回列表
高級模式 | 發新話題
B Color Image Link Quote Code Smilies
換一個