风城纪事·暗黑

(全文虚构,名词与现实并不完全对应)

我和母亲在法国旅游,有两个火车站,它们互相之间遥相互应,但是又有一条复古的轨道连接其中,大约是为了运输换乘的旅客。我们旅游到此地,寻思着要不要去另一个火车站赶去下一个景点的火车。

“呜~~~~~”,换乘列车拖着长长的气笛声开动了。心中传来了阵阵失落————这班车恐怕是赶不上了!我和母亲商量:另一个车站看起来并不是很远,我们应该可以步行过去。奇怪的是,换乘列车好像和行人共用一个隧道,

隧道上面有个信号灯,为了不撞上火车,我们选择在信号灯熄灭的时候进入隧道,没曾想,刚进隧道就遇上了迎面而来的火车,我们赶紧向左拐入了旅店,才没有被撞上。

迎面碰上了旅店的前台老板(娘),他走来的时候嘴里居然正念叨着上海话,我怒不可遏地质询他:“农个的哪能搞伐啦子额啦?一啦胡粗开股来弄灯哪能哈额嘛?脏到宁哪能办法子?搞撒子搞啦?……”(译:你这里搞得什么鬼东西啊?它火车开过来你这灯怎么也是黑的啦?撞到人怎么办啊?搞什么搞啊?……)

预想中的赔礼道歉全然没有出现,老板居然理直气壮地骂道:“侬伐要过则子噶慧德港桑还艾唔就哪能噶了,无帮侬刚个的思法股!弄刚桑还艾唔没宁听呃懂额!哦!伐要哈刚巴刚哦!”(译:你不要觉得自己会讲上海话就怎么样了!我告诉你哦这里是法国!你讲上海话可是没人听得懂的!哦!不要瞎讲八讲哦!)

这一瘪真是吃的实实在在,被无语和愤怒裹携着,我进入了旅馆的一个房间,一个面若冰霜/死灰的姑娘正望着墙上的画出神,好像是她自己的作品。不知什么原因,我们讨论起了”法国的上海人“这个话题。

她说,你们上海人都是被卖的命,在这里都会被作为“可爱.魅惑红”卖出去————没有希望的,这个社会就是这样的黑暗,你们上海人就是这样被卖成奴隶的命……我跟她争辩,我们还可以是“可爱.理性蓝”,“可爱.深沉黑”,我们上海人,不止是被卖的命啊!

姑娘无动于衷,喃喃道,”是黑暗的,是黑暗的……我只能被卖为奴,没有别的路的……“。我听不下去了,告诉她无论什么在哪里调用都一定要加上”--冷淡 --偶尔的热情“这两个参数。之后,我和母亲便离开了房间。大约是第二天,姑娘在我们前往的那个火车站拦下了我,眼里好像有了光彩,叫我再去那个房间里。

可是一进入房间,她又回到了开始的那个状态,无所谓地呢喃着……我的情绪快要爆炸,大声向她吼:

The only darkness, is the darkness in yourself!

(译:你心中的黑暗,才是惟一的黑暗!)她稍稍一惊,我却已然离开现场。

离开那里以后,我琢磨着,自己怎么会吼出这样的句子?我想着,反复念着……然后我就醒了,发现我正戴着降噪耳机,口中念念有词。

一七年七月五日晨
伦敦

On the discovery of density fluctuation in Cellular Automata//写在发现元胞自动机密度涨落之际

这个想法是在2017年3月7日凌晨,在伦敦的一台HP_Z600上初步实现的。整个发现的过程还是挺戏剧性的。

背景:

在这之前的一个月里我在MATLAB上断断续续从转移矩阵(transfer matrix)开始编起,发现没啥卵结果,然后在一篇文献上重新看到了Derrida Plot,也就是离散版本的Lyapunov Exponent,然后心中暗骂“Derrida这死脑筋干嘛要取平均值啊?”,并且在这样的心情中编写了derrida_general.m架构出了一个面向对象的流程结构,并且用协方差作为一个伪距离函数替代了平均值,获得了更多的信息。 这个时候的算法还是给了我一点小惊喜的,这直接导致我花了一个星期浏览它生成的Profile图片,大概收集了500条左右的有趣CA规则。但是浏览久了发现不对劲啊,这到底是我在筛选CA还是我的程序在筛选CA啊擦。(当然这个问题从我开始写算法时就一直有,也就是说算法的敏感度不错,真阳性基本都能检测到,但是假阳性也一堆一堆的,只有靠人工筛除)。

思维跳跃如我,结合信息学最近上课学的多序列对齐(Multiple Sequence Alignment)猜想,能不能把CA的规则看成一条遗传信息,并且比较小的变异对其动力学性质的影响? 一方面也希望能把MSA的想法应用进来,给出一个隐马尔可夫Profile,将会是一个非常漂亮的结果。随机变异过程倒是比较容易写,一两天就写完了,难在控制Alignment的深度,因为有些CA规则对变异一点都不敏感,18个比特你变掉三个它都无所谓,导致生成了巨大的团状Alignment,这个必须用算法进行控制。另一方面对这个树状图进行操作也需要一些新的编程技巧,以达到比较好的并行计算优化。 同时还花了三天帮室友修他的外星人,在EFI引导上栽了个大跟头,不过好在最后总算修好了Windows/Linux双系统。修系统无聊时就在琢磨把树状图显示出来,因为节点和连边一多起来Matlab的可视化就变得很慢,最后用vis.js做出了“毛毛毛球”

然后我兴致冲冲地就去做随机测试了,结果……没卵用……仅仅发现了一些小的结论,比如B3/S23的18个比特里面有4个比特的变异是不太影响它的动力学的,其中两个的影响大一点(B7,S7的变异),另外两个的变异几乎不产生影响(B8,S8),我称之为a2b2型。有趣/糟糕的是,a2b2型简直满地都是,但是和B3/S23的动力学性质没有半毛钱关系,我只好太息而弃。

但是这里的另一个观察是,有一些强稳定的动力学可以经受7-8个比特的变异,给出~128左右的团簇。 我据此写了一个专门探测这些强稳规则的团簇边界,再找出混沌团簇的边界,以期在这两个团簇的交界处找到复杂的动力学性质,但是目前来看效果并不是特别好。

故事:

周一(03/06)早上正在改进团簇边界的算法,最后发现效果并不好,下午四点赶去上了一节动力系统的课程,结果老师貌似心情也不好一直在讲浅显/糟糕的废话,介绍了极限环理论,但是估计没有一个人听懂。他是学物理出身的,结果讲的时候一直在提系统论的概念,比如负反馈啊,延迟反馈啊,非线性啊,结果在座的这群生物狗估计一句都没听进去。。。然后老师提了个总结性问题:动力系统的极限环振荡解和谐振动的区别是?在座一片死机。 正解是:极限环震荡解的性质不依赖系统的初始状态,但是谐振子解的性质是虽初始状态而改变的,往深了讲是因为谐振子作为线性系统是保守的(Conservative),而极限环往往是耗散(Dissipative)系统的渐进解,这本来是鲁棒性的一个极好体现,结果他对着生物狗强调了半天内部的数学结构。。。但是吧,非线性和生物之间到底有啥关系,的确也很难说请,老师对Hill Function的介绍还是很到位的,虽然他没能解释Hill的非线性和系统的鲁棒性到底有啥关系。

上完了课肚子饿,不想回家,图书馆(Sci-Lib)浓浓的新生气息,编程没结果,死线就在周三,缺乏睡眠,你大概可以想像我到了一个多糟的境地。 为了防止把更多的时间浪费在方向不明的Coding上,我强迫自己在外面走走,恰巧ULU Student Hub 三楼在排练爵士乐,我就爬上去听了听,站在窗口看楼下过往的行人,放松放松:信号的本质是什么呢?伦敦的夜景我很少这样观察,远处WellcomeTrust的大楼闪烁着现代性,近处King’s Church沉默在黑暗里。第一次,我站在这个高度俯瞰天天走过的Malet Street。 不断地搜索记忆,我想找出一丝线索: DerridaPlot之所以有用,FamilyTree之所以能被建构,背后靠的都是相关性函数,更进一步,FamilyTree比较的是同样的初始条件在两条相似的规则下的结果,并合并大量样本取一个协方差,但这个过程中所有的比特位都没有区别了。联想之前实践的平均场近似,只把0/1密度提取出来作为参数,而不关心具体的排列方式,这样处理CA显然是不妥当的,而且根据我之前的实验,如果把CA不断重新随机混合,得到的结果是非常符合平均场给出的结果的,但是一旦我去掉随机混合这个过程,平均场给出的近似和CA本身的动力学就没有半毛钱关系,这说明CA的空间不均匀性是非常核心的东西。同样的,如果对二维Ising不断进行混合/重排,其能量显然也不是不变的。取极端例子,本来是随机白噪音,假设重排成了一堆0和一堆1,显然能量有很大改变,所以Ising模型也是对空间不均匀性很敏感的。

接下来就想怎么把CA的空间不均匀性抽象出来,于是想到了对同一个比特取一个延时摄影,并且取其平均为密度。本来这个操作的目的是移除闪光(Strobing)和高频闪烁的,但是很凑巧的是在真正Implement的过程中这个操作居然真的记录了空间不均性,也就是涨落。或者说,得到这个密度参数以后,只要观察这个密度在时间和空间上的统计行为,就能反映CA的动力学性质,而不取密度参直接用0/1(应该)是得不到这样的结果的,或者说会出一些别的问题。 当然这个算法也不完美,取0/1平均是有一定问题的,因为不同顺序相同密度的0/1序列蕴含的信息不一定相等,但是取0/1密度再做协方差的确是最简单最快的Implementation(相比共信息而言)。

先写道这里,写完作业再来补。

 

 

记录_论可测变换或动力系统与度量函数的耦合_暨微扰论的拓展_1

2017/02/14 L,叁,F

首先F抛出关于H1,H2和Derrida Plot的问题,询问在使用图论时原集合一般会内嵌在哪些度量空间(metric space)。

L:抛出了对图论联通性和拓扑联通性之间的区别。L指出联通图可以自然导出一个最短路径(通过广度优先搜索),从而定义一个有离散拓扑的度量空间,但是图之联通不能导出最短路径对应的离散拓扑之联通。原因在于,由于这个拓扑是离散拓扑,所以这个拓扑对应的图显然不连通(只要图中的元素大于等于两个),而且由于道路/路径联通蕴含连通性,所以图也就不道路联通了。

叁:单单给出一个集合(Set)并不能唯一地确定一个度量空间。额外地,我们需要赋予这个集合某些结构,比如说把它们按某种方法排成一排,计算距离就行了,但单单给出一个集合是不能确定度量空间的。

L:总之,图论中最完全的信息,由边和顶点共同提供,可以人为地给图定义一些度量空间,但是这个度量在使用时要当心(叁:估计刘大师的意思是,图里的metric(比如由连接两点的最少的边的数量决定)并不是一个真正的metric space里的metric)。或者说是在套用metric space的结论时,要小心图论和拓扑空间之间术语的区别。

叁:虽然我没有完全听懂,不过问题应该出在三角不等式 ,而不是连通性上吧?因为就算是真正的度量空间里面的开球也不一定是联通的。

L:嗯其实是个metric,主要是连通性不一致可能会出错。譬如图论中的道路和拓扑空间就有点不一样。

F:让我重新表述一下我的问题:
假设一个有限集合S 有一个测度  \mu(S) ,(L:为严谨,S的 \sigma代数是S的power set, \mu: \sigma(S) \rightarrow [0,1],而且 \mu满足并集相加),那么给定一个转移矩阵(Transition matrix ,也就是带强度的Edge matrix),令为 \pi 。那令 \mu_2=\pi * \mu_1,则 \pi是一个可测变换(这里的乘法定义是矩阵乘法)。根据马尔可夫链基本定理(THE FUNDAMENTAL THEOREM OF MARKOV CHAINS),如果 \pi的性质足够好,那么 \pi重复作用之后测度 \mu的是驻定的,但驻定这个条件还并不是最重要的。
现在有趣的是,S本身有一个内构的度量是汉明距离: H(S_a,S_b),(附:两条长度为n的有x个字符是不同的序列之间的汉明距离 H=\frac{x}{n},当然除以n 不是必要的,只是一步正规化)。现在如果 \pi对应一个有向图(directed graph),也就是说每个元素只能有一个下家,且定义这条边强度为1,那么给出 a_2=\pi(a_1),  b_2=\pi(b_2),现在我们考察 H(a_1,b_1), H(a_2,b_2)之间的关系 (简称  H_1,H_2)。
联系微扰理论(perturbation theory),讨论同一个微分方程 \frac{dx}{dt} = f(x),从x0开始会给出一条轨迹x(t),从x0+e会给出另一条轨迹x’(t),通过考察 \frac{d(|x' - x|)}{dt} =g(|x' -x|)可以得出系统的复杂度/渐进稳定性(这里g可以从f和x0导出)。注意到我们使用了一个度量|x’-x|,在微分动力系统中这个度量常常是L2-norm,也就是欧几里得距离,也就是说,我们考察的是L2度量在微分动力系统下的行为,以理解该动力系统的混沌性。相应的,在前一个例子中,我们考察的是汉明度量在可测变换下的行为,理论上这可以体现出该可测变换的混沌性。但是需要注意的是,经典微扰理论关心的是|x’-x|极小时的行为,离散扰动理论却被迫关心H1和H2之间的统计联系,因为对H1取极小并不是一个极为自然的选择。

重整化,基态, 黑帆

-Don’t deem a paper incorrect just because you don’t understand it.

-讨论了《黑帆》里的一些寓意

-讨论了DMRG(密度矩阵重整化群)作为“以小见大”的一个手法的一些特征。

最近的娱乐活动主要是在看黑帆(Black Sails)这部剧,亚马逊Prime上有免费看所以追的很勤快。对比权利的游戏和西部世界,黑帆的叙事更加古典,加之海盗的叙事线对我比较新颖,所以看得异常入迷。这部剧的好处在于张力极强,在一个极小的格局中浓缩进了高强度的冲突。与权利的游戏随意杀主角形成对比的是,黑帆的人物有明显的层级性,随之赋予了一定的英雄主义情节。但这不妨碍它呈现人性的冲突——是取岛屿的整体大义,还是取报仇的一己之快?是领导船员走一条风险大的道路,还是做一些稳稳当当但是不会亏本的买卖?当船员与船长的目标相脱节,矛盾冲突又将如何调和?短线和长线相互博弈,期望和务实前后矛盾。黑帆给我们展现是一个赤裸裸的罗生门,在这里所有人都自以为掌控着命运,最终又陷入冲突而失去一切反抗的资源。

这些道理被巧妙地隐藏在黑帆的叙事里:第一季Flint船长在追击Andromache时与Billy进行的讨论尤其精要:我们以为猎物是在北边的,所以我们朝着北边前进以期猎杀,但是猎物的选择我们是不知道的,它甚至可能调转航向以其与我们错身而过;它甚至也可能不在北边,到时候我们将面对一片空荡荡的海面。(大意)当然最后这些更差的情况都没有发生,而Andromache确实走了最普通的一个选择。但Flint作为船长,其远见和策划的能力都是远高于当时的Billy的,但这个能力也需要有船员来执行,否则再多的推断也无法保证Flint自己的生存。换句话说,仓禀足而知礼节,但知礼节本身不能解决吃饭问题,随时面临挨饿的危险。但知礼节者之所以不再陷入挨饿的困境,是因为他能够调控饿肚子人的行为来解决自己的吃饭问题,而一旦饿肚子的人顿悟了礼节的重要性,那么两者必然陷入权利的争夺。

(Pictures from “Black Sails”)

道理说起来都是简单的,家家却都有本难念的经。冲突来自于各个琐碎的方面而不遵从任一统一的名字。每个人会基于自己的背景作出自己的判断,却又被迫与他人协调以取得成果。没有任何判断是准确且必然的,人们所能控制的仅仅是尽量减少前后矛盾的判断。然而,每个人对待矛盾的态度又是由其背景决定的。

剧中还用到了一些有意思的叙事手法。在Flint还在海军服役的时候,有一件意外极大地影响了他的前程:Nassau的执政官被当地民众颠覆了,导致Flint和Hamilton赦免Nassau的计划彻底泡汤。然而,当Flint自己执掌海盗的时候,他与执政者的关系也是糟糕得丝毫不容赦免的可能。这个循环的叙事导致Flint既是颠覆的实施者(之后)又是颠覆的受难者(之前)。滴水不漏的叙事硬生生地刻画出了生存的艰难,文明的艰难。赦免的初衷是好的,但却失去了支配的力量。文明的初衷是好的,但代价是拱手让出那些更现实的利益,并承担更大的风险,而这风险只有通过必要的恶才能解除。

学术方面在接触作为一种数值模拟方法的DMRG,糟糕的是几乎所有的文献都是用bra-ket和线性代数写就的,对于只会用偏微分处理热力学模型的我是一个比较大的挑战。DMRG的最大应用在于寻找系统在大尺度上的一个基态,而且其效果和蒙特卡洛有得一拼。这应该是我第一次实战接触统计物理了,希望在解决这个问题后能够把微观->宏观的这套哲学运用到其他的问题上。

简要介绍一下DMRG,多体系统可以用一个波函数(即一个联合概率分布)来描述,概率最大的那个波函数即是系统的基态。但是与其NRG直接寻找子系统的基态不同的是,DMRG寻找 子系统+少量微观元素 的联合系统的一个基态,再将原来的子系统投射到这个基态中占主导的那些子系统波函数组分上。具体的算法还在钻研,希望能够尽快重复出Nishino_1995做出的2D伊辛的结果。

dmrg_nishino1995.png

(摘自Nishino 1995, DMRG method for 2D classical Models)

这个由小见大的过程真的是很有意思。还需要注意的是,在相变临界点附近,DMRG的精度会下降很多,因为这个时候很难找到占“主导”的子系统波函数,也就是说,几乎所有波函数都是可能的。或许可以通过某些数学来解出这种本征值均等的状况何时出现,以期严格解出相变点,但是这要等到彻底理解算法以后了。

一些别的碎碎念:两个蛋白质结合,是否意味着他们降落到一个基态上了呢?那么在结合之前,他们岂不是在亚稳态?如何用DMRG处理生物中明显的层级特征呢?蛋白质相互作用能不能用算符来建模呢?更确切地说,如何建模才能收集不同层次的信息?在缺乏对称性的情况下,如何改良原来的方法呢?

路漫漫其修远兮,但这不成为停下脚步的理由。

2017/02/08
瓶子

PS: 有一个跟生物研究相关的小游戏Phylo,觉得好玩的可以在楼下讨论。

 

轨迹,签证,熵

想来我需要写一点成块的文章,光罗列点可不行,这样取出的永远是语义*的(semantic)碎片。

人的生命大概可以用轨迹(trajectory)来很好地描述,轨迹是经典物理的经典概念,考虑一个决定性的经典粒子,其轨迹可以完全被上一时刻的条件所预测。建模与预测,这是物理学的发源之地(天文学以预测为基石)。(另,量子力学对薛定谔方程的解释方法不能完全满足定域性,决定性,因果性。也就是说,不存在一个定域的,决定性的,因果的理论能介绍薛定谔方程(但是薛定谔方程不可能是“错”的)。)

讲讲今天签证的事儿吧,周五晚上本想打印一份学生证明,跑到办公室时却刚好到下班时间,有两位顾客走出门外我却忘记鼓起勇气冲进去麻烦工作人员。当他把门锁上时我知道已经晚了。签证的问题其实还不在这,等我认认真真准备了材料,跑到法签中心排完队,刚开始过第一关,前台就告诉我,由于两次入境国家不一样,且第一入境国不是法国,法签不能受理我的申请。她告诉我两个补救措施:1.去意大利领馆申请 2.把行程改成连续的 被吓懵的我选择了第二条路,跑到网咖里做了个伪(Pseudo)行程,花掉了25EUR+22EUR+(70EUR,可能还可以退)。还好网咖不远,环境也好,老板也有风度,倒让我有一种写论文的冲动(对比法签中心,简直人山人海,纸醉金迷,胆战心惊,人云亦云,气氛实在不对)。

说到底,申根签的审核就是个笑话,根据木桶原理,最短的那根板是限制因素(limiting process):最松的申根国家就贡献了最大的流量。申根的怪圈就在于,其他国家越严,签证过程价值就越高,于是木桶的短板就漏过更多的漏网之鱼。边境管制是一句空话,申根牺牲了安全性换取了流动性。但我最想吐槽的是,我想要老老实实申报真实行程,却遭到简简单单一句“不予受理”,最后虚报行程,反而顺风顺水。这使得我严重怀疑申根签证的逻辑——事实上,这种官僚体制会逼迫人们说假话,做假事。我今天突然理解了小时候经常看到的“办证”广告,那是因为在官僚体制的逻辑下,价值可以独立于真相存在——“我不在乎这句话是对是错,我只在乎这句话是谁说的。”

最近人好像变得越来越犹豫,一方面觉得自信的生活不应该游移,一方面为了最大化回报的期望又苦苦思索最优解。正如神经网络的Explore-Exploit难题,一方面需要最小化消耗函数,一方面又要考虑时间本身的价值,真是难上加难。其实回到轨迹的类比上来,哪会有什么最优解(尽管这回导致我会被学过优化的人们喷死)。隐性地说,人的决策是不可能找到一个最优解的,因为计算最优解的过程常常是一个停机程序/不可计算程序。身处动态的世界里,哪有什么不变的测度(尽管不变性是物理的一个基本直觉)。如果想要走到那条最为宽阔的坦途上(回报率最高),就必然要抛弃大量的计算资源,因而造成时间的流逝,然而时间一旦流逝,坦途的宽度就又得重新计算了,如此往复,好似会走上流数/微积分的思路,但我仍然不认为这个迭代操作会给出一个最优化的解。或者也可以这样说,最优解轨迹往往伴随着熵的降低,从玻尔兹曼热动力学的角度来讲,是极小概率的事件;若想要按照最优解行进,就必然需要耦合一个熵增/放热过程,以符合热力学第二定律的约束。所以反过来推,就像测不准定律一样,人对自己的轨迹只能施加有限的约束,而不能保证绝对的服从,这和熵增定律是类似的。

当然也会有一些奇妙的情况,也就是不能用热力学第二定律理解的情况——复杂性的涌现。或者说,尽管在微观上人不可能完全约束自己的轨迹,整个世界的宏观轨迹却反而诡异的紧——约束并没有显得更少,或者说,大系统并不显现出缺乏约束的特质,而是反而显现出能被很好预测的轨迹,也就是说,一群被热二限制住的不能走最优轨迹的粒子,反而组成了一个总是走最优轨迹的系统。这种诡异的涌现特质,使得整个世界根本不可能陷入热寂。当然我们可以强调这个大系统以摄取能量/排出熵的代价降低了自己的熵(普利高津的结论),但这走的是隔离法的路线了(也是热学的经典直觉),但是我更想考虑这个熵的减少是不是耦合在了从微观映射到宏观这个过程本身,也就是说,是不是尺度的变化本身导致了熵的显变化?

最后让我们讨论一下隐性的(Implicit)含义,譬如我现在要写这篇文章,我会假设一个隐性的语境(比如中文就是一个隐性假设),在许许多多个隐性假设下,我才能够有效地传达一些信息。如果抛弃各个隐性假设,那么文章将变得不可接受的冗长,于是反推可得,隐性假设起到的是压缩信息的作用,这些被压缩的信息于是可以获得更快的传播速度,但同时也不再通用(Universal)。比如说一篇科研论文就会假设读者拥有相当多的储备知识,再比如政治喜剧会假设听众有一定的政治常识,再比如一篇假文凭/假行程会假设采信机构……是个傻逼。显然,假行程不是通用的,但是在官僚体制这个隐性假设下,它很有效地传达了递签者迫切的求签心态和端正的求签态度。“见人说人话,见鬼说鬼话”也是一个道理,采用恰当的隐性假设,就能最大化信息的传输效率。

12/12/2016
圣瓶

*: 一些语义性陈述(Semantic Statements):

1.医生的无能令病人恼怒。

2. 回忆(Reflection)令人笑。

3. 梦是快乐的。

4.新西兰和机器人是遥远的过去。

5.过去是美的。

6.现在是混乱的。

7.回头是不可能的。

8. 少年是低熵的。

9. 纯洁是困难的。

10. 理想是碎的。

11. 理想是需要拼死拼活拼起来的。

12. 君子需要慎独。

13. 电脑不能过量。

14. 君子+电脑游戏=病毒

15. 数学是深奥的。

16. 数学是简单的。

17. 实验是主观的。

18. 模拟是耗脑的。

19. 胜利是不存在的。

20. 故事是需要整理的。

21. 人际鸿沟是深的。

22. 低级趣味不是低级的。