/blog/posts/0044_review-snakemake/

[program,review] Why not snakemake?

Motivation: “Why not snakemake?”

My feeling for snakemake underwent a complex journey as my skills and thoughts grow. From a hobbyist view, I totally hate it for several reasons:

Poor portability/conda-dependent

you cannot execute *.smk scripts with the commonly found python intepreter. This problem is similar to that of scons, whose script SConscript requires scons to execute, which requires scons for its execution.

/blog/posts/0043_arduino-tty/

[program,arduino] Error: Permission denied: /dev/ttyACM0

Motivation Error: Permission denied: /dev/ttyACM0

/data/bin/arduino-cli compile --fqbn esp8266:esp8266:generic --port /dev/ttyACM0 --upload

When uploading to arduino, this is a common error for starters. To fix the permission, it’s best NOT to chmod or chown because the port could change to /dev/ttyACM0 or /dev/ttyUSB0 and you will have to chmod every time you have a permission problem, which looks silly.

You should reproduce the problem via:

touch /dev/ttyACM0
# touch: cannot touch '/dev/ttyUSB0': Permission denied
/blog/posts/0041_linux-input-method/

[program]ubuntu下重新配置fcitx中文输入法

起因

因为sogoupinyin+fcitx占用了1.00cpu load。风扇很吵。

经过

检索了开源输入法替代品的软件,并在已经安装了sogou-qimpanel的情况下安装了fcitx-sunpinyin以及其他, 结果不能很好地打字了,重装了半天fcitx最后通过rm -rf $HOME/.config/fcitx/解决了如下报错

/blog/posts/0039_python-intro/

[program]Feng's Introduction to Python For Beginners

Overview

Learning a language can always be broadly split into 4 parts, including two concepts and two procedures, that is

Grammar
Vocabulary
Reading
Writing

I will try to cover a simplest path to learn Python language in this post.

/blog/posts/0035_the-blog-renovation/

[风子思传]修博客记

二零二零年, 夏将炎, 疫将休, 余于轩中做得一二项目,有感. 然博客之废已久, 无以为记. 余闻异域有一静态建站新术,曰雨果1,以构兰格2写成, 遂阅其经试使之.

/blog/posts/0034_whatislife/

[whatis] life

What is life?

Is life about learning: No. Learning could be painful or rewarding. But life isnt about learning

/blog/posts/0032_period/

Recent updates

Renovating my blogs with github.com/gohugoio/hugo: Not as easy as anticipated

  • newflaw.com/blog has been broken since I moved the website under a reverse-proxy. BTW reverse-proxy is great fun!
  • Using a new tool is never too easy, because of the Babylon tower: people just don’t write documentation in the way you want to query it!
  • Stumbled on getting {{ .Site.BaseURL }} to work on image source but it just never render in content/posts/00foo.md!. Found out you need to use it in layout-template or layout-shortcode.
/blog/projects/0004_spiper/

github.com/shouldsee/spiper

  • spiper: An experimental pipeline tool, with singularity integration
  • Inspired luck.shell and luck.rule_stamp
/blog/posts/0026_frontend/

learning javascript by site construction

  • Selecting the right package for the right purpose, read the best documentation, with the best speed.
    • chart.js / d3.js
    • handsontable.js
  • XMLHttpRequest for making a request. Be careful with CORS restriction
/blog/posts/0024_manifold-learning/

流型学习还是流行学习?

tsne由于有谷歌的支持一路吃香喝辣地入侵了单细胞RNA测序领域scRNA-Seq, 造成的后果呢就是Nividia开心地卖显卡,Illumina开心地卖测序耗材,微流体开心地卖耗材 tSNE作为流型学习的一种算法实际上在单核系统上运行的速度是很让人望而却步的. 比较快的非线性替代品有 isomap 和 umap, 两者都是 基于用k近邻对测地线长度的估算. 线性替代品自然是古老的pca了,但是pca的线性假设实在是跟不上时代了.

/blog/posts/0022_windcity-scums/

风城纪事·渣渣

“我到底是不是一个渣渣?”

简单的交集操作:“我 & 你”

/blog/posts/0021_doremido/

DoReMiDo // 哆来咪哆

Probably the first proper song I made so far.

Please suggest a name by commenting if you are inspired! XD

/blog/posts/0019_first-touch-on-mysql/

How to fail your deadline? - Starting learning MySQL thinking you can master it in one day! // 想超时完成任务?来学MySQL就好!

First published here.

Recently, I touched upon MySQL because I wanted it to be the backend for my incoming Django-based data browser. After 4 days of prolonged fiddling I finally manage to make some notes of its functionality. It is very fast, but equally importantly, very different from Python! The other lesson is that one should allocate enough time for learning when starting a new language (depending on single linkage distance)

Today’s blog will go through:

  1. Loading a table into MySQL, be it fixed-width or regularly delimited.
  2. Create relations between entries.
  3. How to deal with errors, and fix your relationship:
/blog/posts/0018_windcity-dark/

风城纪事·暗黑

(全文虚构,名词与现实并不完全对应)

我和母亲在法国旅游,有两个火车站,它们互相之间遥相互应,但是又有一条复古的轨道连接其中,大约是为了运输换乘的旅客。我们旅游到此地,寻思着要不要去另一个火车站赶去下一个景点的火车。

“呜~~~~~”,换乘列车拖着长长的气笛声开动了。心中传来了阵阵失落————这班车恐怕是赶不上了!我和母亲商量:另一个车站看起来并不是很远,我们应该可以步行过去。奇怪的是,换乘列车好像和行人共用一个隧道,

/blog/posts/0016_windcity-replacement/

风城纪事·取代

多少次我们以为自己的世界是唯一的,多少次我们领悟到他人的世界却可以和我们的一样丰满。可是这些之于我们又有多大的意义?

我们怕不怕自己被取代?猫做老虎的老师时,留了一手没教他上树。这个寓言极形象地刻画了对于被取代的恐惧。“彼可取而代之!”不可取代性,看来是建构身份的一条途径。联想物理中的对易性,在很多的操作下,一个特定元素的某些性质是无关紧要的,但是在另一些操作下,该元素的某些状态会影响操作的结果。例子包括手性等。又比如说取平方这个操作,其结果是不取决于输入的正负号的,也就是说,正号负号可以相互被取代。

/blog/posts/0001_traj-visa-entropy/

轨迹,签证,熵

想来我需要写一点成块的文章,光罗列点可不行,这样取出的永远是语义1的(semantic)碎片。

人的生命大概可以用轨迹(trajectory)来很好地描述,轨迹是经典物理的经典概念,考虑一个决定性的经典粒子,其轨迹可以完全被上一时刻的条件所预测。建模与预测,这是物理学的发源之地(天文学以预测为基石)。(另,量子力学对薛定谔方程的解释方法不能完全满足定域性,决定性,因果性。也就是说,不存在一个定域的,决定性的,因果的理论能介绍薛定谔方程(但是薛定谔方程不可能是“错”的)。)

/blog/posts/0014_windcity-prejudice/

风城纪事·偏见

“便使我千刀万剐,永劫不复,又有谁会在意呢?”我猜这句话应该符合一个抑郁患者的语气。

中心化的下一阶段,是与他者共同构成一个更大的中心,其核心前提在于相互的评价和影响。这种评价,即是这里所谓的“偏见”。最简单的偏见,当然是主体对主体自身的偏见。前述的弥赛亚态,就可以认为是一种自指的偏见。

/blog/posts/0013_windcity-suddenrain/

风城纪事·骤雨

刚坐下来,黑压压的云就下起了毫无情面的大雨。还好我出门前备了雨披,不然可真是“问君能有几多愁”了。我在伦敦大学学院(UCL)图书馆的会员还有七天就要到期了,要归还的书还真是不少,不过如若明年仍在这里读书,那么这次离别也就没那么真诚。

/blog/posts/0012_windcity-center/

风城纪事·中心

我常常迷惑, 偏见和思想的区别到底在哪里呢? 如王小波所言:

那一天我二十一岁,在我一生的黄金时代,我有好多奢望。我想爱,想吃,还想在一瞬间变成天上半明半暗的云。……我觉得自己会永远生猛下去,什么也锤不了我。”(《黄金时代》)

这种唯我独尊的,弥赛亚式的自觉,大家大概都熟悉。在这种精神状态下,人是不会质疑自己的判断和选择的,让我们暂且称这种状态为“弥赛亚”态。与之比较流行的相关概念,大概是“中二”症侯,不过“中二”的贬义和偏见太强,就不直接拿来了。但是弥赛亚和中二的共同之处,就是自我的中心化(Centralisation)。这种中心化,不必是糟糕的,甚至可能是人极为基本的一种性质。

/blog/projects/0011_calc-temp-release/

github.com/shouldsee/calc_temp [Deprecated]

  • https://github.com/shouldsee/calc_temp
  • calc_Temp: A pragmatic algorithm to classify 2D-NTCA // Calc_Temp:一个实用性的2D-NTCA 分类器
  • I recently integrated my understanding of spatial fluctuation to produce a automatic classifier for 2D non-totalistic cellular automata. It’s now available as a git repository. I am seeking to implement it on a web server in the near future.

github repo

An example of output is shown here(link broken)

/blog/posts/0010_a-simple-method-to-classify-ca/

A simple method to classify CA // 一个简单的CA分类方法

  • Recall a CA rule $rule$ project a circular-boundary state space $S$ back to it self, that is
  • $rule: S\rightarrow$
  • aka $x_{t+1}=rule(x_t), x_t \in S, x_{t+1} \in S $
/blog/posts/0009_what-is-information-in-biology/

What is Information in biology? // 生物中的信息是什么

写这篇文章的起因是:失眠,想了太多。主要在想密度涨落如何能够应用到实际生物研究中

动机

  • 能不能对CA建构一个自指,或者说,能不能建造出一个能够改变自身规则的CA? CA规则的一个有趣之处就在于,两个东西之间的互动是完全由这两个东西自身决定的。也就是说,它们的互动不需要借助一个更加基础的规则(Fundmental Law,典型的还原论),而仅仅取决于这两个东西自身的性质。往宽了讲,两个蛋白质的相互作用,也不应该取决于其结构内部的细节,而应该取决于这两个蛋白质本身所蕴含的信息。
  • 基于我目前的实验,我想做一个比较宽泛的陈述:信息存在于时空的涨落/不均匀性。这个命题还可以换种方式陈述:一个完全均匀的时空是不包任何含信息的。 虽然说科学界公认的遗传物质是DNA,但是很难说这个论点对我们解释生命起到了多大帮助。相反的,越来越多的非DNA调控方式正在被发现,以至于到了需要修改中心法则的时候。
/blog/posts/0008_on-the-discovery-of-density-fluctuation-in-cellular-automata/

On the discovery of density fluctuation in Cellular Automata//写在发现元胞自动机密度涨落之际

这个想法是在2017年3月7日凌晨,在伦敦的一台HP_Z600上初步实现的。整个发现的过程还是挺戏剧性的。

背景

在这之前的一个月里我在MATLAB上断断续续从转移矩阵(transfer matrix)开始编起,发现没啥卵结果, 然后在一篇文献上重新看到了Derrida Plot,也就是离散版本的Lyapunov Exponent,然后心中暗骂 “Derrida这死脑筋干嘛要取平均值啊?",并且在这样的心情中编写了derrida_general.m架构出了一个 面向对象的流程结构,并且用协方差作为一个伪距离函数替代了平均值,获得了更多的信息。 这个时候的算 法还是给了我一点小惊喜的,这直接导致我花了一个星期浏览它生成的Profile图片,大概收集了500条左 右的有趣CA规则。但是浏览久了发现不对劲啊,这到底是我在筛选CA还是我的程序在筛选CA啊擦。(当然这 个问题从我开始写算法时就一直有,也就是说算法的敏感度不错,真阳性基本都能检测到,但是假阳性也一堆 一堆的,只有靠人工筛除)。

/blog/posts/0007_comment-board/

comment-board

  1. shouldsee,feng.geng.14"AT"ucl.ac.uk : wordpress revived after a ton of tinkering.

  2. shouldsee,feng.geng.14"AT"ucl.ac.uk : What works for biologists, may not work for computer scientists.

  3. shouldsee,feng.geng.14"AT"ucl.ac.uk : In reply to Bullet51. BTW, I don’t seems to get email on this blog. Maybe github is a better place to talk if you can reach it. (https://github.com/MathAndAlgo/DiscussionBoard/issues).

/blog/posts/0006_two-definitions-of-zero-one-entropy/

两种0/1序列的熵

两种定义方法

  1. 考虑 s=[0,1]^d  如果d位里有a位为1,则考虑p=a/d  H(S)=p*log(p)+(1-p)log(p).
  2. 考虑同样的s, 令 x=a/d, p=p(x), H(S)=sum(p*log(p), for all s).
  3. 受了张江老师的“两种熵”启发

毛毛毛球

fibre

/blog/posts/0005_applied-classification-of-symbolic-dynamics-with-recurrence-plot/

应用_用回归图对符号动力学进行半系统的分类_论可测变换或动力系统与度量函数的耦合暨微扰论的拓展

以相关性(correlation)为度量的回归图忠实地反映了基础元胞自动机(ECA)的动力学性质,可以很好地区分稳态和混沌态。

我对Logistic Mapping做了简单的耦合推广,并应用回归图找到了处在混沌边界的参数,有趣的是这种推广系统也处在混沌边界。

/blog/posts/0004_on-the-coupling-between-a-measurable-transformation-or-dynamical-system-and-measure-function/

记录_论可测变换或动力系统与度量函数的耦合_暨微扰论的拓展_1

2017/02/14 L,叁,F

首先F抛出关于H1,H2和Derrida Plot的问题,询问在使用图论时原集合一般会内嵌在哪些度量空间(metric space)。

L:抛出了对图论联通性和拓扑联通性之间的区别。L指出联通图可以自然导出一个最短路径(通过广度优先搜索),从而定义一个有离散拓扑的度量空间,但是图之联通不能导出最短路径对应的离散拓扑之联通。原因在于,由于这个拓扑是离散拓扑,所以这个拓扑对应的图显然不连通(只要图中的元素大于等于两个),而且由于道路/路径联通蕴含连通性,所以图也就不道路联通了。

叁:单单给出一个集合(Set)并不能唯一地确定一个度量空间。额外地,我们需要赋予这个集合某些结构,比如说把它们按某种方法排成一排,计算距离就行了,但单单给出一个集合是不能确定度量空间的。

/blog/posts/0003_renorm-base-black-sails/

重整化,基态, 黑帆

  • Don’t deem a paper incorrect just because you don’t understand it.
  • 讨论了《黑帆》里的一些寓意
  • 讨论了DMRG(密度矩阵重整化群)作为“以小见大”的一个手法的一些特征。
/blog/pages/0001_about/

About Me

Overview

I am a computational biologist interested in applying machine learning to functional genomics datasets. Using Python2 as my primary language, I developed a expectation-maximisation program to auto-classify genes into synergistic groups.

I am also broadly interested in structural biology and molecular dynamics, including:

  • cellular automata
  • renormalisation / coarse-graining
  • inverse-ising problem

On days outside coding, I spend my time playing music and building electronic devices. My favourite creation so far is a dispersive spectrometer.

/blog/posts/0037_driving-notes/

交通标志有八种 画出 有人看守铁道 无人看守铁道 注意横风 潮汐车道 保持车距 分离式道路 禁止通行 禁止驶入 轴重和总质量 路口优先通行 国道省道县道乡道 线性诱导标???- youce 反向弯路 连续弯路 注意潮汐车道 路面不平 路面高突 减速丘 警告,禁令+指示, 指路, 旅游区+作业区, 告示,辅助
/blog/posts/0040_wechat-search-engine/

The new era of internet is featured with the usage of mobile devices such as mobile phones, tablets and mobile apps. The usage of apps, importantly, makes it possible for app-providers to tailor the interaction between user and the app. Interestingly, this
/blog/posts/0042_beginner-tutorials/

https://github.com/fengyuhetao/shell shell和regex正则入门 Fun why is this in JS?? https://github.com/yemount/pose-animator
/blog/posts/misc/

2020-07-16T05:51:50Z PS: DDR3L和DDR4插槽不一样,内存的兼容性与主板芯片组有关,H61最大支持8G的DDR3。内存这玩意相比CPU好像没有太多的溢价空间。 关注搜狗输入法,互联网公司和搜索引擎生态
/blog/posts/notes/

痛苦发生在,你赖以保存回忆的服务器,有一天被工作人员扫进了垃圾桶。 ANSYS install: https://www.cnblogs.com/lscax/p/6105062.html [20200715,linux] to download from baidu yun yun pan jing ling: https://www.yunpanjingling.com/resources/5c1318194b3f4126a328ac33 iScript github ToDo: timeline for stm32-led vim or emacs? https://zh.wikipedia.org/wiki/%E7%BC%96%E8%BE%91%E5%99%A8%E4%B9%8B%E6%88%98 golang packaging and installation Links Input Method: https://www.cnblogs.com/lvkun/archive/2012/12/27/open-source-input-method.html RPI-init: https://desertbot.io/blog/ssh-into-pi-zero-over-usb rpi-list: https://www.makeuseof.com/tag/lightweight-operating-systems-raspberry-pi/ linux-list: https://www.makeuseof.com/tag/6-lightweight-linux-distributions-give-pc-lease-life/ lisp: http://www.gigamonkeys.com/book/practical-a-simple-database.html rpi-gpio: rpi-dma: https://iosoft.blog/2020/05/25/raspberry-pi-dma-programming/ rpi-bcm2835: https://www.raspberrypi.org/app/uploads/2012/02/BCM2835-ARM-Peripherals.pdf void *mmap(void *addr, size_t length, int prot, int flags, int fd, off_t offset); int munmap(void *addr, size_t length); 0041_externals.