《数学之美》

咋一看这书的名字,都会以为是一本数学书,但其实跟数学关系不算很大。作者吴军,清华毕业,去美国读博,研究语音识别,自然语言处理。毕业后在Google做搜索,现在在腾讯。这书《数学之美》,主要是作者在Google黑板报上连载的系列博客整理合集。不到300页的书分了29章,内容比较广,有涉及一定的数学知识,不过没有深入讲,大部分是科普性质,点到为止。

书本开头介绍了语言处理的发展历史。在上世纪70年代以前,所有科学家考虑机器处理自然语言问题时,都是按照人的思维模式,希望通过语法规则去分析语言样本,然后解析出各种要素。这样的处理方法计算量非常大,并且规则复杂多变,所以70年代以前自然语言处理没什么进步。而后统计语言学的出现使得自然语言处理快速发展,直到现今为止,基于统计的文本处理,语音识别,已经非常准确了。介绍了语言处理的发展历史后,科普了一下统计语言模型和隐含马可夫模型,还有语言处理相关的一些算法和数学知识。

接着书本开始讲搜索引擎,先介绍了搜索引擎的粗略模型。其实搜索引擎就是写一个网络爬虫,不停的从网上扒数据下来,然后在这些海量的数据里找出用户想要搜索的东西给用户。这个过程中会用到的许多算法和数学知识,书中也简单的介绍了。例如网络爬虫编,信息的特征向量(怎么知道两篇报道都是讲体育新闻的),网页排名以及对应的作弊反作弊等等。

最后书本中还介绍了一些其他相关或不相关的知识,包括密码学算法,布隆过滤器,贝叶斯网络,维比特算法,云计算等。还介绍了几位大神(贾里尼克、辛格、马库斯)的事迹以及学术贡献。

除了数学、算法以外,在作者的字里行间,传达了两个思想我觉得很有价值。一个是大道至简,一个是以道御术。大道至简讲的是作者在语言处理以及搜索引擎上面工作多年,发现好的算法、数学模型,都应该是简单的,而不是复杂的。这个理念同样被乔布斯在工艺设计,美学上极力推崇(Simple is Beautiful)。至于以道御术,术指的是做事情的具体方法,道指的是做人做事的道义道理。无论是做技术,做事,还是工作生活,都有“术”与“道”之分,我们要善于以道御术。这一点的确值得我们多多思量。

总的来说,《数学之美》这本书以点盖面的介绍了很多语言处理与搜索引擎相关的算法和数学知识,尽管有些看不懂,很多仅仅是一带而过,但让我们这些外门汉对这些领域有了一定的了解,增长了见识,还是很有意义的。

《中国近代史》

五月份从香港带回来的套书,徐中约写的。分上下两册,内容涵括从清朝到21世纪初期中国的历史。关于书的内容不打算在这里讲了,读后感也不能在这里讲,只能推荐大家自己去看。不过大陆出版的这书从本来的四十二章,删得只剩下二十九章,所以大家如果想真切了解近代史的话,还是建议找原版(英文的)或香港出版的(中文的)完整版来看。好了,能说的只有这么多了,再写等下要被查水表了。

噢,最后说一下,香港的书都好贵呀,上下两册加起来要300港币。相比之下大陆的书算很便宜了,我们还是很“幸福”的。

《北方的空地》

一个人,推着自行车,没有任何后援,驮着100公斤粮食行李,独自一人77天穿越大羌塘无人区。作者杨柳松用惊为天人的举动震惊了世界,而又用平凡简朴的语言为我们带来他的故事,这就是《北方的空地》

qiangtang_

作者在独自穿越的过程中,遇到很多的困难,装备接连损坏,沼泽地的吞噬,狂风的肆虐,狼、灰熊等动物的跟随、饥饿的侵蚀等等。还有几次九死一生的遭遇:河流改道被围困三天后推车强行突破重围、断水5天口腔都黏在一起,已经录好遗言后天降瑞雪绝处逢生、炉嘴堵塞修理无果却最后被燃气炸通、最后断粮三天身体透支还在往错误道路上行走时遇到矿区外派的采购车而获救。这些情况无论哪一个让作者从头来一遍估计都要把小命交代在羌塘了,但作者就是走出来了。之前了解过无氧登山,徒手攀岩等,见过玩极限运动的,但真没见过这么玩的。

Continue reading

记大学读过的一点书

        从大二下学期开始,对编程的认识不再止步于ACM比赛写的控制台程序,开始接触更多的知识,之后读过一些相关的书,在大学回忆录里有总结过,现在看来还是挺有意义的,贴到这里作为一个读书的分享。以下文字节选自自己2012年6月写的大学回忆录。
————————————————————————————————————————————————

《什么是数学》

“数学不是别的东西,而只是从定义和公里推导出来的一组结论,而这些定义和命题除了必须不矛盾外,可以由数学家根据他们的意志随意创造”。我相信很多人(包括曾经的我)都会有这种想法。觉得数学到了一定程度以后,离平常的生活,甚至离具体的事物太远了,远到我们基本都认为他是虚无的,是特定人群的特定玩意。但其实这是一种错误的理解。

Continue reading