机器学习和生物信息学实验室联盟

标题: 硕士期间看的书籍<一> [打印本页]

作者: zsm    时间: 2017-5-9 21:12
标题: 硕士期间看的书籍<一>

硕士期间看的书籍


1:浪潮之巅
2:数学之美
3:统计学习
4:从一到无穷大
5:上帝掷骰子么
6:梦的解析
7:数据挖掘
8:Java设计模式
9:人类简史
10:未来简史



浪潮之巅

       作者吴军,原腾讯副总裁。吴军博士是当前Google中日韩文搜索算法的主要设计者。
       当我们走上IT的道路之时,就是我们成为IT浪潮中成员之时。我们每一个人都将见证浪潮的来临和褪去,有些幸运的人走上了浪潮之巅,傲视群雄。但是大多数从业者都只会是见证者之一。
浪潮之巅可以说是以IT行业为背景的历史书。其讲述了各个时代的IT巨子如何走上兴盛,又是如何在时间的长流里被迭代更新,其速度之快,惨烈程度都让人咋舌。本书分章节讲述了不同IT巨子们的兴衰史:AT&T、Intel、惠普、摩托罗拉、思科到微软、苹果、雅虎、google、Facebook等等。作者也提出了一个企业之所以能够开花结果可能跟时代的发展有关,但是一个企业能不能涓流不息就跟一个企业的内在基因有关了。
       个人认为,当我们进入这个领域的时候我们就应该了解属于我们自己的历史。以史为鉴,可以知兴替。这本书给我带来了对这个行业深刻的了解。无论是做企业做人做事情,我相信除了要有坚定的信念和不可磨灭的意志之外还要学会融汇变通顺应潮流和时代的变迁。弯弯河流才可源远流长,曲曲小路方可通往远方。


       数学之美


       作者依然是吴军老师。没有什么比一个公式更美了。数学之美,美在其公式形式,仿佛一切都是设计好的一样。E=mc2,多么简单的公式却讲述了能量和质量的关系。牛顿的动力学公式,普朗克的量子力学公式等等都充斥着简单的美。
读完这本书,我仿佛知道了这个宇宙的秘密。它就在我们身边最不起眼的地方等着被我们发现。任何的一切都是源头的演变。任何的源头又怎么会太过于复杂呢?
      你觉得为什么计算机能够识别自然语言,是因为它智能到可以理解我们复杂的语法语义规则吗?
为了让计算机高效的处理我们的自然语言,科学家们走了几十年的弯路,就是因为科学家们一直在尝试让计算机理解我们的语法规则,一开始通过一些语法规则可以让计算机勉强处理一些简单简短的句子,科学家总结更多的文法规则希望完善它的处理能力的时候才发现这几乎不可能,语法规则分析起来太罗嗦,而且科学家们也很难总结出所有的规则。
     20世纪70年代后,Frederick Jelinek和他领导的IBM华生实验室采用基于统计的方法希望能解决语音识别的问题,引发了众伟人基于统计来解决计算机对整个自然语言处理的研究,并且很快取得非常好的效果,我们现在能如此方便的运用各种翻译软件,搜索引擎,输入法等等都与他们的成就密不可分。
      看到科学家们努力让计算机理解语法规则,希望它去正确处理自然语言,但计算机却总是不如人意这里时,我总在想,要是计算机自己有思想,它肯定觉得自己笨死了,自己的主人已经把如何理解自然语言的规则都交给它了,可它就是不懂!
后来科学家们明白了,让它去从句法方面理解是徒劳无效的,于是出现了统计语言学。即不管你懂不懂,把所有可能出现的字词句组合都输入给你,保存在语言库里,你要是问它什么,它通过算法在库里去匹配,找出最可能是你要表达的意思。可能我们听起来这样的处理方法似乎比通过语法规则来处理更不靠谱,但事实是这样的效果好很多,而且我们现在使用的计算机处理自然语言的方式就是这样的!通过优化,它几乎能完全匹配出正确的意思。
为什么呢!

统计学似乎可以解释一切。
这是我看过之后的思考。我们懂得语言,懂得察言观色,懂得为人处世,其实也都是基于统计学。
我们脑海里储存了大量我们看过的听过的信息,然后自动进行了又复杂又简单的分类,当遇到类似情况的时候大脑自动匹配最佳解决方案……
我们的所见所闻所感无时无刻不在更新我们的库,以便更好的处理各种问题。
为什么有所谓的一万小时定律----在某个领域要有所造诣必须先做满一万小时的练习。
因为要让我们脑子里关于这个领域的知识库足够完善足够大,统计到这个领域任何问题的几乎所有的解决方案。
可以这样理解吗?

最简的即是最美的。
作者在书中说:在计算机科学领域,一个好的算法应该像AK-47冲锋枪那样,简单、有效、可靠性好而且容易读懂(或者说易操作),而不应该故弄玄虚。


                     统计学习

        作者李航。薄薄的一本书,却成为每一个学习机器学习都不敢不看的一本书。简简单单的几章,却让每一个人都着迷上瘾。每一个模型都那么的精妙,每一个公式的推导过程都那么的不可思议。这本书对一个人的智商确实有很大的洗礼作用。统计学习构成了人工智能的大脑,它在用数学的方式帮助我们重塑一个聪明的大脑。
       科学研究发现,许多高等生物拥有空间意识、数量意识、甚至社会关系意识、可是没有证据表明这些生物拥有时间意识--这也许是人和动物的主要区别之一。人可以面对未来进行想象、展望和规划,而动物却似乎不具备这一能力。渴望了解未来、热衷预测未来是人的本性。哲学家克尔凯郭尔说:“人生过去可以去解读,但未来只能去经历”。这也许是大家关心未来的根本原因。
从人类文明的摇篮期开始,预测未来就有着重要的意义。三千五百年前的商朝,人们都相信可以通过占卜能够预测未来,出征、收成、生育等等。流传下来的甲骨文实际多是刻在龟甲上的占卜记录。但是人类真正拥有科学的预测未来的手段是从17世纪开始--这个工具就是统计学习,也就是现在的统计机器学习。是的,我们生活在了一个人类文明快速发展与融合的时代,我们选择了一个充满无限想象和可能的行业。然而现在我们应该做的就是利用自己的知识和感觉选择一个最快来到的浪潮,是虚拟现实?是增强现实?人工智能?基因工程?或者是物联网的普及。当我们回顾历史的时候总认为历史是必然的,但我们站在选择的路口上时它是可以选择的。然而决定历史走向的永远是那先驱者。
















欢迎光临 机器学习和生物信息学实验室联盟 (http://123.57.240.48/) Powered by Discuz! X3.2