sebastian Quora问答 |《Python机器学习》作者Sebastian Raschka:从Python的学习经验到计算生物学的最前沿( 二 )
最近的一个例子是:戈麦斯-邦巴里利,拉斐尔等人,“自动化学设计使用数据驱动的分子连续表示”,第十四次区域研讨会:https://arxiv.org/abs/1610.02415
简而言之,研究人员训练了一个自动解码器来生成真实的合成分子。在这里,他们的神经网络将微笑字符串转换成潜在的表达式(压缩后只包含统计上有意义的信息的向量),并以最小的(或没有)误差返回微笑字符串。微笑串是一个分子的一维表达;例如阿司匹林的SMILES串是CC(=O)OC1=CC=CC=C1C(=O)O对应于以下二维结构:
文章图片
阿司匹林(2-(乙酰氧基)苯甲酸)
最后这几年出现了很多优秀的工具,从scikit-learn到antano、TensorFlow、Keras,降低了进入机器学习的门槛,也让我很兴奋。这些工具带来的便利让我们不用太担心技术部署,也能专注于自己想要解决的实际问题。
4.在紧张的工作中,你是怎么抽出时间做那些小项目的?
这个问题问得好。说实话,我没有什么秘密可以分享。我觉得这个问题就像:人们总说要控制体重,但最后的问题还是归结到每天的热量摄入和消耗。而且一天只有24小时,没有人能延长这个数字。我觉得挤出时间的秘诀是,你需要对这些小项目感兴趣,这样我自然就可以减少空闲时间去做其他活动,比如看游戏,看小说等等。当然,你的注意力也很重要。我觉得对大多数有趣的事情说“不”才是关键。我没说我们要整天无休止地工作。我想表达的是,如果你有一个很棒的想法,你通常会找时间去实现它。
5.最适合解决机器学习问题的数学是什么?
统计学,概率论,线性代数,微积分。
统计学和概率论,因为第一个任务通常是选择不同的生成模型之一来定义性能指标和评估结果。线性代数是机器学习部署的主要支柱之一,因为它允许我们连续高效地记录和部署它。我想说微积分在纯机器学习应用中并不是很重要,但是如果你想了解我们使用或者部署的算法,多元微积分和优化理论就很重要,更不用说你想研究机器学习了。
6.我是生物物理专业的学生,对Python在自然科学中的应用很感兴趣。对于初学者,可以推荐一下学习Python最好的书吗?
可惜我个人没有任何学习Python的推荐书籍,因为我是通过Codecademy和后来的一门大学课程(CS编程I)学习Python的;同时,我还参加了2011年12月Udacity的“计算机科学导论”课程。所以我想推荐Codecadamy和Udacity的计算机科学入门课程,都是不错的资源(而且据我所知都是免费的)。推荐方面,我觉得最受欢迎的两本书是《搭便车Python指南》和《艰难地学习Python》。但是我个人从来没有看过这两本书,所以我不能保证——但这并不是说它们不够好:)
此外,我认为这取决于你对其他编程语言的经验。如果你之前使用过另一种动态语言(比如Ruby甚至R),我认为你只需要阅读Python Pocket Guide(甚至只需要web文档)就可以快速掌握Python。
虽然我相信上面列出的所有资源都有助于入门,但你应该通过应用它来解决你所在领域的问题,从而自动学习这门语言。或者换句话说,一旦过了入门门槛,就可以在网上快速找到相关的或者更具体的概念实现(比如通过StackOverflow)。另外,写代码的时候配合是有帮助的,因为你可以通过阅读别人的代码得到很多有用的想法,别人可以为你的实现提供有用的指导。
参考:
计算机科学导论:https://www.udacity.com/course/intro-to-computer-science-cs 101
《Python搭便车者指南:http://docs.python-guide.org/en/latest/》
推荐阅读
- 新冠疫苗加强针“六问答”丨迎新健康宝典
- 答题送温暖 战疫护健康 | 新冠肺炎防控知识有奖问答大PK开始啦!
- 一图读懂|上海市健促中心六问答提醒:应对新冠变异株,加强针更有保护效力
- 李冰冰被问查税 李冰冰被问查税瞬间变脸这样说 用广东话问答相当贴心
- 感控问答 | 6问6答——消毒知识的相关问答
- 超声问答丨这个颈部淋巴结应该如何考虑?
- 艾滋病防治知识有奖问答竞赛颁奖活动举行
- 感控问答|6问6答——新冠防控的相关问答
- 鼠疫的症状传播途径 鼠疫防治科普知识问答
- 心理问答|怎么和留守9年的女儿重建亲情?