sebastian Quora问答 |《Python机器学习》作者Sebastian Raschka:从Python的学习经验到计算生物学的最前沿( 六 )
17.对数据科学初学者有什么建议?
我的建议是选择你个人感兴趣的问题或项目,而不是照搬一个问题的解决方案。如果你对一个问题感兴趣,你会渴望解决它,并在这个过程中开发新的工具和技术。首先你需要从你能熟练运用的技术和工具入手,看你能走多远。如果现有的工具包不能解决问题,我会尝试在网上搜索类似问题的解决方案,或者问问别人。例如,如果您对一个预测感兴趣,您将在开始时在Python字典中存储键值对。随着你数据集的增长,你可能开始需要其他的存储方式,比如SQLite,然后你就会开始学习SQLite。同样,如果可以用NumPy数组处理很多问题,那么在收集异构数据时,可能会求助熊猫来处理;如果你的系统内存有限,你会尝试使用其他工具,比如Blaze。
我的建议是,你需要学会使用你认为可以解决问题的工具,并且在适当的时候使用它们。第二步是查看当前工具的潜在替代品,看看它们还有什么额外的功能。
我发现为了学习工具而学习工具很快就会变得枯燥,所以我的方法就是在实践中学习工具。方向对了,自然会花时间去学习新工具。
【sebastian Quora问答 |《Python机器学习》作者Sebastian Raschka:从Python的学习经验到计算生物学的最前沿】18.你是怎么挤出时间来掌握机器学习,再获得一个博士学位,出版一本关于这个课题的书的?
我觉得计算生物学和机器学习在解决问题上有很大的相似性。在计算生物学中,我们通常通过各种数据挖掘来解决计算问题,而在机器学习中,数据挖掘也处于领先地位。我一直喜欢统计学。研究生阶段上了一门“统计模式识别”的课。我真的觉得这门课点燃了我对预测建模和机器学习的热情。一开始我觉得,“哇,这太不可思议了,它帮我解决了计算生物学中的各种问题。”后来真的觉得“哇,机器学习这么重要,能帮我解决几乎所有的问题,想多学点。」
在课程中,我对机器学习产生了真正的热情,这促使我晚上花一些额外的时间努力学习。说实话,机器学习有很多方面我还没有深入研究,也有很多文献我还没来得及看。然而,当我被要求写一本书时,我发现以前的研究只是与此相关。虽然我每个周末晚上都要花几个小时写书,这几个月的社交生活也遭受了一些磨难,但这也是我激情的源泉:我很乐意分享让我兴奋的知识,这让写书的整个过程充满了乐趣。所以我觉得博士期间花所有时间写一本书已经足够疯狂了(因为直接有助于解决计算生物学的问题),是一种很棒的体验,所以我愿意花一部分“空的闲暇时间。
19.哪里可以找到可以用来学习的Python机器学习程序?
我的建议是关注一些数据科学博客,因为很多人的博客都在分享自己喜欢的Python机器学习。现在这里有一个全面的数据科学家博客列表,但不全是机器学习的,你要做一些手工搜索:rushter/data-science-blogs,也可以看看Kaggle (https://www.kaggle.com/)。
例如:
“通过百万酒店点评找到一些有趣的见解”:https://blog . monkey learn . com/machine-learning-1m-hotel-reviews-fins-interior-insights/
Python中的机器学习培训,第1部分:http://www . johnwittenauer . net/machine-learning-practices-in-Python-part-1/
不幸的是,他的博客似乎不太经常更新(或者有新网站),但你仍然可以看看通过Kaggle竞赛的解决方案(http://www . chioka . in/Kaggle-competition-solutions/)。同样,我也认为Kaggle比赛和论坛是很好的学习平台。
这篇文章是由机器的心脏编辑的。请联系本微信官方账号进行授权。
? -
加入机器的心脏(全职采访人员实习生):hr@almosthuman.cn
推荐阅读
- 新冠疫苗加强针“六问答”丨迎新健康宝典
- 答题送温暖 战疫护健康 | 新冠肺炎防控知识有奖问答大PK开始啦!
- 一图读懂|上海市健促中心六问答提醒:应对新冠变异株,加强针更有保护效力
- 李冰冰被问查税 李冰冰被问查税瞬间变脸这样说 用广东话问答相当贴心
- 感控问答 | 6问6答——消毒知识的相关问答
- 超声问答丨这个颈部淋巴结应该如何考虑?
- 艾滋病防治知识有奖问答竞赛颁奖活动举行
- 感控问答|6问6答——新冠防控的相关问答
- 鼠疫的症状传播途径 鼠疫防治科普知识问答
- 心理问答|怎么和留守9年的女儿重建亲情?