统计学习方法(第2版)

李航
本书全面系统地介绍了统计学习的主要方法,共分两篇。第一篇系统介绍监督学习的各种重要方法,包括决策树、感知机、支持向量机、最大熵模型与逻辑斯谛回归、推进法、多类分类法、EM算法、隐马尔科夫模型和条件随机场等;第二篇介绍无监督学习,包括聚类、奇异值、主成分分析、潜在语义分析等。两篇中,除概论和总结外,每章介绍一或二种方法。
水中玉

不同行业之间需要掌握的专业知识不一样。看此书;如果你不是专业人士,那就是外行看热闹了…… 摘抄; 本书主要是面向将统计学习方法作为工具的科研人员与学生,特别是从事信息检索、自然语言处理、文本数据挖掘及相关领域的研究与开发的科研人员与学生。 本书力求系统而详细地介绍统计学习的方法。在内容选取上,侧重介绍那些最重要、最常用的方法,特别是关于分类与标注问题的方法。

啊煦

在李航老师的《统计学习方法》一书中,提出机器学习由“模型”“策略”和“算法”三个要素构成: 机器学习=模型+策略+算法 模型是指机器学习所要产出的内容,它一般会以一个可被计算的决策函数或者条件概率分布函数的形式存在。把未知的新数据代入到这个模型中计算,就会得到符合真实情况的输出结果。 策略是指要按照什么样的准则进行学习,具体一点是按照什么样的准则选择出最优的模型。从宏观角度讲,一般我们都会以“减少模型的输出结果与真实情况差距”作为学习的准则,这里的“差距”同样也是以一个可被计算函数的形式来描述的,被称为“损失函数”。 算法是指如何依靠历史数据,把正确的模型中涉及的未知参数都找出来。在确定寻找最优模型的策略后,机器学习的问题便归结为寻找出模型最优参数的优化的问题。 —周志明

别业虎

机器学习经典好书,概念讲解严谨而清晰,深度和广度适中,总结到位,句句精辟。虽然数学符号和公式很多,但配合深入浅出的文字说明,并不难懂。尽管本书讲解还算通俗易懂,但没有线性代数,微积分和概率统计的基础知识以及必要的机器学习相关概念,初学者还是比较容易被吓跑的,建议读者掌握一定基础后再读本书,才会有豁然开朗,柳暗花明之感。

爱琴海的约定

统计学习是计算机及其应用领域的一门重要的学科。本书全面系统地介绍了统计学习的主要方法,特别是监督学习方法,包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、em算法、隐马尔可夫模型和条件随机场等。除第1章概论和最后一章总结外,每章介绍一种方法。叙述从具体问题或实例入手,由浅入深,阐明思路,给出必要的数学推导,便于读者掌握统计学习方法的实质,学会运用。为满足读者进一步学习的需要,书中还介绍了一些相关研究,给出了少量习题,列出了主要参考文献

养生不熬夜

《统计学习方法》作为一本经典教材,内容详实,涵盖了机器学习中大多数常见算法,不过对于数学基础的要求比较高,第一遍系统学习确实觉得很难,而且看书的过程中尤其是公式推导部分太枯燥,所以搭配B站简博士的视频学完了监督学习的内容,同时学习过程中参考了一些代码实现的书比如《机器学习的数学解析与Python实现》等,做一做实验可以直观地体会各种算法的应用,总的来说,第一遍过掌握得很浅显,以后还得慢慢深入学习,加深理解。

Alyssa

作为一个外行读此书的方法就是读大框架,然后了解一些基本概念。了解一下统计科学的逻辑。对初入者来说就够啦。另外分享一点感受,现在的一部分技术专家学者希望通过大数据以及人工智能来模拟人类,预测世界,预测未来,特别看了统计学这本书,了解了各种模型以及数学算法的逻辑,越发觉得世界不可能以数学大模型来解释和测算,也不能单纯用科学解释。记住了书里的一句话“所有模型都是错误的”,人类的心和大脑有其神奇之处,最后还是需要由人来做决策。”Only our wishes make sense “.再超前的技术都只是人类能力的延伸。希望我们人类能保持住这神奇伟大的特性。不过马克思提醒过我们人类容易被自己创造物所支配,比如货币,所以时刻需时刻保持警惕,乐观前行!

lopin

看了1 2 3 4 5 6 8章,其余的用到了再说吧,太难熬了,有的人说轻轻松松就看完了,我估计也不是刚入门的人,要么是大佬,要么就是纯数学专业的,总之不适合初学者硬啃,但是你又找不到更合适的书了,听说大厂还喜欢拿这本书来考……好难啊啊啊啊啊啊啊,啊啊啊啊啊啊啊

🌻Xu.

💙第一个是大数定律,它是整个概率学的基础。在生活中,想要做好财产管理和风险投资,都离不开它。 💙这就是“大数定律”的主要内涵,用数学术语来表达,那就是当试验次数足够多时,实验结果的平均值会无限地接近一个数值,这个数值一般叫做“期望值”。 💙我们要注意,大数定律成立的前提是“试验次数足够多”。 💙那中心极限定理的含义就是,任意一个群体样本的平均值,都会围绕在这个群体的整体平均值周围。我们对一个基数庞大的群体做统计调查的时候,只要对其中的一部分样本进行研究,得出的结论就能反映整个群体的特点,而且抽样的数量越大,准确性越高。 💙总结一下,随机抽样是我们开展调查统计的第一步,我们要通过正确抽样,来保证第一手的数据是可靠的、没有偏见的。 💙统计学原理虽然看似简单,但却不是人人都能做数据分析师。因为它既能给我们的观点找到严谨的数据支持,但有时也会给一个错误的结论,披上合理的外衣。 💙统计学原理虽然不那么复杂,但它仍然是一项严肃的科学,需要时刻带着客观、严谨的思维去审视数据和风险。 所以,掌握一些基本的统计学知识,刻意挑战一下自己对世界的直观感性认识,培养理性判断的能力,会对我们很有帮助。

杨淇

想通过这本书学习的可以走了,这是本教材,不太适合初学者看。 类似字典一样,字典写得很好,但是学语言,没必要一开始上来就读字典,这样除了打击自己没啥用。 这本书适合学过一遍,至少入门的人来看。

汤川

国内经典机器学习很有名的一本教材,偏理论,不适合入门。有些经验后,回头再读,就会有醍醐灌顶的感觉了。这本是新版,添加了第一版没有的非监督内容。 当训练数据有限,但需要解决问题的数据特征明显的时候,经典机器学习还是大有用武之地的,不一定非要诉诸于深度学习。

蓝闹

在上学的时候读过,看的纸质版,最近找到了这本纸质书,上面的字迹寥寥草草,毕竟当时想从事相关行业,现在工作上用到了里面的方法,挺有用的

小李子🌦

垃圾

dayday

- 统计学习方法2 2019.5 - 监督学习.决策树/感知机/支持向量机/最大熵模型/逻辑斯蒂回归/推进法/多类分类法/EM算法/隐马尔科夫模型/条件随机场 - 无监督学习.聚类/奇异值/主成分分析/潜在语义分析

白色乌鸦

经典数学教材味,例子很少,全是抽象的推导,非数学相关专业看起来确实很难绷。不过这本书可以作为手册方便查询当下统计学习的一般工具和模型,再选择特定方向钻研。机器学习入门不推荐这本书,至少你得有一定的机器学习基础积累再看这本书才能帮你查漏补缺答疑解惑。

王静行

新人上手最好看这本入门,非常友好,公式和案例极其细致。看懂了就去看大名鼎鼎又名副其实的PRML,那本书是从更深刻的数理角度来讲解机器学习,给人脱胎换骨的感觉。至于西瓜书,经常跳公式看得人云里雾里,建议避坑。这本书相当于罗汉拳法长拳,prml相当于少林易筋经,西瓜书相当于缺了几页的青城派松风剑法。

暂时没有数据