Kui Zhao’s Blog | Make the world a better place
  • 《清单革命》读书笔记

    如何持续、正确、安全地把事情做好?或许我们犯错是因为没有掌握相关知识;或许并不是,而是没有正确使用这些知识。

  • 《刻意练习》读书笔记

    我们的大脑拥有和莫扎特这样的“天才”相同的适应能力,“天才”只是更多地利用了这种适应能力

  • 《聪明的投资者》读书笔记(下)

    格雷厄姆对于投资的意义就像欧几里得对于几何学、达尔文对于生物进化论一样重要。

  • 《聪明的投资者》读书笔记(上)

    格雷厄姆对于投资的意义就像欧几里得对于几何学、达尔文对于生物进化论一样重要。

  • 机场客流量的时空分布预测冠军方案

    为了有效利用机场资源,机场正利用大数据技术,提升生产运营的效率。机场拥有巨大的旅客吞吐量,与巨大的人员流动相对应的则是巨大的服务压力。安防、安检、突发事件应急、值机、行李追踪等机场服务都希望能够预测未来的旅客吞吐量,并据此提前调配人力物力,更好地为旅客服务。

  • 机器学习评价指标大汇总

    在使用机器学习算法的过程中,针对不同场景需要不同的评价指标,在这里对常用的指标进行一个简单的汇总。

  • 放回采样最终不同样本数量

    机器学习很多场景中会用到放回采样,比如bagging方法。采样后的数据集会有一些数据重复,一些数据缺失,从\(N​\)个样本中采样\(K​\)个样本,不同样本数量的期望为\(U(K)=N(1-\left(\frac{N-1}{N}\right)^K)​\)。怎么来的呢?这里给出简单的证明。

  • 从数学分析的角度来看Softmax

    Softmax是机器学习中最常用的输出函数之一,网上有很多资料介绍它是什么以及它的用法,但却没有资料来介绍它背后的原理。本文首先简单地介绍一下Softmax,然后着重从数学分析的角度来分析一下它背后的原理。

  • 归一化与标准化

    在机器学习和数据挖掘中,经常会听到两个名词:归一化(Normalization)与标准化(Standardization)。它们具体是什么?带来什么益处?具体怎么用?本文来具体讨论这些问题。

  • 如何处理数据中的缺失值

    现实世界中的数据往往非常杂乱,未经处理的原始数据中某些属性数据缺失是经常出现的情况。另外,在做特征工程时经常会有些样本的某些特征无法求出。路漫漫其修远兮,数据还是要继续挖的,本文介绍几种处理数据中缺失值的主要方法。

  • 如何解决机器学习中数据不平衡问题

    这几年来,机器学习和数据挖掘非常火热,它们逐渐为世界带来实际价值。与此同时,越来越多的机器学习算法从学术界走向工业界,而在这个过程中会有很多困难。数据不平衡问题虽然不是最难的,但绝对是最重要的问题之一。

Subscribe via RSS