mathematic

一道有意思的面试题

Written by  on January 21, 2023

曾经面试的时候遇到过一道数学题,跟之前碰到过的题目都不一样,非常有意思,题目如下: 一个字典包含26个字符(),从里面随机有放回地选取个字符构成的字符串,重复上述操作构成一个字符串。请问平均需要多少次比较操作,才能判断和是否相等。

[Read more...]

随机的艺术

Written by  on September 15, 2020

当今机器学习整套理论都是建立在概率论的基础上,但凡涉及到概率的地方就有随机采样,这篇文章就来介绍一下日常写程序的时候用到的随机采样实现。

[Read more...]

奇异值分解

Written by  on February 23, 2017

在自然语言处理或者机器学习相关应用时,通常首先要做的是将每一个样本转换成一个向量,然后将预处理过后的样本聚集在一起以矩阵计算的形式来对数据进行分析,然而很多时候都会碰到向量维度过高矩阵过大带来的计算复杂度太高问题,这个时候就要对样本数据集进行降维处理,也就是通常所说的主成分分析 (Principal components analysis,PCA),在尽可能保持原本数据集的特征的前提下降低数据集维度,简单的线性回归就是一种降维操作(将二维平面上的点用一维的线段来表示)。

[Read more...]