机器学习之支持向量机
概念 支持向量机(Support Vector Machine,缩写SVM)是一种监督式学习方法,广泛应用于统计分类以及回归分析,和逻辑回归同属于线性分类器。SVM计算出的决策边界与正、负样本保持了足够大的距离,因此SVM是一种大间距分类器。 ...
概念 支持向量机(Support Vector Machine,缩写SVM)是一种监督式学习方法,广泛应用于统计分类以及回归分析,和逻辑回归同属于线性分类器。SVM计算出的决策边界与正、负样本保持了足够大的距离,因此SVM是一种大间距分类器。 ...
概念 很多网站都使用推荐系统预测用户喜欢的内容。以电影资讯网站为例,假设电影有多个特征,那么根据用户对电影的打分,我们可以预测用户可能喜欢那些类型的电影,这就是基于内容的推荐系统。这种优化过程和线性回归类似。 ...
概念 异常检测是一种识别异常样本的方法,我们需要构建一个概率模型,如果某一样本被认定是正常样本的概率足够小,那么它会被当做异常样本。高斯分布(或称正态分布)模型是异常检测算法最常使用的概率分布模型。 ...
概念 主成分分析(Principle Component Analysis,缩写PCA)是一种特征降维技术,也是一种无监督学习算法。另外两种较为常用的降维技术是t-SNE和自编码器。PCA能从冗余特征中提取主要成分,在不太损失模型质量的情况下,提升模型训练速度。 ...
概念 K-平均算法是一种无监督的聚类算法。无监督学习是一种自由的方式,其训练集不会标明类别,需要算法进行自我归纳。K-平均算法的思想是,对于给定的训练集,按照样本之间距离的大小划分为k个簇。让簇内的点尽量靠在一起,簇与簇之间的距离尽量大。 ...