在机器学习领域中,朴素贝叶斯是一种基于贝叶斯定理的简单概率分类器, 朴素贝叶斯在处理文本数据时可以得到较好的分类结果,被广泛应用于文本分类/垃圾邮件过滤/自然语言处理等场景。
在机器学习领域中,朴素贝叶斯是一种基于贝叶斯定理的简单概率分类器, 朴素贝叶斯在处理文本数据时可以得到较好的分类结果,被广泛应用于文本分类/垃圾邮件过滤/自然语言处理等场景。
1.线性回归与逻辑回归
2.多元梯度下降
3.梯度上升
4.正规方程
在做文本分类等问题时,需要从大量语料中提取特征,词袋和TF-IDF模型是很好的选择
Python中很好用的中文分词组件
正向最大匹配法(Maximum Match Method,MM 法)是指从左向右按最大原则与词典里面的词进行匹配。假设词典中最长词是 m个字,那么从待切分文本的最左边取 m个字符与词典进行匹配,如果匹配成功,则分词, 如果匹配不成功,那么取 m−1 个字符与词典匹配,直到成功匹配为止。