在机器学习领域中,朴素贝叶斯是一种基于贝叶斯定理的简单概率分类器, 朴素贝叶斯在处理文本数据时可以得到较好的分类结果,被广泛应用于文本分类/垃圾邮件过滤/自然语言处理等场景。
使用Python进行文本分类
判断某句话是否为正常言论
导入数据
1 | def loadDataSet(): |
创建字典
1 | def createVocabList(dataSet): |
将某句话转换为向量
1 | def setOfWords2Vec(vocabList, inputSet): |
从词向量计算概率
1 | from numpy import * |
1 | def trainNB0(trainMatrix, trainCategory): |