Update README.md
This commit is contained in:
parent
3dcd86542f
commit
dd37739f82
|
@ -3,6 +3,8 @@
|
|||
写综述不知道该如何分类论文更好,于是编了一个LDA模型来帮我分类(*^_^*)
|
||||
python版本为3.7.9,使用了gensim中的LDA模型,分词工具以及词性还原工具都来自于nltk,可视化结果用了包pyLDAvis
|
||||
LDA主题模型可以用于推测文档的主题分布。根据文档集中的每一篇文档的字词,以概率分布的形式给出主题并进行主题聚类或文本分类。
|
||||
具体数学原理太麻烦了建议百度“LDA主题模型原理”。
|
||||
具体数学原理太长了建议百度“LDA主题模型原理”。
|
||||
|
||||
我输入的文本集为43篇论文中每一篇的摘要部分,停止词表是这个基础上修改的 https://blog.csdn.net/shijiebei2009/article/details/39696523/
|
||||
其中nltk需要下载nltk_data包并放到对应目录下。具体目录不同机器显示不同。加载nltk报错时会显示
|
||||
|
||||
下载nltk_data的地址为https://gitcode.net/mirrors/nltk/nltk_data?utm_source=csdn_github_accelerator
|
Loading…
Reference in New Issue