资讯月刊下载
[互联网] 大规模主题模型:对Spark LDA算法的改进
这篇文章由Databricks的Feynman Liang和Joseph Bradley,以及Intel的Yuhao Yang撰写。 在使用LDA之前,请先下载Spark 1.5或是申请试用版的Databricks。 人们正在推特上讨论什么呢?为了关注分布式计算,我该阅读哪些资讯文章呢?这些问题都能够被话题模型所解答,它是分析文档集所涵盖话题类别的一种技术。本文将要讨论Spark 1.4和1.5 ...