0

0

回答

537 浏览

数据挖掘中,如何处理多值的属性?[已解决]5

在DBLP数据集中查找最常合著的作者。因为一篇论文中有多个作者(最多可能有上百个),而整个数据集中可能有上万个作者。 现在只需提取每条记录中的作者信息,但很多文章都是多个作者,该怎么把这些作者处理成weka能够识别的arff格式中的数据呢? 如果将其定义为String类型,使用逗号来分隔,weka会报错(因为我只需作者这一个属性),而同一个属性的值中不能出现逗号。若使用别的符号来分隔(如“ ...

2013年10月21日 19:58

本周活跃投票用户

最新评论

Global site tag (gtag.js) - Google Analytics