0

0

回答

466 浏览

有搜索引擎和非结构化数据挖掘的同行吗?[已解决]5

我有个朋友,现在国外的石油行业工作,他想做一个基于文件的企业搜索引擎,同时还想对大量有关钻井的非结构化数据进行数据挖掘。不知有没有高手愿意合作?他想找的是技术合伙人,全职兼职均可。如果您有兴趣和时间,请和我联系。我将我将提供更多的技术细节。多谢!

2014年11月18日 13:34
0

1

回答

647 浏览

mahout中的userid和itemid如果是string类型怎么处理?[已解决]5

我在用mahout0.8版本,发现mahout输入必须是long型,通过google找到IDMigrator可以重写,想问下有没有人在正式的商业环境中用到mahout的非long型问题,如果请给点建议,不胜感激,我的用户量是亿级

0

0

回答

537 浏览

数据挖掘中,如何处理多值的属性?[已解决]5

在DBLP数据集中查找最常合著的作者。因为一篇论文中有多个作者(最多可能有上百个),而整个数据集中可能有上万个作者。 现在只需提取每条记录中的作者信息,但很多文章都是多个作者,该怎么把这些作者处理成weka能够识别的arff格式中的数据呢? 如果将其定义为String类型,使用逗号来分隔,weka会报错(因为我只需作者这一个属性),而同一个属性的值中不能出现逗号。若使用别的符号来分隔(如“ ...

2013年10月21日 19:58

本周活跃投票用户

最新评论

Global site tag (gtag.js) - Google Analytics