资讯月刊下载
[开源软件] 轻量级大规模机器学习算法库Fregata开源:快速,无需 ...
引用 作者:张夏天,TalkingData首席数据科学家。12年大规模机器学习和数据挖掘经验,对推荐系统、计算广告、大规模机器学习算法并行化、流式机器学习算法有很深的造诣;在国际顶级会议和期刊上发表论文12篇,申请专利9项;前IBM CRL、腾讯、华为诺亚方舟实验室数据科学家;KDD2015、DSS2016国际会议主题演讲;机器学习开源项目Dice创始人。 欢迎技术投稿、约稿、给文章纠错,请发送邮件 ...
[开源软件] Fregata: TalkingData开源的轻量级大规模机器学习库
Fregata是TalkingData开源的一个基于Spark的轻量级、超快速的大规模机器学习库,并在Scala中提供高级API。 显著特征: 更加准确:Fregata的精确度要高于MLLib; 高速度:对于广义线性模型,Fregata通常汇合在一个数据历元。对于10亿*10亿的数据集,Fregata可以在1分钟内使用内存缓存或10分钟完成一个广义线性模型训练,速度要比MLLib快10-100倍 ...