资讯月刊下载
[开源软件] 进行数据挖掘的 8 个最佳开源工具
数据挖掘,又称为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤,是一个挖掘和分析大量数据并从中提取信息的过程。其中一些应用包括市场细分 - 如识别客户从特定品牌购买特定产品的特征,欺诈检测 - 识别可能导致在线欺诈的交易模式等。在本文中,我们整理了进行数据挖掘的 8 个最佳开源工具。 1、Weka W ...
[行业应用] 高精地图在无人驾驶中的应用
引用作者:陈辰,刘少山 本文为《程序员》原创文章,未经允许不得转载,更多精彩文章请订阅2017年《程序员》 高精地图是无人驾驶核心技术之一,精准的地图对无人车定位、导航与控制,以及安全至关重要。 本文是“无人驾驶技术系列”第七篇,首先介绍高精地图与传统地图的区别,然后介绍其特点及制作过程。在了解高精地图基础知识后,探索其在无人驾驶场景中的应用。 电子地图分类 我们日常使用的用于导航、查询地理信息的 ...
[开源软件] 2016 年十大 Python 机器学习开源项目
2016年十大Python机器学习开源项目 1、Scikit-learn 用于数据挖掘和数据分析的简单而有效的工具,基于NumPy,SciPy和matplotlib,开源,商业可用的BSD许可证。Commits: 21486, Contributors: 736, Github地址: Scikit-learn 2、Tensorflow 最初由Google机器智能研究机构的Google Brai ...
[企业架构] 流动的推荐系统——兴趣Feed技术架构与实现
引用 作者:陈开江@刑无刀,金融科技公司天农科技CTO,曾任新浪微博资深推荐算法工程师,考拉FM算法主管,先后负责微博反垃圾、基础数据挖掘、智能客服平台、个性化推荐等产品的后端算法研发,为考拉FM从零构建了个性化音频推荐系统。 本文为《程序员》原创文章,未经允许不得转载,更多精彩文章请订阅2017年《程序员》 流动的推荐系统 我们经常谈论的推荐系统(Recommender System),从形式上 ...
[开源软件] 盘点最受欢迎的十个开源大数据技术
引用 原文:Top 10 Big Data Technologies to Start Adopting Today! 作者:Tim Spann 翻译:王嘉怡 责编:仲培艺 大数据已然成为当今最热门的技术之一,正呈爆炸式增长。每天来自全球的新项目如雨后春笋般涌现。幸运地是,开源让越来越多的项目可以直接采用大数据技术,下面就来盘点最受欢迎的十大开源的大数据技术。 1.Hadoop——高效、可靠、可 ...
[数据库] BuntDB —— key/value 内存数据库
BuntDB是纯Go开发的、低层级的(low-level)的、可嵌入的key/value内存数据库(IMDB),数据持久化存储,遵从ACID,支持自定义索引和geospatial 数据。BuntDB旨在给用户提供可靠稳定高效的数据库。 特 性: 因为是内存数据库,所以支持快速的读和写 可采用简单的API,实现数据库嵌入功能 高达4个维度的空间索引,有用的Geospatial 数据 支持创建任 ...
[企业架构] 现代银行集中式业务系统及数据整合
引用 声明:本文为CSDN作者原创投稿文章,未经许可禁止任何形式的转载。 作者:施哲夫博士,软件工程师。美国密苏里大学计算机博士,数学和统计学硕士。曾在Microsoft 、Amazon、Bloomberg 工作。在数学建模、金融业计算机系统、云计算、机器学习、搜索和自然语言处理方面有多年的研究和开发经验。有多篇论文在一流国际期刊和会议上发表,并曾受邀为欧洲教授的书籍编写章节。特长:数学分析、算法设 ...
[开源软件] 领英宣布开源数据挖掘软件WhereHows
领英称即将开源他们内部的应用软件WhereHows,一个企业级的数据挖掘软件。 准确的说,领英称它为“数据发现软件”。从商业角度讲,WhereHows的目标是从分布式的多种元数据中进行挖掘。 据领英发布的资料显示,WhereHows已经挖掘了50,000条数据集,14,000条评论和35,000,000个工作机会,多达15PB的数据。 在一篇博客中,领英解释了创造WhereHows的原因:建造 ...
[互联网] 史上最大机器学习数据集,雅虎对外开放了
英文出处:yahoo labs 译文来自:伯乐在线 【导读】:数据是机器学习研究的命门。访问真正的大规模数据集,是一项传统上由机器学习研究者和大公司的数据科学家所保有的特权,然而大多数学术研究人员缺无法触及。2016年1月14日,雅虎实验室对外发布了发布史上最大机器学习数据集,达 13.5 TB。 数据集主页:http://webscope.sandbox.yahoo.com/catalog.ph ...
[互联网] 专家展望未来5年深度学习发展趋势
2015年已然过去,2016刚刚开始,回头将目光集中于去年的成就上,以及对将来科学趋势的预测。去年最令人瞩目的一个领域就是深度学习,它是机器学习中越来越流行的一个分支,看起来它会继续向前发展,并会运用到越来越多的行业和领域中。 在过去的一年中,我们有幸通过RE•WORK节目与从事人工智能和计算机科学方面的许多大牛进行交流,我们期待在2016年会晤更多的专家,并向他们学习。 作为Q& ...
[开源软件] 谷歌地图API的三大开源替代品
随着数据挖掘、移动应用和社交媒体等领域的风生水起,极大地改变了GIS(地理信息系统)的面貌以及地位,并由此催生了一大批适用于不同用途的工具,其中最为常见的当属谷歌地图API支持的网页地图GIS。 然而,在11月19日正值GIS日之际,Jason Baker在opensource.com上发文推荐了三大开源API,这绝对够得着谷歌的高标准。 Leaflet 有了Leaflet地图库,为移动 ...
[数据库] 专访Oracle高斌:从.com到云计算,Oracle的技术演变
高斌,Oracle首席技术支持工程师,主要负责Oracle RAC、Exadata的技术支持工作,擅长在压力环境下处理复杂的数据库技术问题,多次成功解决国内外客户重要系统的技术问题。日前,笔者采访了高斌,请他解读Oracle RAC,Oracle12c及Oracle RAC的技术解读。从.com到网格计算时代再到云计算的兴起,Oracle经历了哪些产品技术大变革?本文将为你揭晓。 高斌认为,“与其 ...
[互联网] 最好的Python机器学习库
引言 毫无疑问,神经网络和机器学习在过去几年一直是高科技领域最热门的话题之一。这一点很容易看出,因为它们解决了很多真正有趣的用例,如语音识别、图像识别、甚至是乐曲谱写。因此,在这篇文章,我决定编制一份囊括一些很好的Python机器学习库的清单,并将其张贴在下面。 在我看来,Python是学习(和实现)机器学习技术最好的语言之一,其原因主要有以下几点: 语言简单:如今,Python成为新手程序员 ...
[互联网] 你应该知道的机器学习方法
决定何时以及如何在你的团队中使用AI技术是一项艰巨的任务。可选的技术比比皆是:据venturescanner.com网站显示,目前VCs给多达885家AI公司投资了将近90亿美元。而且这还并不包括大量已成立的供应商和创业型公司。信息如此之多,足以使你晕头转向,分析能力瘫痪。 但是,让我们来正视它吧——在这些所有的选择中,我们仍然可以比AI软件做出一个更好的选择。即使此技术已经非常先进,我们也可 ...
[互联网] 2015中国SaaS生态“元素周期表”
以SaaS为代表的企业云端应用,正在改变着整个IT的格局。各种各类的SaaS的应用,这两年就从来没有离开过人们的眼球。今年以来,融资超过千万美金的SaaS企业比比皆是,包括今目标、销售易、雅座等,而主打企业SaaS应用的众多初创企业也纷纷拿到数额巨大的融资,可以看到,中国SaaS市场从来没有像今天一样火热。其实,深究SaaS为什么可以得到投资人和用户的青睐,这和SaaS本身的特点是分不开的,由于其资 ...
[互联网] 诺亚方舟实验室李航:深度学习还局限在复杂的模式识别 ...
华为技术有限公司诺亚方舟实验室主任李航认为,机器学习、数据挖掘和人工智能的研究,对华为未来的智能通信网络、智能企业管理、智能信息助手三个应用方向很有帮助,比如机器学习对SDN的控制能力、网络优化、人机交互、跨国交流等,都可以发挥很大的作用。 诺亚方舟实验室已经将采用深度学习(DL)提升自然语言处理(NLP)的能力(DL4NLP)作为一个研究重点,包括自然语言对话(包括知识问答)、机器翻译和图片搜索 ...
[非技术] 2015年国外薪资最丰厚的5个IT职业
你知道现在什么行业增长速度最快吗? 没错,计算机就是其中之一,并且荣登技术行业薪资最高的10个岗位之一。并且通过调查发现,五分之三的高薪岗位集中于大数据领域。通过对CyberCoders数据库的挖掘分析,我们总结出5个薪资最高的岗位以及所在的城市。 1.数据科学家 15万美元 — 华盛顿州西雅图 数据科学家可以说是当今最昂贵和最令人眼红的专业人才。 “不过,需要说明的是,涉及到数据科学的 ...
[非技术] 专访Databricks辛湜,谈Spark排序比赛摘冠及生态圈热 ...
摘要:最新消息,Databricks的Spark与UCSD的TritonSort两个系统在2014 Daytona GraySort比赛上并列第一。为了对比赛有更好的了解,笔者特采访了Databricks 辛湜(Reynold Xin),并就Spark社区中的一些热门趋势进行探讨。 据Sort Benchmark最新消息,Databricks的Spark与加州大学圣地亚哥分校的TritonSort两 ...
[数据库] 开源力量公开课第47期:数据挖掘入门指引
课程背景: 大数据的核心是价值,如何挖掘数据价值,应用是引导,挖掘是关键。数据挖掘是交叉学科,统计学和机器学习是其中最重要的基础。大数据处理不是数据分析,数据分析是什么,数据分析和数据挖掘的区别,数据挖掘的流程、重要环节和主要算法,大数据挖掘和传统数据挖掘的区别,课程会给出一个清晰的认识。 授课形式:线上公开课(免费) 开始时间: 2014-03-18 20:00 结束时间: 2014-03-1 ...
最近热门TAG
MySQL(258) Oracle(249) NoSQL(74) MongoDB(66) Redis(57) PostgreSQL(48) 数据挖掘(31) SQL Server(27) HBase(24) Cassandra(19) CouchDB(18) Access(16) SQLite(15) DB2(12) Derby(11) Informix(8) Sybase(6) PowerBuilder(5) HSQLDB(4) TokyoCabinet(1)