2015 vldb会议上,华盛顿大学的Magdalena Balazinska 做了一篇报告,主题很有意思,是关于学术界如何继续大数据研究的问题。
报告列列举了VLDB历年会议上传统数据库领域经典问题的论文,说出了目前大多数做研究的人的感觉:好像问题都被研究完了,让工业界接手做好工程实现就好了。
作者否认了这个观点,并且认为学术界可以在基础层面做更多的研究贡献。一个很大的问题是几乎所有的大数据的负载都在工业界,怎么办?作者说学术界仍然有很多有意义的负载,像图像、空间数据、图形数据等。
途径1:利用校园或者科学应用,这些应用通常很有意思并且很有挑战,通常这些应用不在线校园普及。像天文望远镜图像、基因组数据、N体模拟等。
途径2:利用开源工具,开源工具可能有很多坑,或者不好用的地方,解决这些问题就是创新。如ParaTimer,SkewReduce,HaLoop等系统。
途径3:自己造轮子。打广告Myria
途径4:看看最新的问题:数据定价、数据许可协议。
途径5:培养下一代研究人员,前瞻研究问题:
Data Licensing -> Twitter
Array Database Engine -> GraphLab
Big Data Usability -> Twitter
Skew in Big Data Systems - > Microsoft
Probabilistic Streams -> Microsoft
RFID Data Management -> Nokia Research
个人总结一下:这个基本算是归纳,最后的前瞻研究问题倒是有很好的参考意义。
分享到:
相关推荐
通过分析"vldb2015-master"这个压缩包文件,我们可以深入学习到2015年VLDB会议的前沿技术和研究成果,对数据库和大数据领域的最新动态有更全面的理解。文件内容可能包括会议论文全文、演讲幻灯片、技术演示代码、...
"Oracle分区表和分区索引在VLDB中的研究" 本文研究了Oracle分区表和分区索引在VLDB(Very Large Databases)中的应用。分区表和分区索引是数据库管理中的关键技术之一,是VLDB中一个重要的性能提升机制。通过分析一...
关于这是用于评估MS-BFS算法的实验框架(在VLDB 2015论文)及其相关工作。 该代码使用不同的BFS算法计算给定图中顶点的前k个紧密度中心值。 以下是编译和运行源代码的说明。建造./compile 使用GCC 4.8.2在Ubuntu ...
VLDB(Very Large Data Base)国际顶级数据库会议,是数据库领域重要的学术会议之一,每年都会吸引来自世界各地的研究者提交他们的研究成果。VLDB2013论文集汇集了2013年所有提交并被收录的高质量论文,涵盖了数据库...
大数据广泛应用于科学研究、Web集成、多媒体、社交网络等领域。例如,微信作为一款即时通讯工具,每天生成的语音、视频、图片和文字数据量巨大,其背后的分析和处理能力体现了大数据技术的价值。 【大数据的技术...
自己做的总结PPT。参考论文为VLDB上的一篇:Regions of Interest for User Exploration,之后
早期,"超大规模数据"(VLDB)主要指GB级别的数据,侧重于关系数据模型的优化和事务管理;随后的"海量数据"时代,数据规模扩大至TB级别,研究焦点转向非结构化数据管理和多源数据集成;而如今的"大数据"则涉及PB级别...
根据提供的文件信息,我们可以将重点放在“VLDB Summer School”的主要教学内容以及涉及的数据挖掘、知识获取等核心概念上。 ### VLDB Summer School #### 一、活动介绍 VLDB (Very Large Data Bases) Summer ...
SQLite源代码库 该存储库包含SQLite数据库引擎的完整源代码。 还包括一些测试脚本。 但是,许多其他测试脚本和大多数文档是分开管理的。 如果您在某个地方的Git镜上阅读此书,则说明您做错了。...
《VLDB2009论文》集合包含了2009年在国际数据库大会(Very Large Data Base, VLDB)上发表的关于图论的研究论文。VLDB是全球顶尖的数据库和大数据领域的学术会议,每年都会吸引众多研究者分享最新的研究成果和技术...
大数据的应用广泛分布在各个领域,包括科学研究、Web集成、多媒体、社交媒体等。以Facebook为例,每月上传的照片超过10亿张,每天生成的日志数据超过300TB;淘宝网每天处理的商品交易数据达到约20TB,显示出大数据在...
在1998年的VLDB会议上,Weber、Schek和Blott提出了一项关于高维相似性搜索的定量分析和性能研究,强调了高维空间的特性使得传统的搜索方法效率低下。他们指出,高维空间中的数据分布往往呈现出所谓的“维度灾难”...
列式存储数据库系统(Column-Oriented Database Systems)是一种专为大数据存储与管理而设计的数据库架构,其与传统的行式存储(row-store)有着本质的不同。列式存储数据库系统特别适合于读密集型的大数据仓库,...
《时序数据清洗:从异常检测到异常修复》是一篇在VLDB17(国际数据库大会)上发表的重要研究论文,其重点在于探讨时序数据分析中的一个重要环节——数据清洗。时序数据通常来源于各种传感器、日志记录或交易数据,...
一篇顶级区块链会议文章