`
denniszjw
  • 浏览: 17883 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

vldb2015 Balazinska关于大数据研究的报告

 
阅读更多
2015 vldb会议上,华盛顿大学的Magdalena Balazinska 做了一篇报告,主题很有意思,是关于学术界如何继续大数据研究的问题。

报告列列举了VLDB历年会议上传统数据库领域经典问题的论文,说出了目前大多数做研究的人的感觉:好像问题都被研究完了,让工业界接手做好工程实现就好了。

作者否认了这个观点,并且认为学术界可以在基础层面做更多的研究贡献。一个很大的问题是几乎所有的大数据的负载都在工业界,怎么办?作者说学术界仍然有很多有意义的负载,像图像、空间数据、图形数据等。

途径1:利用校园或者科学应用,这些应用通常很有意思并且很有挑战,通常这些应用不在线校园普及。像天文望远镜图像、基因组数据、N体模拟等。

途径2:利用开源工具,开源工具可能有很多坑,或者不好用的地方,解决这些问题就是创新。如ParaTimer,SkewReduce,HaLoop等系统。

途径3:自己造轮子。打广告Myria

途径4:看看最新的问题:数据定价、数据许可协议。

途径5:培养下一代研究人员,前瞻研究问题:
Data Licensing -> Twitter
Array Database Engine -> GraphLab
Big Data Usability -> Twitter
Skew in Big Data Systems - > Microsoft
Probabilistic Streams -> Microsoft 
RFID Data Management -> Nokia Research

个人总结一下:这个基本算是归纳,最后的前瞻研究问题倒是有很好的参考意义。
分享到:
评论

相关推荐

    vldb2015:VLDB会议记录

    通过分析"vldb2015-master"这个压缩包文件,我们可以深入学习到2015年VLDB会议的前沿技术和研究成果,对数据库和大数据领域的最新动态有更全面的理解。文件内容可能包括会议论文全文、演讲幻灯片、技术演示代码、...

    Oracle分区表和分区索引在VLDB中的研究.pdf

    "Oracle分区表和分区索引在VLDB中的研究" 本文研究了Oracle分区表和分区索引在VLDB(Very Large Databases)中的应用。分区表和分区索引是数据库管理中的关键技术之一,是VLDB中一个重要的性能提升机制。通过分析一...

    ms-bfs:VLDB 2015论文“更多的商人”的源代码

    关于这是用于评估MS-BFS算法的实验框架(在VLDB 2015论文)及其相关工作。 该代码使用不同的BFS算法计算给定图中顶点的前k个紧密度中心值。 以下是编译和运行源代码的说明。建造./compile 使用GCC 4.8.2在Ubuntu ...

    vldb2013论文集

    VLDB(Very Large Data Base)国际顶级数据库会议,是数据库领域重要的学术会议之一,每年都会吸引来自世界各地的研究者提交他们的研究成果。VLDB2013论文集汇集了2013年所有提交并被收录的高质量论文,涵盖了数据库...

    大数据讲座91.pptx

    大数据广泛应用于科学研究、Web集成、多媒体、社交网络等领域。例如,微信作为一款即时通讯工具,每天生成的语音、视频、图片和文字数据量巨大,其背后的分析和处理能力体现了大数据技术的价值。 【大数据的技术...

    读VLDB论文后做的PPT总结

    自己做的总结PPT。参考论文为VLDB上的一篇:Regions of Interest for User Exploration,之后

    大数据理工大291.pptx

    早期,"超大规模数据"(VLDB)主要指GB级别的数据,侧重于关系数据模型的优化和事务管理;随后的"海量数据"时代,数据规模扩大至TB级别,研究焦点转向非结构化数据管理和多源数据集成;而如今的"大数据"则涉及PB级别...

    VLDB summer school

    根据提供的文件信息,我们可以将重点放在“VLDB Summer School”的主要教学内容以及涉及的数据挖掘、知识获取等核心概念上。 ### VLDB Summer School #### 一、活动介绍 VLDB (Very Large Data Bases) Summer ...

    SQLite-PPL:支持每页记录方法SQLite,在VLDB 2015上发布

    SQLite源代码库 该存储库包含SQLite数据库引擎的完整源代码。 还包括一些测试脚本。 但是,许多其他测试脚本和大多数文档是分开管理的。 如果您在某个地方的Git镜上阅读此书,则说明您做错了。...

    VLDB2009论文

    《VLDB2009论文》集合包含了2009年在国际数据库大会(Very Large Data Base, VLDB)上发表的关于图论的研究论文。VLDB是全球顶尖的数据库和大数据领域的学术会议,每年都会吸引众多研究者分享最新的研究成果和技术...

    大数据技术领域若干关键问题.pptx

    大数据的应用广泛分布在各个领域,包括科学研究、Web集成、多媒体、社交媒体等。以Facebook为例,每月上传的照片超过10亿张,每天生成的日志数据超过300TB;淘宝网每天处理的商品交易数据达到约20TB,显示出大数据在...

    vldb2008.ps.4up.pdf

    在1998年的VLDB会议上,Weber、Schek和Blott提出了一项关于高维相似性搜索的定量分析和性能研究,强调了高维空间的特性使得传统的搜索方法效率低下。他们指出,高维空间中的数据分布往往呈现出所谓的“维度灾难”...

    Column_Store_Tutorial_VLDB09.pdf

    列式存储数据库系统(Column-Oriented Database Systems)是一种专为大数据存储与管理而设计的数据库架构,其与传统的行式存储(row-store)有着本质的不同。列式存储数据库系统特别适合于读密集型的大数据仓库,...

    《时序数据清洗:从异常检测到异常修复》(VLDB17)代码发布_Java_下载.zip

    《时序数据清洗:从异常检测到异常修复》是一篇在VLDB17(国际数据库大会)上发表的重要研究论文,其重点在于探讨时序数据分析中的一个重要环节——数据清洗。时序数据通常来源于各种传感器、日志记录或交易数据,...

    2019-VLDB-Fine-Grained

    一篇顶级区块链会议文章

Global site tag (gtag.js) - Google Analytics