阅读更多

6顶
0踩

互联网
长久以来,互联网的顶级域名一直都没怎么变,都是.com、.net、.org等这些老面孔。但是计算机科学家及计算型知识引擎Wolfram|Alpha的创始人Stephen Wolfram近日发出呼吁:为了实现数据web,建议创建新的顶级域名.data


Stephen Wolfram近年活跃在数据社区,他认为这些活动聚焦点在于曝光互联网的数据,为组织披露数据提供动力,从而可以令用户可以更有效地发现和访问数据。

Stephen Wolfram在开发Wolfram|Alpha时要处理海量的数据,但是那些数据大部分不是直接从可见的互联网中获取的,而是来自与复杂的数据文件及数据库备份的混合物。

所以他提出,如果有一种标准的方式来获取结构化数据是不是很好呢?

目前的现状是,网站用网站地图(sitemap)来告诉网络蜘蛛(web crawler)如何浏览自己,关于网站是怎样组织这方面存在许多宽松的约定。但是结构化数据却没有任何约定。

今天的web主要是面向两类受众:人和搜索引擎爬虫。但是他认为对于Wolfram|Alpha和计算型知识来说,应该还存在着第三类受众:可计算东西的自动系统。

产品目录、存储信息、事件日历、递交监管、库存数据、历史文献资料、联系方式——许多东西对于计算来说都是非常有用的。但是即便网站里面有这些信息,尽管这些信息也是标准的结构化格式,但是由于缺乏标准的检索手段,使得获取这些信息仍然十分困难。

Stephen Wolfram因此提出了.data这个顶级域名的概念。用它来创建“数据web”——一个跟原来的web并行的web,主要面向的是结构化数据,供计算使用。其主要思路是除了每一个原始web网站都有一个.data的数据网站。


如果人访问.data网站,网站会提供其希望展示的数据的结构化摘要。如果是计算系统访问,只需直奔其所需的信息即可,然后开始计算。

其设想的.data域是要提供一种统一的机制——可访问任何类型和规模的组织,以便曝光其底层数据

也许有人会提出这样一种概念,即在网站根放置类似“/datamap.xml”的文件,或者就用站点地图这些轻量级的方案来替代整个.data网站。但是Stephen Wolfram认为引进新的.data顶级域能够令创建数据web的工作更加突出,还能为获得各种质量上乘、传播广泛、标准规范的数据提供动力。

至于这些跟语义web的关系。语义web的中心概念是为人类可读的网页引入标记,使计算机更易于理解和处理。这跟数据web的概念有一些交集。不过数据web主要目的是为大量结构化数据提供安身之所,那种地方没人会想直接去访问。

Stephen Wolfram说自己10年前曾向搜索引擎先驱提出建议,通过定义从数据库展示数据的标准来深挖互联网。有一段时间大家曾经非常热衷于展现“web服务”,现在各种API已经是遍地开花了。

经过近几年参与数据社区的观察,Stephen Wolfram认为目前已经到达了一个关键点,即决定以标准的方式提供大规模结构化数据的组织已经大量出现。因此他认为创建.data顶级域名的时机应该成熟了。

Stephen Wolfram说尽管自己不能确定.data顶级域名的所有问题,但是他认为这是建设这个域是个重要的机会,他愿意身先士卒发挥领袖作用,并号召更多人参与进来,为加快数据web的诞生贡献力量。

Via  stephenwolfram

  • 大小: 15.9 KB
  • 大小: 3.3 KB
来自: 36氪
6
0
评论 共 2 条 请登录后发表评论
2 楼 whoshaofeng 2012-01-12 09:46
134564 写道
看成了“.dota”

太有才了
1 楼 134564 2012-01-12 08:33
看成了“.dota”

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • subversion

    subversion 求助编辑百科名片 Subversion是一个自由,开源的版本控制系统。在Subversion管理下,文件和目录可以超越时空。Subversion将文件存放在中心版本库里。这个版本库很像一个普通的文件服务器,不同的是,它可以记录每一次文件和目录的修改情况。这样就可以籍此将数据恢复到以前的版本,并可以查看数据的更改细节。正因为如此,许多人将版本控制系统当作一种

  • 如何应对海量数据时代的挑战

    如何应对海量数据时代的挑战? 大数据的浪潮有多迅猛?IDC在2006年估计全世界产生的数据量是0.18ZB(1ZB=100万PB),而今年这个数字已经提升了一个数量级,达到1.8ZB,差不多对应全世界每个人一块100多GB的硬盘。...

  • 计算机科学导论(5):计算机网络

    人类科学技术的飞速发展,为互联网出现准备了充足的条件,但是整个人类的观念意识,并没有做好迎接未来互联网的心理准备。不同的国家,不同的领域,一个国家内不同的地区,画地为牢的小圈子一个个出现,这些或被称为...

  • 计算机网络(自顶向下)——应用层

    可靠数据传输与不可靠数据传输 吞吐量:带宽敏感的应用,弹性应用 定时 安全性 因特网提供的运输服务(运输层) TCP:面向连接服务、可靠数据传输服务 UDP:实时 **安全TCP(SSL) 进程寻址(网

  • 计算机网络重点整理(全网搜集总结结尾附引用链接)

    (百度百科)例如:一个公司的 Web 网站可看作是它在网上的门户,而域名就相当于其门牌地址,通常域名都使用该公司的名称或简称。例如上面提到的微软公司的域名,类似的还有:IBM 公司的域名是 www.ibm.com、Oracle ...

  • 计算机网络整理

    OSI七层体系结构,理论上的国际标准 TCP/IP事实上的标准 ... 会话层(数据):提供包括访问验证和会话管理在内的建立和维护应用之间通信的机制,如服务器验证用户登录便是由会话层完成的 传输层(段):实现网...

  • HTTP协议

    当我们在浏览器地址栏上输入要访问的URL后,浏览器会分析出URL上面的域名,然后通过DNS服务器查询出域名映射的IP地址,浏览器根据查询到的IP地址与Web服务器进行通信,而通信的协议就是HTTP协议。

  • 计算机网络面试题

    会话层(数据):提供包括访问验证和会话管理在内的建立和维护应用之间通信的机制,如服务器验证用户登录便是由会话层完成的 传输层(段):实现网络不同主机上用户进程之间的数据通信,可靠 与不可靠的传输,...

  • java知识点汇总

    对自己已掌握的技术敢于创新,不畏难题,勇于迎接新挑战!在平时生活中喜欢将自己学到的一些新技术写成博客与他人分享.也会经常阅读他人的技术性文章.来提升自己的能力,丰富自己的想法。能够妥善的处理周围的人际关系,...

  • 全文检索技术&&Lucene&&全文检索服务Solr部署详细步骤&&Solr后台管理界面的使用

    传统的搜索引擎技术,在一般数据库数据量比较小,用户量比较小的时候是比较常见的 但是在数据量增加到一定的量级的时候,数据库的压力就会变得很大,查询的速度会很慢,我们需要更好的解决方案来分担数据库的压力 使用...

  • HTTP面试相关问题整理

    说说TCP传输的三次握手四次挥手策略 断开一个TCP连接则需要“四次握手”: 为什么可能仍然有数据未发送完毕 说说网络分层里七层模型是哪七层 TCP和UDP的区别 XSS(Cross Site Scripting)-跨站脚本攻击 CSRF(Cross-...

  • 网络-存档

    上述是迭代查找,还可以使用递归查找,本地DNS服务器向根域名服务器发送请求,根域名服务器向顶级域名服务器发送请求,顶级域名服务器向权威域名服务器发送请求,再一个个返回。 /etc/hosts 是主机的一个文件列表,...

  • 《计算机网络与因特网》复习纲要

    第4层 传输层:接收来自上一层的数据,必要的时候把这些数据分割成较小的单元,然后把这些数据单元传递给网络层。 决定向会话层提供哪种类型的服务。 第3层 网络层:控制子网的运行。 如何将数据包从源端路由到接收...

  • 运维经典面试真题汇总系列

    这个问题的原因是由于 web 服务器收到了大量的连接,在启用了 iptables 的情况下,iptables 会把所有的连接都做链接跟踪处理, 这样 iptables 就会有一个链接跟踪表,当这个表满的时候,就会出现上面的错误。...

  • Linux 面试题 合集

    #参数含义:当slave从主数据库读取log数据失败后,等待多久重新建立连接并获取数据 –master-connect-retry=seconds 单位为秒 默认设置为 60秒 #参数含义:当重新建立主从连接时,如果连接建立失败,间隔多久后重试...

  • 【干货】|800份实战经验PPT免费下载

    多位全球顶级学术专家、各个领域企业大咖、上百创业公司分享前沿技术、实战经验和创业心得。 你是否为错过这些精彩内容而懊恼 ? 没关系 往下看 我们整理了2017云栖大会全年PPT总计近800份及部分峰会现场视频资料等...

  • 架构

    一、先从J2EE工程的通用架构说起这是一个通用的Web即B/S工程的架构,它由:ü Web Serverü App Serverü DB Server三大部分组成,其中: Web Server置于企业防火墙外,这个防火墙,大家可以认为是一个CISCO路由器,...

  • SDN和Openflow flowvisor NOX

    我们需要控制流,把流作为编程的实体:能对它路由、私有化、移动……我们还要吸取包交换的益处,因为它切实可行,能全局部署,而且很有效率——当然是在它很简单的时候。    综合上述考虑,我们定义了一个名为...

  • 重磅干货不容错过!2017云栖大会汇总资料,速来领取!

    刚刚过去的2017年, 云栖大会先后在全国八个...多位全球顶级学术专家,各个领域企业大咖上百创业公司分享前沿技术、实战经验和创业心得,你是否为错过这些精彩内容而懊恼?云栖社区福利大放送, 2017云栖大会全年PPT总计...

  • OpenFlow入门资料汇总(OpenFlow、SDN、NOX等,多为网络文章)

    我们需要控制流,把流作为编程的实体:能对它路由、私有化、移动……我们还要吸取包交换的益处,因为它切实可行,能全局部署,而且很有效率——当然是在它很简单的时候。  综合上述考虑,我们定义了一个名...

Global site tag (gtag.js) - Google Analytics