阅读更多

3顶
0踩

互联网

转载新闻 Wikipedia 将来能否成为一个开发平台?

2009-02-25 11:12 by 副主编 zly06 评论(0) 有3960人浏览

COMSHRAP CMS写道:维基百科(Wikipedia)中的内容增长速度正在放缓,规模原本已经很小了的活跃编辑的数目也在下滑,Jimmy Wales 呼吁编辑们审查的内容越来越多,进一步阻碍了内容的增长。然而 Wikipedia 新鲜内容的减少并不意味着它的死亡,Wikipedia 拥有一个庞大的结构数据库,这是一个尚未被发现的宝藏。

Wikipedia 中的数据有大量来自用户创建,还有更多数据可供开发者进行分析。

SlumdogMillionaire.jpg

上图: 借助 Wikidashboard 浏览器扩展获得编辑历史记录 Edit history

这个快速成长的由用户贡献内容的知识库目前也许还处于青春期,Wiki 的发明者 Ward Cunningham  认为 Wales 要求审查内容的努力是一种不可避免的成熟表现,虽然这两种情形他都未必喜欢,未必代表 Wiki 的方向。然而 Wikipedia 数量庞大的知识库却为开发者带来了各种价值。

目前 Wikipedia 还没有 API 提供,然而它的数据却可以轻松访问,可以被下载到本地进行处理,最近,一个叫做 WikiXMLDB 的项目开始推出 XML 化的 Wikipedia,另外值得一提的还有 DBPedia,该项目将 Wikipedia 中的数据转换成结构数据库。人们开始用各种各样的方式访问这些数据并发现了一些实用价值。如果 Wikipedia 能推出几个正式  API,相信会像《纽约时报》推出 API 一样让人兴奋。

人们可以拿 Wikipedia 的数据做什么?

将 Wikipedia 作为一个重要的知识源

早期,主流媒体谈到 Wikipedia 的时候,多是对一些参与者感兴趣,那些留着及膝长须,住在新墨西哥的流浪公园的家伙喜欢发一些关于天文或厨艺的文章。Wikipedia 帮助人们释放出那些埋藏在大脑中的知识,对这些人系统地发掘只是建立在 Wikipedia 之上的众多价值之一。

Palo Alto 研究中心最近设计了一个叫做 WikiDashboard 的程序,这个工具可以分析任何一篇 Wikipedia 文章最近的修改历史。Paul Irish 曾是一个著名在线音乐博客站点的编辑,最近他设计了一个 Greasemonkey 脚本  可以直接在 Wikipedia 页面访问那些数据。

wikiragescreen.jpg

将 Wikipedia 作为新闻雷达

Wikipedia 对时事非常关注,一个叫 WikiRage 的站点根据 Wikipedia 文章被修改的频度来衡量某个话题的重要性。RWW 曾推出这样的文章,非广告目的的数据挖掘将来会很盛行,以及 Facebook 的情感引擎会很大。Wikipedia 的编辑的频度比起 Twitter 和 facebook 来说要小得多,但可能拥有很高的价值,最终会是社会媒体数据挖掘的一个重要补充。

最佳用例:平衡 Wikipedia 的结构数据

上个月,RWW 有篇文章提到,Google 好像在某些搜索结果中推出语义的结构数据,这些数据有的是 Google 自己分析的,有些很显然来自 Wikipedia,这些结构化数据会带来很多实用价值。

推荐服务网站 MSpoke 正在这样做,这个商业新闻跟踪服务使用 Wikipedia 训练它的推荐引擎。MSpoke 的的 Sean Ammirati 说,Wikipedia 的内容澄清页对帮助他们分清两个迈克尔乔丹中哪个是篮球明星,哪个是统计学家非常有帮助。在商业推荐服务中,这些信息非常有用。

通过对 Wikipedia 大量词汇的分析,MSpoke 已经可以快速理解他们从网络上发现的文章。这也是 Metaweb 和 Powerset 一直在做的事,然而 Powerset 已经被微软收购,而据传闻 Metaweb 前景也不太妙。

Wikipedia 可以让自己更多成为一个开放的数据库,而不是一个供众人修改的站点,也可能 Wikipedia 目前还没有足够流行到可以做出这样的跨越,或者它的政治纠纷,以及热情的衰退来得太早,到底怎样只有让时间来说明一切了。

 

英文原文:http://www.readwriteweb.com/archives/could_wikipedias_future_api.php

 

 

来自: comsharp
3
0
评论 共 0 条 请登录后发表评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • 程序构架及命名规范.pdf

    ABB机器人程序介绍框架与命名规范标准。

  • HTML基本功:FRAME标签的使用

    工作很多年了,可是基本上没有直接写过HTML页面.最多就是维护修改过一下别人写了.     最近在做一个项目的基本设计的时候,要提案给客户的画面样例.因此开始自己写假的HTML画面.为了节省时间,其他人都只写画面的主要内容部分.而画面的头部,底部以及主菜单,子菜单都用frame来体现.     这样的话就有一个点击菜单,要动态更新子菜单的动作.   比如:

  • windows系统打开指定命令行窗口的方法汇总

    前言(日常废话) 今天看视频看到了一个新的命令行窗口打开方法,想着原来命令行窗口的打开方式有那么多种,做个记录,此贴会持续更新(学习到了新的命令行窗口打开方法时) 正文 本文假设环境:想打开如下图所示的文件夹的命令行窗口 目前我所知道的有如下三种方式: 一、通过根目录CD 这个方法是最基本正常的打开命令行窗口的方法 首先,通过win键+R打开电脑的运行框(win键就是ctrl和Alt中间夹着的那个) 然后,在运行框内输入cmd进入根目录的命令行窗口内 接着通过cd命令一步一步的进入到目标文件夹即可

  • 开发命名规范与框架架构

    一、基本规则1、代码清晰又清晰又简洁的代码当然是最好的了,但简洁不如清晰重要。总的讲不要使用单词的简写,除了非常常用的简写以外,尽量使用单词全称。API的名称不要有歧义,一看你的API就知道是以什么方式做了什么事情,不要让人有疑问!2、一致性代码保持一致,例如:创建UI相关的方法,可以使用统一的方法命名,所见即所得,见表知其意,这样,既保证了代码的一...

  • JavaScript 技术篇-使用js代码获取浏览器窗口标题名,js获取页面URL地址

    JavaScript 技术篇-使用js代码获取浏览器窗口标题名,js获取页面URL地址。 用 Google 页面来举例子,Google 是它的窗口标题名,https://www.google.com是它的页面 url 地址。 document.title 可以用来获取窗口标题名。 location.href 用来获取它的页面URL地址。

  • js 获取当前页面名称

    // 取当前页面名称(不带后缀名) function pageName() { var a = location.href; var b = a.split("/"); var c = b.slice(b.length-1, b.length).toString(String).split("."); return c.slice(0, 1); } /...

  • 窗口命名(tkinter,Python3.x)

    窗口命名

  • 如何改变窗口标题(窗口命名)

      一·单文档接口(SDI)类型窗口标题的改变    首先,我们来看Windows SDI类型窗口标题栏的结构形式。结合具体例子说明:用VC的AppWizard创建一个名为“SDITitle”的单文档类型的工程,创建完工程后,编译运行该工程,程序主窗口标题形式如下:    文档标题 主窗口标题    1·文档标题的改变    文档标题在是由工程中相应的文档类所控制的,因此我们可以利用SetTitl

  • JavaScript窗口功能指南之命名窗口和框架

    当你创建一个框架结构的文档时,标记的NAME属性定义了每一个框架的名字,如下:               在例子中,文档包含2个框架:left和right。在文档toolbar.html中,链接代码就象下面的一样:   About Us   Feedback   注意, 标记同样支持TARGET属性,它定义了响应表单的目标窗口。而标记则指明了文档中所有链接的通

  • 框架命名空间

    命名空间:相当于虚拟目录目的:是为了自动加载类 初始命名空间:Library根命名空间: 第一部分:Library下面的所有文件夹 第二部分:应用程序模块名 TP框架下所有类都要写命名空间写命名空间怎么写: 从根开始写,写到该文件所在的目录为止。 用命名空间怎么用:use 从根开始写,写到类名为止。 不适用use的情况下怎么使用命名空间: 从初始命名空间开始找,到类名为止。 new \Home\...

  • 千万要注意spring中的命名规范

      在SPRING的IOC中,一定要注意大小写,比如 public class AdminFacadeImpl implements AdminFacade {   private AdminDAO adminDao; public AdminDAO getAdminDao() {   return adminDao;  }  public void setAdminDao(AdminDAO ad...

  • Java增加窗口

    import java.awt.Frame; /** * 增加窗口 * @author Lixiangjian * */ public class BallGame extends Frame{ void launchFrame(){ //设置窗口大小 setSize(700,600); //setLocation()是JFrame里面的方法,设置控件在窗体里初始化的位置

  • MySQL命名窗口及窗口函数的限制

    原文地址: https://dev.mysql.com/doc/refman/8.0/en/window-functions-named-windows.html https://dev.mysql.com/doc/refman/8.0/en/window-function-restrictions.html 译文: 12.21.4Named Windows 窗口可以被定义和给定能够在...

  • MySQL 8.0 窗口函数的语法及使用详解(非常细)

    MySQL 官方文档:https://dev.mysql.com/doc/refman/8.0/en/window-functions.html 概述 窗口函数常用的三大功能:分区、排序、计算。 窗口函数 返回结果 ROW_NUMBER() 当前行在其分区内的序号,例如:1,2,3,4… RANK() 当前行在其分区内的排名 (有间隔),例如:1,2,2,4… DENSE_RANK() 当前行在其分区内的排名 (无间隔),例如:1,2,2,3… PERCENT_RANK() 当前值在其分区内的百分

  • windows窗口基本代码详细解析

    /*下列注释函数均在平台SDK文档中说明,并在不同的头文件中声明,其中绝大多数在WINUSER.H中声明。*/ #include LRESULT CALLBACK WndProc (HWND, UINT, WPARAM, LPARAM) ; // 窗口过程; int WINAPI WinMain (HINSTANCE hInstance, HINSTANCE hPrevInstan

  • Spring框架版本命名规则

    常见软件的版本号命名 软件 升级过程 说明 Linux Kernel 0.0.1 1.0.0 2.6.32 3.0.18 ... 若用X.Y.Z 表示,则偶数Y 表示稳定版本,奇 数Y 表示开发版本。 Windows Windows 98 Windows 2000 Windows XP Windows 7 ... 最大的特点是杂乱无章,毫无规律。 SSH Client 0.9.8 Op.

  • input、select、textarea元素

    <html> <body> 名字:<input type = "text" name = "username"/><br/> <!--value = 请在这里输入名字--> 密码:<input type = "password" name = "pwd"/><br/><br/> *****...

  • java怎么设置窗体title_自定义Java窗口标题栏菜单

    我试图允许用户在Java中更改窗口的标题,而无需向窗口本身添加组件.我实际上正在尝试使用JInternalFrame进行此操作,但是图解决方案应该与JFrame类似.我只是想在右键单击窗口标题栏时弹出的上下文菜单中添加一个附加菜单项.例如,下面的Set标题:此示例在Windows XP上运行,但也许有一种方法可以独立获取窗口上下文菜单OS,这可能类似于SystemTray.getSystemTra...

  • Javascript window.open新窗口命名问题

    一般使用window.open(pageURL,windowname,parameters) ;打开新窗口,但是我使用过程中遇到一个小问题,代码如下: window.open("distribution-plan!report.action","distribution-sum"); 在FireFox 9.0.1下能打开新窗口,但是在IE8下提示脚本错误,折腾了半天无意间修改了新窗口名称,di

Global site tag (gtag.js) - Google Analytics