`
datamachine
  • 浏览: 163539 次
社区版块
存档分类
最新评论

桌面端数据分析程序语言

阅读更多

  桌面端数据分析程序语言,其重点是使用方便且计算能力强。考察某种语言是否适合进行桌面端数据分析,可以用六个指标来衡量:应用环境、文件处理、文本和字符串处理、结构化数据处理、模型预测算法、其他非重点指标。
    

一、应用环境

  进行桌面数据分析的用户绝大多数都不是专业程序员,他们更习惯在windows下工作,他们缺乏专业程序员拥有的配置环境的技能,因此桌面端分析程序语言的应用环境应当足够简单,应当支持windows,应当易于安装部署。
  集算器和R语言这方面做得都不错,应用环境简单,直接安装即可使用;Python本身也问题不大,但经常要用到的Pandas包(加强Python计算能力)在linux下的安装较轻松,在windows下的安装却很复杂,对版本很挑剔;SSAS是微软产品,对Windows支持很好,但安装配置过程有些复杂。
    

二、文件处理

  TXT和XLS文件是日常工作中最容易产生出来的文件格式,对这两种文件格式的支持越好,则说明分析语言越好用。
  各分析语言一般都直接支持TXT,但XLS的情况复杂些,尤其是第三方模块的安装和版本兼容性。Excel和SSAS都是微软产品,因此SSAS可以无缝支持XLS。集算器、SPSS、SAS也不需要安装第三方包,可以直接访问XLS。Pandas的情况有点特殊,Pandas直接支持XLS,但Pandas本身就是第三方库函数,另外Pandas对某些版本的XLS支持不好。R需要安装第三方库函数和Perl运行环境,而R、第三方库函数、Perl,这三者的版本要匹配才行,安装过程很麻烦。
  读写操作方面,SSAS最易用,Pandas和R提供的参数较丰富。
  文件处理还要考虑对大文件的支持,比如边读边处理的能力。这方面集算器最擅长,代码也最简练。
    

三、文本和字符串处理

  原始数据有时不够规整,经常是半结构化或非结构化的,这时就需要对数据进行前期处理,从而形成易于使用的结构化数据,因此文本和字符串处理能力也是分析语言的考察重点。
  Python在这方面最擅长,R也不错,集算器稍次,SSAS最不擅长。
    

四、结构化数据处理

  在桌面端分析的数据事实上大多是结构化数据,因此结构化计算是桌面数据分析中最常见的计算形式,结构化计算能力也是桌面端数据分析程序语言的核心能力。
  集算器的设计目标就是结构化数据计算,因此在这方面最专业。R新加了数据框这种数据类型,但仍不够专业,特别在有序计算方面要弱于集算器。Pandas的数据框仿照R并做了优化,能力和R不相上下但会更好理解一些。相比之下,SPSS、SAS、SSAS,这三种工具的结构化计算能力偏弱。
 有序计算是指同期比、比上期、相对区间取数、分组中的排名、分组中取前后几名等算法。有序计算经常涉及到相对位置和跨行组,是桌面端数据分析中的典型问题。集算器天生具有序号,在有序计算方面表现最好。Python、R在这方面也很强,但它们以向量为基本元素,而不是记录,因此代码比较难懂,更适合科学家使用。
    

五、模型预测算法

  模型和预测主要用于科学领域,虽然在桌面端数据分析中不多见,但仍然是不可或缺的一项指标。
  R在这方面拥有最新和最丰富而且最成熟的第三方算法,SASS要简单易用但不够灵活,Python/Pandas一直在追赶模仿R,语法更易理解但成熟度还有差距,SAS和SPSS更为权威。相比之下,集算器几乎没有现成的模型预测算法。
    

六、其他非重点指标

  还有些非重点的指标在特定情况下也会被关注,比如对数据库的支持,绘图能力,对并行计算的支持。
  SASS对数据库支持最好,但不擅长文本文件、数据库、自定义数据之间的混合计算。集算器对数据库的支持也不错,对异构数据源之间也支持良好。Pandas、R、SAS、SPSS对数据库的支持一般,对异构数据源支持也不够好。
  SASS在绘图方面最美观,但灵活性不足。R、集算器、Pandas的灵活性足够强,内置的统计图也很多。
  并行计算方面,集算器内置并行计算引擎,配置方便,容易开发。R要通过第三方软件才能支持并行计算,而且配置复杂,开发困难。

0
3
分享到:
评论

相关推荐

    基于C#的AE+IDL二次桌面端程序开发.zip

    在本项目中,C#被用来作为主要的编程语言,构建桌面端应用程序的基础架构。 AE(After Effects)是Adobe公司的一款强大的视觉效果和动态图形软件,通常用于视频编辑和合成。在GIS领域,AE可以用于处理和展示遥感...

    python+Pyqt5+pandas+plt实现数据处理程序(桌面级应用)

    在"python+Pyqt5+pandas+plt实现数据处理程序(桌面级应用)"这个项目中,开发者结合了这些强大的工具,构建了一个全面的数据分析和处理平台。首先,让我们深入了解一下这些关键技术点。 1. Python:Python以其简洁...

    基于C#+AE构建GIS桌面端应用系统框架-全代码

    【标题】"基于C#+AE构建GIS桌面端应用系统框架-全代码"指的是利用C#编程语言和Esri公司的ArcEngine开发工具,构建一个适用于桌面环境的地理信息系统(GIS)应用系统框架。这个框架提供了基础架构,使得开发者可以...

    计算机应用软件开发的Java编程语言分析.pdf

    "计算机应用软件开发的Java编程语言分析" Java编程语言是一种广泛应用于计算机软件开发的编程语言。它具有跨平台、面向对象、动态加载等特点,广泛应用于 Android 应用开发、Web 开发、桌面应用开发等领域。 在...

    数据分析工具R语言入门

    R语言可以在不同的桌面系统上运行,提供了图形用户界面(GUI),使得非编程背景的用户也能方便地使用R进行数据分析。同时,RStudio等集成开发环境(IDE)的出现,进一步提高了R的易用性和效率。 ##### 4. 交互式使用R ...

    nao机器人桌面交互端源程序

    3. **编程语言**:NAO机器人支持多种编程语言,如Python、C++、Java等,开发者可以通过这些语言编写控制机器人的程序。 4. **软件框架**:Aldebaran提供了 Choregraphe 软件,这是一个图形化编程工具,使得非程序员...

    基于C#+AE构建GIS桌面端应用系统框架-

    本主题聚焦于如何利用C#编程语言与Adobe After Effects(AE)工具来构建一个GIS桌面端应用系统框架。下面将详细介绍这一过程涉及的关键知识点。 首先,C#是微软开发的一种面向对象的编程语言,广泛应用于Windows...

    C#数据分析

    在IT行业中,C#是一种广泛使用的编程语言,尤其在开发Windows桌面应用和.NET框架相关项目时。本项目“C#数据分析”显然利用了C#语言的强大力量,结合特定的图表控件来处理和展示人的一生不同阶段的基础健康数据,...

    最好的数据分析工具

    在压缩包中的“vsniffer-setup.exe”可能是某种网络监控或数据抓取工具的安装程序,这在网站数据分析中可能用于收集服务器日志或网络流量数据。这类工具可以帮助分析师获取原始数据,为后续分析提供素材。 在选择...

    PBI数据分析.pptx

    M 函数是 Power Query 编辑器的一种编程语言,用于实现数据准备和处理。M 函数严格区分大小写,每一个字母必须按函数规范书写,第一个字母都是大写。M 函数提供了多种数据处理功能,包括字符串处理、数字处理、日期...

    基于C#+AE构建GIS桌面端应用系统框架

    【标题】"基于C#+AE构建GIS桌面端应用系统框架" 涉及的主要知识点包括C#编程语言、Adobe After Effects(AE)软件以及地理信息系统(GIS)的应用。这一项目旨在利用C#作为主要开发语言,结合AE进行图形界面设计,...

    ArcGIS Engine控件添加地图实例.zip_GIS二次开发_arcgis桌面端_arcgis编程_shutvrq

    本教程聚焦于ArcGIS Engine控件在桌面端的应用,通过C#语言进行编程,利用Visual Studio 2010作为开发环境,帮助开发者实现自定义地图功能。 ArcGIS Engine是Esri公司提供的一个开发组件,它为程序员提供了创建GIS...

    大数据收集与分析中Python编程语言的运用研究.pdf

    Python编程语言因其简洁、易学、可扩展性好以及拥有大量丰富的库而成为大数据分析的优选语言之一。 首先,Python是一种面向对象、解释型的高级编程语言,它支持多种编程范式,如命令式、面向对象和函数式编程。...

    基于CAE构建GIS桌面端应用系统框架全代码

    它提供了一套丰富的API,支持多种编程语言,如C#,使得开发者能够利用这些API构建桌面、Web或移动平台的GIS应用。在本项目中,C#被选为编程语言,这是因为C#具有良好的性能、面向对象的特性以及与.NET Framework的...

    桌面精灵程序代码

    "桌面精灵程序代码"这个标题暗示了我们正在讨论的是一个用C++编程语言实现的软件应用,通常这种程序会在用户的桌面上提供便捷的服务或功能,类似于一个小型的助手。它可能包括自动执行任务、快速访问常用功能、提供...

    Java远程桌面程序

    在这个项目中,我们讨论的是使用Java编程语言实现的远程桌面解决方案。 Java作为跨平台的编程语言,提供了丰富的库和API来实现网络通信和图形用户界面(GUI)功能,使得开发远程桌面应用成为可能。这个项目可能是...

    C# 数据采集系统 智能采集 数据分析 整套源码

    C# 是一种由微软开发的面向对象的编程语言,被广泛应用于Windows平台上的应用程序开发,包括桌面应用、Web应用和移动应用。它拥有丰富的类库和强大的.NET框架支持,为开发高效、安全的软件提供了坚实基础。在数据...

    PlexusInterop以元数据为中心的语言无关的桌面应用程序互操作性框架

    通过元数据的使用和可扩展的设计,它为开发者提供了一个强大的工具,使他们能够在JavaScript和其他编程语言中实现复杂的桌面应用程序互操作场景。对于那些希望在桌面应用开发领域探索新可能性的开发者来说,Plexus ...

    网吧桌面公告程序 V0.5

    6. **公告历史记录**:程序可能保存公告的历史记录,便于管理员查看过往公告,进行数据分析或者复盘。 7. **用户反馈**:为了收集用户对公告的反馈,程序可能设有简单的反馈机制,允许用户对公告内容进行评价或提出...

    java 桌面聊天程序(学习实验版)

    【Java桌面聊天程序学习实验版】是一个以Java编程语言实现的桌面应用程序,旨在教授和实践网络通信技术,尤其是客户端-服务器通信模式,用于实现实时的聊天功能。这个项目不仅涵盖了基本的Java编程技巧,还涉及到...

Global site tag (gtag.js) - Google Analytics