`

结合h2的csvread辅助文本统计分析

 
阅读更多

最近一直做一些数据分析

如:

在一些第三方工具上导出一些csv/xls格式的文件,然后分析里面的内容,做过滤合并或统计等,用groovy习惯了,所以处理些文本还是小菜的,就是要做统计的时候,不用sql真麻烦啊,本来一个group by的,自己用代码写就很蹩脚,如

 

list.clone().unique{it.id}.each{

  int num = list.count{one -> it.id == one.id}
  ***
}

 

 

groovy的db组件很8错的,弄一个内存数据库,可以很容易实现文本和sql结合做数据,就没必要每次都整理文件导入数据库了,而且sql提供的string方法就灵活性而言不如动态语言

 

代码原语如下

import groovy.sql.Sql

def p = [
  url:'jdbc:h2:mem:test', 
  u:'sa', 
  p:'', 
  driver:'org.h2.Driver'
]
def db = Sql.newInstance(p.url, p.u, p.p, p.driver)

try {
	db.execute('''
	create table temp ();
	'''
	)
	String sql = '''
		select a.flag, a.dat, count(1) as num from csvread('test.csv') a 
			group by dat, flag
	'''
	db.rows(sql).each{
		println it.DAT.padRight(20) + it.FLAG.padRight(10) + it.NUM
	}
}finally {
    db.close()
}

 

 

 

分享到:
评论

相关推荐

    Matlab基本知识-实用统计分析方法.pdf

    Matlab提供了方便的文件操作函数,如load和save用于加载和保存工作空间变量,csvread和csvwrite用于读写CSV文件,fopen、fprintf等用于读写文本文件。 7. 高级编程技术 包括面向对象编程、错误和异常处理、性能优化...

    data-input-and-export.zip_40_统计分析

    "data-input-and-export.zip_40_统计分析"这个压缩包文件显然聚焦于40个具体案例,教你如何有效地在MATLAB中处理数据,特别是进行统计分析。下面我们将深入探讨MATLAB的数据导入与导出以及统计分析的相关知识点。 ...

    csvread.cs

    csvread.cs

    readwrite_to_file_csvread_

    CSV(Comma Separated Values)是一种常见的数据交换格式,它以纯文本形式存储表格数据,便于不同程序间的数据交换。WinCC是西门子推出的一款人机界面(HMI)软件,常用于工业自动化系统的监控。 描述中的"CSV Read...

    matlab中的csvread函数和csvwrite函数.pdf

    MATLAB 中的 csvread 函数和 csvwrite 函数 MATLAB 提供了两个非常有用的函数:csvread 和 csvwrite,分别用于将 CSV 文件导入到 MATLAB 中和将向量导出到 CSV 文件中。在 Kaggle 练习赛中,遇到了要将 CSV 文件在 ...

    MATLAB统计分析与应用: 数据的导入与导出

    在MATLAB中,数据的导入与导出是数据分析的基础步骤,对于进行统计分析至关重要。MATLAB提供了多种方式来处理各种格式的数据,使得用户能够轻松地将数据引入工作空间或者保存到文件中。以下是对MATLAB在数据导入和...

    MATLAB与统计分析课程 MATLAB教案及实用程序 第04章-文件操作 共48页.pptx

    在统计分析中,文件操作尤其重要,因为我们需要加载数据集,进行分析后可能还需要保存中间结果或最终报告。MATLAB提供了强大的工具,如`load`和`save`,以及数据处理函数,如`readtable`和`writetable`,来方便地...

    matlab中的csvread函数和csvwrite函数.docx

    MATLAB中有两种重要的函数用于读写CSV文件,分别是csvread函数和csvwrite函数。下面我们将对这两个函数进行详细的介绍。 csvread函数 csvread函数用于将CSV文件读取到MATLAB中的矩阵中。该函数的基本语法为: M =...

    matlab数理统计数据分析:18 matlab导入数据(含教学视频).zip

    在数理统计分析中,MATLAB是一个非常强大的工具,它提供了丰富的函数和工具箱来处理各种数据。本教程主要关注如何在MATLAB中导入数据,这对于进行数据分析是至关重要的第一步。MATLAB支持多种数据格式,包括文本文件...

    MATLAB实现txt文本数据分离的源程序代码.zip

    4. **数据处理**:可能包括数据清洗、转换、统计分析等步骤。 5. **关闭文件**:使用`fclose`函数关闭文件,释放系统资源。 源码可能还包含了错误处理和性能优化的细节,例如使用预分配提高读取速度,或者处理文件...

    MATLAB使用文本文件.pdf

    MATLAB中读取文本文件主要使用`textread`、`csvread`、`importdata`等函数,而写入则使用`textwrite`、`csvwrite`。对于大量数据,`dlmread`和`dlmwrite`更为高效,它们专门用于处理以分隔符(如逗号或制表符)分隔...

    matlab数理统计数据分析:6 运算方法(含教学视频).zip

    本资源"matlab数理统计数据分析:6 运算方法(含教学视频).zip"包含一系列关于运用MATLAB进行数理统计分析的教学内容,旨在帮助用户掌握如何高效地使用MATLAB工具进行数据处理、统计运算和结果解释。以下将详细介绍...

    matlab中使用文本文件(.txt)进行数据存取的技巧总结.docx

    在MATLAB中,数据存取经常涉及到文本文件(如.txt文件),这主要是因为它们易于创建、查看和共享。本文将重点介绍如何在MATLAB中读取和写入文本文件,尤其是涉及的一些技巧。 首先,我们要了解文本文件和二进制文件...

    MATLAB实现txt文本数据分离的源程序代码.rar

    在MATLAB中处理文本数据是一项常见的任务,尤其是在数据分析、机器学习和信号处理等领域。这个压缩包文件"MATLAB实现txt文本...通过这个源程序代码,学习者可以深入了解如何在MATLAB环境中有效地处理和分析文本数据。

    Matlab读取CSV文件

    Matlab 读取 CSV 文件 Matlab 读取 CSV 文件是 Matlab 编程语言中的一种常见...使用 csvread 函数和 textscan 函数可以轻松地读取 CSV 文件中的数据,并将其存储在 Matlab 变量中,以便进行进一步的数据处理和分析。

    将源文件读入matlab后二进制输出到文本文件

    最常用的是`load`函数,用于加载.mat文件,或者`textread`和`csvread`,用于读取文本或CSV文件。例如,如果你的源文件是一个文本文件,可以使用`textread`: ```matlab data = textread('sourcefile.txt', '%s', ...

    MATLAB读取文本格式数据.docx

    在MATLAB中,读取和写入文本格式的数据是一项常见的任务。文本文件,尤其是`.txt`格式,是一种普遍的数据交换格式,易于创建、修改和共享。本文将详细讲解使用MATLAB处理文本文件的关键技巧,主要关注数据的读取,...

    MATLAB使用文本文件.docx

    6. 对于非结构化文本文件,如CSV,MATLAB的`csvread`和`csvwrite`函数可以方便地进行读写操作。而对于更复杂的文件格式,如Excel,MATLAB的`xlsread`和`xlswrite`函数则更为适用。 在处理文本文件时,需要注意文件...

    基于Matlab的船舶流量统计软件的研发与应用.zip

    在本项目中,“基于Matlab的船舶流量统计软件的研发与应用”主要关注的是利用Matlab这一强大的数值计算和数据处理工具来设计和实现一个专门针对船舶交通流量进行统计和分析的软件系统。Matlab,全称Matrix ...

Global site tag (gtag.js) - Google Analytics