package com.file;
import java.io.BufferedReader;
import java.io.DataInputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileReader;
import java.io.InputStreamReader;
import java.util.ArrayList;
import java.util.List;
public class ResolveFiles {
public static String readFileContent(String filepath) {
//读取每一行保存在List 中
ArrayList<String> records=new ArrayList<String>();
try {
BufferedReader br = null;
// new BufferedReader(new FileReader(filepath));
InputStreamReader reader = new InputStreamReader(new FileInputStream(new File(filepath)),"GB2312");
br = new BufferedReader(reader);
//基元素: "sms,deliver,"10657502022321","","","2011.07.28 11:04","","彭元彬,朱宇英/CA1509北京首都机场-杭州萧山机场2011-07-31 07:55/起飞/总票款1420.0元/保险费0.0元/票号999-2155782847999-2155782848/请持有效身份证件到机场办理手续,如有疑问请致电4008100999-8[中国国航]"
String s,str; //每条数据
while((s = br.readLine())!=null){
//System.out.println("数据记录为:"+s);
records.add(s); //把每条记录添加到list中
System.out.println("我 要 看 到 的:"+s);
// String bString=s.replace("/",",(?=\")|(?<=\"),"");
// System.out.println("我 要 看 到 的bString:"+bString);
if (s.indexOf("/")>0) { //把航变信息排除 (不含"/")
String[] recArray = parseRecord(s); // 按”""“ 截取
if (recArray.length>=6) { //该条记录长度
String p=recArray[6]; //得到第六个数组
ArrayList<String> records_z=new ArrayList<String>();
records_z.add(p); //把每条记录的二级第五个元素添加到list中
System.out.println("================="+recArray[4]); //得到
String[] ps=parseRecord(p);//获取票号所属引号组
//子元素:"殷俊/CA4107成都双流机场-北京首都机场2011-08-05 10:00/起飞/总票款1350.0元/保险费0.0元/票号999-2155782063/请持有效身份证件到机场办理手续,如有疑问请致电4008100999-8[中国国航]"
for (int i = 0; i < ps.length; i++) {
System.out.println("P-P-P-P-"+ps[i]+"ps.length:"+ps.length);
System.out.println("ppppp---pppppp---pppp:"+ps[i].replace("/", "\",\""));
//截断
//按“/”截取值存入数组PP中
for (int j = 0; j < ps.length; j++) {
String[] pa=subRecord(ps[j]); // 按"/" 截取
//System.out.println(""+pa[]);
System.out.println("pa:"+pa.length);
//子元素:"陈超,缪小红,尹纤黛/CA1726广州白云机场-杭州萧山机场2011-07-29 18:20/起飞/总票款2310.0元/保险费0.0元/票号999-2155782014999-2155782015999-2155782016/请持有效身份证件到机场办理手续,如有疑问请致电4008100999-8[中国国航]"
for (int k = 0; k < pa.length; k++) {
String sk=pa[k]; //定义 存储
if (sk!=null) {
if (sk.indexOf("\"")==0) { //去掉开头的引号
sk = sk.substring(1,sk.length());
}
}
pa[k]=sk;
System.out.println("二级元素(5)pa."+k+":"+pa[k]);
}
if (pa.length>=5) { //子子元素: 票号999-2155782063...
System.out.println("二级元素(5)-子元素(5)pa:"+j+i+"-----"+pa[5]);
//对票号处理 票号999-2155782014999-2155782015999-2155782016 ...
String sr=pa[5].substring(2); //截取后如:999-2155782014999-2155782015999-2155782016 ...
int begin = 0;
int end = 14;
while(end<=sr.length()) {
String b = sr.substring(begin,end);
System.out.println("==========票号截取值==========:"+b);
begin += 14;
end += 14;
}
}
}
}
/**aaaaa
* */
//处理每一条记录生成SQL语句 并保存为对象
//"梁辰/CA4194北京首都机场-成都双流机场2011-09-14 22:00/起飞/总票款1100.0元/保险费0.0元/票号999-2155782995/请持有效身份证件到机场办理手续,如有疑问请致电4008100999-8[中国国航]"
ArrayList<String> record_zList=new ArrayList<String>();
for (int i = 0; i < records_z.size(); i++) {
String record=records_z.get(i);
String[] recArray_z = minusQuotation(record.split("/"));
for (int k = 0; k < ps.length; k++) {
String[] pa_z=subRecord(ps[k]); // 按"/" 截取
if (pa_z.length>=5) { //子子元素: 票号999-2155782063...
System.out.println("2ci二级元素(5)-子元素(5)pa:"+k+"-----"+pa_z[5]);
//对票号处理 票号999-2155782014999-2155782015999-2155782016 ...
String sr=pa_z[5].substring(2); //截取后如:999-2155782014999-2155782015999-2155782016 ...
int begin = 0;
int end = 14;
while(end<=sr.length()) {
String b = sr.substring(begin,end);
System.out.println("==========票号截取值z==========:"+b);
begin += 14;
end += 14;
}
}
}
for (int j = 0; j < recArray_z.length; j++) {
System.out.println(recArray_z[j]);
}
}
}
}
/*****
*
* 下面这段不可删除 请勿动
*
*
*
int i=0;
for ( i = 0; i < recArray.length; i++) {
System.out.println("二级元素"+i+": "+recArray[i]);
String yString=recArray[i];
if (i==recArray.length-1) {
str=recArray[i];
String[] subArray=subRecord(str);
//System.out.println("eeee"+subArray);
int pi=subArray.length-2;
for(int j=0;j<subArray.length;j++){
String sa=subArray[j];
if (sa != null) {
if (sa.indexOf("\"")==0) {
sa = sa.substring(1,sa.length());//去掉开头的引号
}
}
subArray[j]=sa;
System.out.println("二级元素(5)-子元素:"+j+":"+subArray[j]);
if (j==subArray.length-7) {
String subString=subArray[j];
String[] ssubArray=ssubRcord(subString);
for (int k = 0; k < ssubArray.length; k++) {
String st=ssubArray[k];
if (st != null) {
if (st.indexOf("\"")==0) {
st=st.substring(1,st.length());
}
}
ssubArray[k]=st;
System.out.println("==========二级元素(5)-子元素(0)k=========="+k+":"+ssubArray[k]);
}
System.out.println("yString:"+yString);
}
}
}
}
*
* 此段不可删除 请勿动
*
*/
}
} catch (Exception e) {
e.printStackTrace();
}
return null;
}
public static String[] parseRecord(String record) {
String[] recArray = record.split(",(?=\")|(?<=\"),");//按引号截取
//String[] recArray2 = record.
return recArray;
}
public static String[] subRecord(String subrString){
String[] subArray=subrString.split("/");//按斜杠截取
return subArray;
}
public static String[] ssubRcord(String sstr){
String[] ssubArray=sstr.split(",");//按逗号截取
return ssubArray;
}
/*
* 截取票号方法
* */
public static String[] subStrings(String sstrr){ //对票号截取处理
//String string="票号999-2155782014999-2155782015999-2155782016";
//String str="999-";
String sr=sstrr.substring(2);
int begin = 0;
int end = 14;
while(end<=sr.length()) {
String b = sr.substring(begin,end);
System.out.println(b);
begin += 14;
end += 14;
}
return null;
}
//批量执行SQL
public static int batchExecuteSql(ArrayList<String> sqlList) {
System.out.println("接下来可以执行SQL语句或保存对象");
System.out.println("========批量执行SQL语句==========");
System.out.println("将所有语句加入到Statment stat中");
for (int i = 0;i<sqlList.size();i++) {
String string = sqlList.get(i);
System.out.println("通过stat.addBatch(sql)来加入语句"+i+": '"+string+"'");
}
System.out.println("通过stat.executeBatch()来执行所有的SQL语句");
System.out.println("========批量执行SQL语句结束==========");
//int count = stat.executeBatch();
//return count;//返回执行的语句数量
return sqlList.size();
}
//生成每条记录的SQL
public static String getRecordSql(String[] recArray) {
if (null==recArray) {
return null;
}
String recordSql = "insert into tablename (sms,no,time) values('"+recArray[0]+"','"+recArray[2]+"','"+recArray[5]+"')";
return recordSql;
}
/**
* 去掉数组中每个元素的开头和结尾的引号
*
* */
public static String[] minusQuotation(String[] recArray) {
for (int i = 0; i < recArray.length; i++) {
String str = recArray[i];
if (null!=str) {
if(str.indexOf( "\"")==0)
str = str.substring(1,str.length());//去掉开头的分号
if(str.lastIndexOf("\"")==(str.length()-1))
str = str.substring(0,str.length()-1); //去掉最后的分号
}
recArray[i] = str;
}
return recArray;
}
public static void main(String[] args) {
String filepath = "E:\\sxySMS\\smstest(1).txt";
readFileContent(filepath);
String s="票号999-2155782014999-21557820,15999-2155782016";
String[] b=s.split(",");
for (int i = 0; i < b.length; i++) {
System.out.println(b[i]);
}
}
}
分享到:
相关推荐
这个压缩包“robots.txt解析器_Ruby_下载.zip”显然包含了一个使用Ruby编程语言编写的用于解析`robots.txt`文件的工具。让我们深入探讨一下`robots.txt`文件、Ruby编程语言以及解析器的相关知识。 `robots.txt` ...
本资源"**C语言txt文件解析.zip**"提供了一种使用C语言读写TXT文件的方法,特别关注如何处理字符串拆分,以及根据行列号选取特定内容。下面将详细介绍这个主题及其相关知识点。 首先,`readTXT.cpp`是C++源代码文件...
当我们谈论“Winform测试数据解析”时,我们关注的是如何在WinForm应用中处理和解析测试数据,这通常涉及到数据的读取、处理和展示。在这个场景下,“读写文件”标签暗示我们将探讨如何通过WinForm来读取和写入文件...
`JavaTxt解析文本代码或输出指定编码文本`这个主题聚焦于如何使用Java有效地识别和处理不同编码类型的TXT文件。这个工具类,如`TxtEncodingDetect.java`所示,提供了一种方法来检测和解析文本文件的编码格式,比如...
总之,这个资源提供了COCO数据集2017版针对YoloV5训练和评估的预处理标签文件,以及可能的原始图像数据,简化了数据准备过程,使得研究人员和开发者能更便捷地利用COCO数据集来训练和测试YoloV5模型,提升目标检测...
2. "Readme_download.txt" - 这是下载和安装说明,可能包含了软件的版本信息,系统要求,安装步骤,以及任何需要注意的事项。在安装和使用软件之前,应仔细阅读此文件以确保顺利进行。 3. "376_2报文解析器V1.0.exe...
软件介绍: QGDW1376.2解析可打开报文进行解析,结果输出保存。GDW1376_2.dllQGW1376_2.csprojQGW1376_2.exeUpgradeLog.htm测试报文.txt内附测试报文。
在IT行业中,Core Dump是一种非常重要的调试手段,它记录了程序在崩溃时内存的状态,包括进程的寄存器信息、堆栈轨迹以及...在实际开发过程中,结合日志、测试和代码审查,利用这类工具可以极大地提高故障排查效率。
"匣子解析v1.3.9 专业版.txt打包整理.zip"是一个压缩包文件,其中包含的内容主要是关于“匣子解析”的专业版版本1.3.9的一些文本信息。这个版本可能是某个软件或工具的更新,专注于数据解析或者信息处理。在IT行业中...
2. **数据解码**:DWG文件是以二进制形式存储的,需要将二进制数据转换为可理解的格式。这包括解析整数、浮点数、字符串等基本类型,以及处理位字段和压缩数据。 3. **结构解析**:理解DWG文件的段(Section)和...
“file.txt”文件可能是XML数据的示例,或者用于测试解析器性能和正确性的输入文件。开发者可以通过这个文件测试解析器是否能正确解析XML文档的元素、属性、文本内容以及处理命名空间、实体引用等特性。 解析XML的...
这篇描述提到的"Python-用于解析包含Mimikatz输出的txt文件的Python脚本"是一个专门设计用来处理这些txt日志的工具。通过编写这样的脚本,我们可以自动化处理和分析Mimikatz生成的数据,从而更高效地识别潜在的安全...
2. MeterProtocolDebugger.exe:这是主要的测试软件执行文件,用于进行电表通信协议的调试和测试。 3. setup.ini:安装配置文件,可能包含软件安装过程中的设置信息和默认参数。 4. mnovsctrlpsw.txt:可能存储着...
2. **index.html**:通常是网站的主页面,可能包含了解析服务的前端界面,用户可以通过这个页面输入蓝奏云链接进行解析。 3. **jx.php**:这是一个PHP脚本,很可能实现了解析逻辑。PHP是一种常用的服务器端脚本语言...
学习一种编程语言,如Java或Python,这有助于编写脚本、解析日志等。 #### 3.2 了解操作系统原理 熟悉至少一种操作系统(Windows/Linux),理解其内部机制及系统调优方法。 ### 四、数据库性能监控 #### 4.1 SQL ...
"evaluationlicense.txt"文件可能是XML解析器的许可证信息或者测试用例的一部分,它通常包含关于软件授权和使用条件的法律条款。 至于"Test"目录,它可能包含了一些测试用例,用于验证`Markup`类的功能是否正确。...
本篇将详细介绍如何在Java环境下创建PDF文件以及将PDF解析为TXT文本。 首先,我们来看如何使用Java创建PDF文件。通常,我们可以借助Apache PDFBox、iText或 Flying Saucer 这样的第三方库。以Apache PDFBox为例,它...
具体到本案例,“测试报文.txt”显然是一种用于移动开放平台的报文测试文件,它的主要功能是提高开发效率。 ### 二、XML格式的理解与解析 #### 1. **XML(Extensible Markup Language)** XML 是一种标记语言,...
总结来说,"vue2-org-tree-节点增删改查和上传txt文本解析"项目关注的是使用Vue2的组织结构树组件实现数据操作,并处理从文本文件导入数据的问题。在实现过程中,确保每个节点都有父级ID是至关重要的,这有助于优化...
来自于NLPCC2013,解析后每一行为 情感\t句子 共有七类情感,且分布不均衡,划分训练集和测试集后数据数量为 1488 anger_data.txt 186 anger_test.txt 186 anger_val.txt 8:1:1 2459 disgust_data.txt 307disgust_...