`
410063005
  • 浏览: 180003 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
社区版块
存档分类
最新评论

Java正则表达式简单应用

阅读更多

 

最近采用redbend的dm库进行DM方面的开发工作。库过程在ddms里面打印出类似于以下的log, DM报文难以区分(蓝色部分),不便于分析。于是用正则式从log中提取DM报文内容。

 

11-22 09:23:41.034: INFO/vDM (vdm)(4438): dm\sess\sess_setup.c.600: Replace command coding result 0x0

11-22 09:23:41.044: INFO/vDM (vdm)(4438): dm\sess\sess_utils.c.857:  metaToPcdata format='int'

11-22 09:23:41.044: INFO/vDM (vdm)(4438): dm\sess\sess_utils.c.864:  metaToPcdata type='org.openmobilealliance.dm.firmwareupdate.userrequest'

11-22 09:23:41.054: INFO/vDM (vdm)(4438): dm\sess\sess_utils.c.871:  metaToPcdata mark='indeterminate'

11-22 09:23:41.054: INFO/vDM (vdm)(4438): rdm\sess\sess_prot.c.86: ---------- Command 3 ALERT(1226)

11-22 09:23:41.054: INFO/vDM (vdm)(4438): dm\sess\sess_setup.c.676: FUMO notification alert command coding result 0x0

11-22 09:23:41.064: INFO/vDM (vdm)(4438): dm\sess\sess_setup.c.1317: SESS_setupSession() <<< send message

11-22 09:23:41.064: INFO/vDM (vdm)(4438): dm\sess\sess_comms.c.549: -------------------- Send message

11-22 09:23:41.074: INFO/vDM (vdm)(4438): dm\sess\sess_comms.c.559: Data to write out...

11-22 09:23:41.074: INFO/vDM (vdm)(4438): 0000  3C 3F 78 6D 6C 20 76 65 72 73 69 6F 6E 3D 22 31  <?xml version="1

11-22 09:23:41.094: INFO/vDM (vdm)(4438):    <?xml version="1

11-22 09:23:41.094: INFO/vDM (vdm)(4438): 0010  2E 30 22 20 65 6E 63 6F 64 69 6E 67 3D 22 55 54  .0" encoding="UT

11-22 09:23:41.094: INFO/vDM (vdm)(4438):    .0" encoding="UT

11-22 09:23:41.094: INFO/vDM (vdm)(4438): 0020  46 2D 38 22 3F 3E 3C 53 79 6E 63 4D 4C 20 78 6D  F-8"?><SyncML xm

11-22 09:23:41.094: INFO/vDM (vdm)(4438):    F-8"?><SyncML xm

11-22 09:23:41.094: INFO/vDM (vdm)(4438): 0030  6C 6E 73 3D 27 53 59 4E 43 4D 4C 3A 53 59 4E 43  lns='SYNCML:SYNC

11-22 09:23:41.104: INFO/vDM (vdm)(4438):    lns='SYNCML:SYNC

11-22 09:23:41.104: INFO/vDM (vdm)(4438): 0040  4D 4C 31 2E 32 27 3E 3C 53 79 6E 63 48 64 72 3E  ML1.2'><SyncHdr>

11-22 09:23:41.104: INFO/vDM (vdm)(4438):    ML1.2'><SyncHdr>

11-22 09:23:41.114: INFO/vDM (vdm)(4438): 0050  3C 56 65 72 44 54 44 3E 3C 21 5B 43 44 41 54 41  <VerDTD><![CDATA

11-22 09:23:41.114: INFO/vDM (vdm)(4438):    <VerDTD><![CDATA

11-22 09:23:41.124: INFO/vDM (vdm)(4438): 0060  5B 31 2E 32 5D 5D 3E 3C 2F 56 65 72 44 54 44 3E  [1.2]]></VerDTD>

11-22 09:23:41.124: INFO/vDM (vdm)(4438):    [1.2]]></VerDTD>

11-22 09:23:41.134: INFO/vDM (vdm)(4438): 0070  3C 56 65 72 50 72 6F 74 6F 3E 3C 21 5B 43 44 41  <VerProto><![CDA

11-22 09:23:41.134: INFO/vDM (vdm)(4438):    <VerProto><![CDA

11-22 09:23:41.134: INFO/vDM (vdm)(4438): 0080  54 41 5B 44 4D 2F 31 2E 32 5D 5D 3E 3C 2F 56 65  TA[DM/1.2]]></Ve

11-22 09:23:41.144: INFO/vDM (vdm)(4438):    TA[DM/1.2]]></Ve

11-22 09:23:41.154: INFO/vDM (vdm)(4438): 0090  72 50 72 6F 74 6F 3E 3C 53 65 73 73 69 6F 6E 49  rProto><SessionI

11-22 09:23:41.154: INFO/vDM (vdm)(4438):    rProto><SessionI

11-22 09:23:41.154: INFO/vDM (vdm)(4438): 00A0  44 3E 3C 21 5B 43 44 41 54 41 5B 35 42 5D 5D 3E  D><![CDATA[5B]]>

11-22 09:23:41.164: INFO/vDM (vdm)(4438):    D><![CDATA[5B]]>

11-22 09:23:41.164: INFO/vDM (vdm)(4438): 00B0  3C 2F 53 65 73 73 69 6F 6E 49 44 3E 3C 4D 73 67  </SessionID><Msg

11-22 09:23:41.164: INFO/vDM (vdm)(4438):    </SessionID><Msg

11-22 09:23:41.174: INFO/vDM (vdm)(4438): 00C0  49 44 3E 3C 21 5B 43 44 41 54 41 5B 31 5D 5D 3E  ID><![CDATA[1]]>

11-22 09:23:41.174: INFO/vDM (vdm)(4438):    ID><![CDATA[1]]>

11-22 09:23:41.194: INFO/vDM (vdm)(4438): 00D0  3C 2F 4D 73 67 49 44 3E 3C 54 61 72 67 65 74 3E  </MsgID><Target>

11-22 09:23:41.194: INFO/vDM (vdm)(4438):    </MsgID><Target>

11-22 09:23:41.194: INFO/vDM (vdm)(4438): 00E0  3C 4C 6F 63 55 52 49 3E 3C 21 5B 43 44 41 54 41  <LocURI><![CDATA

11-22 09:23:41.194: INFO/vDM (vdm)(4438):    <LocURI><![CDATA

11-22 09:23:41.194: INFO/vDM (vdm)(4438): 00F0  5B 68 74 74 70 3A 2F 2F 32 31 30 2E 32 31 2E 32  [http://210.21.2

11-22 09:23:41.204: INFO/vDM (vdm)(4438):    [http://210.21.2

11-22 09:23:41.204: INFO/vDM (vdm)(4438): 0100  33 36 2E 31 38 32 2F 7A 78 6D 64 6D 70 2F 64 6D  36.182/zxmdmp/dm

11-22 09:23:41.214: INFO/vDM (vdm)(4438):    36.182/zxmdmp/dm

11-22 09:23:41.214: INFO/vDM (vdm)(4438): 0110  5D 5D 3E 3C 2F 4C 6F 63 55 52 49 3E 3C 2F 54 61  ]]></LocURI></Ta

11-22 09:23:41.214: INFO/vDM (vdm)(4438):    ]]></LocURI></Ta

11-22 09:23:41.224: INFO/vDM (vdm)(4438): 0120  72 67 65 74 3E 3C 53 6F 75 72 63 65 3E 3C 4C 6F  rget><Source><Lo

11-22 09:23:41.224: INFO/vDM (vdm)(4438):    rget><Source><Lo

11-22 09:23:41.234: INFO/vDM (vdm)(4438): 0130  63 55 52 49 3E 3C 21 5B 43 44 41 54 41 5B 49 4D  cURI><![CDATA[IM

11-22 09:23:41.234: INFO/vDM (vdm)(4438):    cURI><![CDATA[IM

11-22 09:23:41.244: INFO/vDM (vdm)(4438): 0140  45 49 3A 30 30 30 34 33 39 34 38 35 36 34 32 39  EI:0004394856429

11-22 09:23:41.244: INFO/vDM (vdm)(4438):    EI:0004394856429

11-22 09:23:41.244: INFO/vDM (vdm)(4438): 0150  39 39 5D 5D 3E 3C 2F 4C 6F 63 55 52 49 3E 3C 2F  99]]></LocURI></

11-22 09:23:41.254: INFO/vDM (vdm)(4438):    99]]></LocURI></

11-22 09:23:41.254: INFO/vDM (vdm)(4438): 0160  53 6F 75 72 63 65 3E 3C 4D 65 74 61 3E 3C 4D 61  Source><Meta><Ma

11-22 09:23:41.254: INFO/vDM (vdm)(4438):    Source><Meta><Ma

11-22 09:23:41.264: INFO/vDM (vdm)(4438): 0170  78 4D 73 67 53 69 7A 65 20 78 6D 6C 6E 73 3D 27  xMsgSize xmlns='

11-22 09:23:41.264: INFO/vDM (vdm)(4438):    xMsgSize xmlns='

11-22 09:23:41.274: INFO/vDM (vdm)(4438): 0180  73 79 6E 63 6D 6C 3A 6D 65 74 69 6E 66 27 3E 3C  syncml:metinf'><

11-22 09:23:41.274: INFO/vDM (vdm)(4438):    syncml:metinf'><

11-22 09:23:41.274: INFO/vDM (vdm)(4438): 0190  21 5B 43 44 41 54 41 5B 33 30 30 30 5D 5D 3E 3C  ![CDATA[3000]]><

11-22 09:23:41.294: INFO/vDM (vdm)(4438):    ![CDATA[3000]]><

11-22 09:23:41.294: INFO/vDM (vdm)(4438): 01A0  2F 4D 61 78 4D 73 67 53 69 7A 65 3E 3C 4D 61 78  /MaxMsgSize><Max

11-22 09:23:41.294: INFO/vDM (vdm)(4438):    /MaxMsgSize><Max

11-22 09:23:41.294: INFO/vDM (vdm)(4438): 01B0  4F 62 6A 53 69 7A 65 20 78 6D 6C 6E 73 3D 27 73  ObjSize xmlns='s

11-22 09:23:41.294: INFO/vDM (vdm)(4438):    ObjSize xmlns='s

11-22 09:23:41.294: INFO/vDM (vdm)(4438): 01C0  79 6E 63 6D 6C 3A 6D 65 74 69 6E 66 27 3E 3C 21  yncml:metinf'><!

11-22 09:23:41.304: INFO/vDM (vdm)(4438):    yncml:metinf'><!

11-22 09:23:41.304: INFO/vDM (vdm)(4438): 01D0  5B 43 44 41 54 41 5B 31 30 30 30 30 30 5D 5D 3E  [CDATA[100000]]>

11-22 09:23:41.314: INFO/vDM (vdm)(4438):    [CDATA[100000]]>

11-22 09:23:41.314: INFO/vDM (vdm)(4438): 01E0  3C 2F 4D 61 78 4F 62 6A 53 69 7A 65 3E 3C 2F 4D  </MaxObjSize></M

11-22 09:23:41.314: INFO/vDM (vdm)(4438):    </MaxObjSize></M

11-22 09:23:41.324: VERBOSE/ELWidget(2705): goNext

11-22 09:23:41.324: VERBOSE/ELWidget(2705): setPos index=17

11-22 09:23:41.324: INFO/vDM (vdm)(4438): 01F0  65 74 61 3E 3C 2F 53 79 6E 63 48 64 72 3E 3C 53  eta></SyncHdr><S

11-22 09:23:41.334: INFO/vDM (vdm)(4438):    eta></SyncHdr><S

11-22 09:23:41.354: INFO/vDM (vdm)(4438): 0200  79 6E 63 42 6F 64 79 3E 3C 41 6C 65 72 74 3E 3C  yncBody><Alert><

11-22 09:23:41.354: INFO/vDM (vdm)(4438):    yncBody><Alert><

11-22 09:23:41.364: INFO/vDM (vdm)(4438): 0210  43 6D 64 49 44 3E 3C 21 5B 43 44 41 54 41 5B 31  CmdID><![CDATA[1

11-22 09:23:41.364: INFO/vDM (vdm)(4438):    CmdID><![CDATA[1

 

 思路很简单, 出现报文的位置都有一个规律, 先是一串16进制数,然后是这一串16进制数对应的字符串(报文内容)。根据这个规律, 得到以下正则式:

.*[[A-F][0-9]]{4}\\s{2}([[A-F][0-9]]{2}\\s{1}){1,16}(.*)

对比log中的规律, 首先是任意个字符,紧接着出现一个四位的16进制数, 接下来有两个空格, 然后出现两位的16进制数, 空格, 两位的16进制数, 空格, ...(最多16次, 最少1次), 最后是任意字符。 我们希望提取出来的是这最后的任意字符。 代码如下。

 

 

import java.io.BufferedReader;

import java.io.BufferedWriter;

import java.io.FileInputStream;

import java.io.FileNotFoundException;

import java.io.FileOutputStream;

import java.io.IOException;

import java.io.InputStreamReader;

import java.io.OutputStreamWriter;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

 

public class ParseVdmLog {

 

public static final int beginIndex = 46;

public static final int beginIndex2 = 96;

public static final String endString = "/SyncML>.";

/**

* @param args

* @throws FileNotFoundException 

*/

public static void main(String[] args) throws FileNotFoundException {

 

if (false) {

System.out.println("args.length = " + args.length);

for (String string : args) {

System.out.println(string);

}

}

if (1 != args.length) {

System.err.println("usage: java com.xxx.cm.ParseVdmLog srcfile destfile");

System.exit(-1);

}

String srcFile = "";

String destFile = "";

if (false) {

srcFile = "c:\\1.txt";

destFile = srcFile.replace(".txt", ".xml");

} else {

srcFile = args[0];

//destFile = args[1];

if (srcFile.startsWith("\"")) {

srcFile = srcFile.substring(1, srcFile.length() - 1);

}

destFile = srcFile.replace(".txt", ".xml");

}

BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream(srcFile)));

BufferedWriter bw = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(destFile)));

 

String line = null;

try {

while (null != (line = br.readLine())) {

if (line.contains("Data read in")) {

processStrings(br, bw, true);

//break;

} else if (line.contains("Data to write out")) {

processStrings(br, bw, false);

}

}

} catch (IOException e) {

e.printStackTrace();

}

try {

br.close();

} catch (IOException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

try {

bw.close();

} catch (IOException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

}

 

private static void processStrings(BufferedReader in, BufferedWriter out, boolean readIn) throws IOException {

/* String line = null;

String targetStr = "";

// 读取到的第一行为"0000  3C 3F 78 6D 6C 20 76 65 72 73 69 6F 6E 3D 22 31  <?xml version="1"

// 略过该行

while (null != (line = in.readLine()) && null != (line = in.readLine())) {

targetStr = line.substring(beginIndex).trim();

out.append(targetStr);

if (targetStr.equalsIgnoreCase(endString)) {

break ;

}

}

out.append("\r\n");

out.flush();

System.out.println("finish processReadIn()");*/

addComment(out, readIn);

String line2 = null;

String targetStr2 = "";

String patterns = ".*[[A-F][0-9]]{4}\\s{2}([[A-F][0-9]]{2}\\s{1}){1,16}(.*)";

Pattern reg = Pattern.compile(patterns);

while (null != (line2 = in.readLine())) {

Matcher m = reg.matcher(line2);

if (m.matches()) {

//System.out.println(line2);

//break;

//System.out.println(line2.substring(beginIndex2));

//targetStr2 = line2.substring(beginIndex2);

//.*[[A-F][0-9]]{4}\\s{2}([[A-F][0-9]]{2}\\s{1}){1,16}(.*)

// 提取组2中的子串, 即"最后的任意字符串"

targetStr2 = m.group(2);

//System.out.println(m.group(2));

out.append(targetStr2.trim());

if (line2.contains(endString)) {

// 遇到结尾

addComment(out, readIn);

}

}

}

out.newLine();

out.flush();

}

private static void addComment(BufferedWriter out, boolean readIn) throws IOException {

out.newLine();

if (readIn) {

out.append("<!------------------server response----------------------->");

} else {

out.append("<!------------------client request----------------------->");

}

out.newLine();

 

}

}

 

代码从保存在txt文件中的ddms log中提取目标内容(DM报文), 最后将内容保存在一个同名的xml文件中。 用eclipse格式化该xml文件, 最终得到整齐、容易阅读的DM报文。

 

 

 

<!------------------client request----------------------->

<?xml version="1.0" encoding="UTF-8"?>

<SyncML xmlns='SYNCML:SYNCML1.2'>

<SyncHdr>

<VerDTD><![CDATA[1.2]]></VerDTD>

<VerProto><![CDATA[DM/1.2]]></VerProto>

<SessionID><![CDATA[5B]]></SessionID>

<MsgID><![CDATA[1]]></MsgID>

<Target>

<LocURI><![CDATA[http://192.168.0.1/zxmdmp/dm]]></LocURI>

</Target>

<Source>

<LocURI><![CDATA[IMEI:000439485642999]]></LocURI>

</Source>

<Meta>

<MaxMsgSize xmlns='syncml:metinf'><![CDATA[3000]]></MaxMsgSize>

<MaxObjSize xmlns='syncml:metinf'><![CDATA[100000]]></MaxObjSize>

</Meta>

</SyncHdr>

<SyncBody>

<Alert>

<CmdID><![CDATA[1]]></CmdID>

<Data><![CDATA[1201]]></Data>

</Alert>

<Replace>

<CmdID><![CDATA[2]]></CmdID>

<Item>

<Source>

<LocURI><![CDATA[./DevInfo/Mod]]></LocURI>

</Source>

<Meta>

<Format xmlns='syncml:metinf'><![CDATA[chr]]></Format>

</Meta>

<Data><![CDATA[X500]]></Data>

</Item>

<Item>

<Source>

<LocURI><![CDATA[./DevInfo/Man]]></LocURI>

</Source>

<Meta>

<Format xmlns='syncml:metinf'><![CDATA[chr]]></Format>

</Meta>

<Data><![CDATA[123]]></Data>

</Item>

<Item>

<Source>

<LocURI><![CDATA[./DevInfo/Lang]]></LocURI>

</Source>

<Meta>

<Format xmlns='syncml:metinf'><![CDATA[chr]]></Format>

</Meta>

<Data><![CDATA[EN]]></Data>

</Item>

<Item>

<Source>

<LocURI><![CDATA[./DevInfo/DmV]]></LocURI>

</Source>

<Meta>

<Format xmlns='syncml:metinf'><![CDATA[chr]]></Format>

</Meta>

<Data><![CDATA[1.2]]></Data>

</Item>

<Item>

<Source>

<LocURI><![CDATA[./DevInfo/DevId]]></LocURI>

</Source>

<Meta>

<Format xmlns='syncml:metinf'><![CDATA[chr]]></Format>

</Meta>

<Data><![CDATA[IMEI:000439485642999]]></Data>

</Item>

</Replace>

<Alert>

<CmdID><![CDATA[3]]></CmdID>

<Data><![CDATA[1226]]></Data>

<Item>

<Meta>

<Format xmlns='syncml:metinf'><![CDATA[int]]></Format>

<Type xmlns='syncml:metinf'><![CDATA[org.openmobilealliance.dm.firmwareupdate.userrequest]]></Type>

<Markxmlns = syncml:metinf '><![CDATA[indeterminate]]></Mark>

</Meta>

<Data><![CDATA[0]]></Data>

</Item>

</Alert>

<Final />

</SyncBody>

</SyncML>

 

程序不复杂, 不过解决了开发中遇到的问题。 权当一个Java正则表达式的小练习。

0
1
分享到:
评论

相关推荐

    使用Java正则表达式实现一个简单的身份证号码验证

    ### 使用Java正则表达式实现一个简单的身份证号码验证 #### 一、背景介绍 身份证号码是中国公民的身份标识,由15位或18位数字组成(早期为15位,后改为18位)。其中,第18位是校验码,可能是数字0~9或者大写字母X。...

    Java 正则表达式库

    总之,Java正则表达式库为开发者提供了强大的文本处理能力,无论是简单的文本查找还是复杂的模式匹配,都能通过正则表达式轻松完成。配合自动化库,如`automaton-1.11-7`,可以进一步提升效率和性能。对于Java开发者...

    java正则表达式 过滤特殊字符的正则表达式

    本文详细介绍了 Java 正则表达式在过滤特殊字符方面的应用,并对正则表达式的基本概念和高级概念进行了详细的解释。同时,还提供了一个简单的示例代码,展示了如何使用正则表达式来过滤特殊字符。

    java正则表达式教程html版带目录

    Java正则表达式是Java编程语言中的一个强大工具,它用于模式匹配和字符串处理,尤其在数据验证、文本检索和替换等方面发挥着重要作用。本教程是专为初学者设计的HTML版,旨在帮助读者快速掌握Java正则表达式的概念和...

    java正则表达式.pdf

    ### Java正则表达式详解 #### 一、引言 正则表达式是计算机科学中的一个强大工具,用于处理文本数据。随着Java的发展,自J2SE 1.4版本开始,Java正式引入了对正则表达式的支持,并提供了一系列功能强大的API。本文...

    正则表达式 Java 判断字串是否合理

    根据给定的文件信息,我们可以总结出以下关于Java正则表达式的重要知识点: ### 1. 正则表达式简介 正则表达式是一种强大的文本处理工具,它能够帮助我们匹配、查找、替换等操作符合某种规则的字符串。在Java中,...

    JAVA 正则表达式(超详细)

    5. 使用 Java 正则表达式:使用 Java 正则表达式进行字符串模式匹配和字符串模式替换非常简单。Java 的 regex 包提供了详细的相关说明文档,使得正则表达式的使用变得更加容易。 6. 优点:Java 正则表达式具有许多...

    只验证数字和字母的正则表达式

    在提供的示例代码中,我们看到一个简单的登录页面,其中包含了一个名为 `AA` 的 JavaScript 函数,该函数用于验证用户输入的用户名是否符合上述正则表达式的规则。 ```javascript function AA() { var name = ...

    JAVA正则表达式实例教程.pdf

    ### JAVA正则表达式实例教程知识点详述 #### 一、正则表达式的定义与特点 **1.1 正则表达式是什么?** - 正则表达式(Regular Expression)是一种模式匹配语言,用于文本搜索和替换。它提供了一种简洁而灵活的方式...

    java-正则表达式-分组引用介绍

    正则表达式是计算机科学中一种非常强大的文本处理工具,在Java等编程语言中广泛应用于字符串匹配、搜索替换等场景。当需要对正则表达式的部分结果进行进一步处理时(如重复使用或修改),可以通过分组来实现这一目标...

    java正则表达式

    下面是一个简单的Java正则表达式应用示例,用于查找和替换字符串中的特定模式: ```java String text = "Java正则表达式是强大的文本处理工具"; Pattern pattern = Pattern.compile("正则表达式"); Matcher matcher...

    java 正则表达式大全 菜鸟也能玩转

    ### Java正则表达式大全:菜鸟也能玩转 在Java编程语言中,正则表达式是一种强大的工具,用于处理字符串的搜索、替换等操作。它能够帮助开发者更加灵活地进行文本处理工作。本文将深入介绍Java中的正则表达式基础...

    正则表达式不包涵特殊字符(除了 指定字符 以外)

    在探讨如何利用正则表达式来判断一个字符串除指定字符外不包含其他特殊字符之前,我们首先需要了解正则表达式的基本概念以及本场景中的具体需求。 ### 正则表达式简介 正则表达式是一种强大的文本处理工具,能够...

    用正则表达式提取SQL

    这类工具通常可以更准确地解析SQL语句,包括复杂的子查询、联接和窗口函数等,而不仅仅是基于正则表达式的简单匹配。它们通常提供API,允许开发者将SQL语句转换成易于处理的数据结构,以便进一步分析或执行。 总结...

    怎么利用Java正则表达式换模板

    Java正则表达式是处理文本的强大工具,尤其在替换模板方面有着广泛的应用。在Java中,我们可以使用`java.util.regex`包中的`Pattern`和`Matcher`类来实现字符串的匹配与替换。以下是一个详细解释如何利用Java正则...

    正则表达式.rar

    本资料压缩包包含了一系列关于Java正则表达式的视频教程,旨在帮助用户深入理解和熟练运用这一技术。 1. **正则表达式简介** - 正则表达式(Regular Expression)是由特殊字符和普通字符组成的模式,用于描述一...

Global site tag (gtag.js) - Google Analytics