目前在做的项目是一个类似于太平洋的产品报价系统(其实说白了就是一个仿太平洋的网站,产品数据全是摘录自太平洋),产品的参数分参数分类(主要参数、性能参数...),参数名称(型号、芯片组、CPU接口...),数据库里已经录好了产品的参数分类及参数名称,目前正在对着太平洋的产品库进行产品的参数录入,之前都是复制一个参数值了再粘贴到我们的网站里然后点击确定了进行参数录入的,某天觉得这种方法蛮麻烦,几万种产品的要录参数到什么时候啊,于是自己看了下太平洋的产品参数,如下图:
好像没发觉什么特别的地方,然后自己如下图的方式一次性把参数全复制了粘贴到记事本里,
呵呵,发觉什么了没,每条参数名称和参数值占一行,而且他们之间都是用空格格开的,(大部分是),这样的话我们可以通过一些字符串的处理,以空格为分界符把参数名称和参数值拆开,这样就得到最后我们所要的结果了,就能批量的把参数值插入到数据库里了。
试了一下用普通的字符串处理,觉得蛮麻烦的,于是就想到了正则表达式,也正好借此机会试试.NET中如何使用正则表达式吧,先把正则表达式写出来吧。最近从网上无意中找到的一个验证正则表达式的好软件(RegexBuddy),个人觉得蛮好用的,打开后界面如下:
注意画圈圈的那三个按钮,分配是 匹配、替换、分割,我们要用到的是替换按钮
点击Replace 和 Test 按钮,然后输入正则表达式及粘贴复制出来的参数名称及参数值,瑞在Test按钮上面那个框框里输入 $1 → $2 ,如下图:
熟悉正则的朋友应该知道,(.+) (.+)匹配 1个以上的任意字符后有个空格,空格之后再有1个以上的任意字符,加上括号是给匹配的结果进行分组$1和$2就表示第一组和第二组,下面的测试参数会变色就说明匹配我们写的正则表达式,每个匹配的结果用不同的颜色相隔表示,上面表示每一行都匹配我们写的正则表达式,然后我们如下图按下那个按钮,
得到下图结果
大家看到什么了,匹配出来了吧,不过有点不对劲,我们要的是把第一个空格之前的分为第一组,而匹配的结果却是把最后一个空格之前的分为第一组了,这就是正则表达式
贪婪匹配与懒惰匹配的区别,下图是我改了正则表达式之后匹配的结果,注意我把 PCI Express插槽 改成 PCI-Express插槽 ,把空格换成一个减号,这样才不至于替换后的结果是PCI → *****。
这样就得到了我们想要的结果,至于那个 PCI-Express插槽 ,我能想到的方法也只能是在更新数据库的时候判断一下,如果参数名称是 PCI-Express插槽 ,则更新数据库中 字段为 PCI Express插槽 的参数值。
既然正则表达式写出来了,那下面就来做ASPX页面的代码编写,在这里我只是把分析出的结果输出到界面上,新建ASPX页面,拉入一个文本框,一个按钮,一个标签,如图:
然后ASPX.CS的源码如下:
using System;
using System.Collections.Generic;
using System.Linq;
using System.Web;
using System.Web.UI;
using System.Web.UI.WebControls;
using System.Text.RegularExpressions; // 要使用正则表达式得导入此包
public partial class regTest : System.Web.UI.Page
{
protected void Page_Load(object sender, EventArgs e)
{
}
// 分析参数
protected void Button1_Click(object sender, EventArgs e)
{
Label1.Text = "";
string str = TextBox1.Text;
// 建立正则对象,可以加些杂七杂八的参数,如忽略大小写之类的
// 在这里我没加,想知道如何加的自己去GOOGLE
Regex reg = new Regex(@"(.+?) (.+)");
// 匹配,把结果放在MatchCollection集合里
MatchCollection mc = reg.Matches(str);
// 遍历集合,取出分组,即参数名称和参数值
foreach (Match m in mc)
{
Label1.Text += m.Groups[1].Value + " → " + m.Groups[2].Value + "<br />";
}
}
}
最后再预览页面,测试一下就得到分析出的结果了。
最后就是把分析出的结果与数据库中已经有的参数名称想比较,相同的就插入相应的参数值,只要注意一个那个 PCI EXPRESS插槽 的问题就行了。
发个图文并茂的贴子还真难啊,足足弄了2个半小时,真是个消磨时间的好方法!!!
以前装了个动易的CMS,发现里面有个“采集”的功能,好像是个自动收集新闻的玩意吧,不知道能不能“采集”到太平洋上的产品参数和对应的值,那样的话就太爽啦。。
现在我的这方法只是复制参数后进行字符串的拆分处理之类的,之前还得先找到相应的产品的,要是能自动采集产品的相关信息那就爽啦。。呵呵 。。
源码传上来给大家。。
此外本人有《精通正则表达式》和《实战正则表达式》两部视频,《精通》用的是JAVA语言来讲正则,《实战》用的是C#来讲正则,有需要的朋友可发邮件到164423073@qq.com索取,也可索取那个RegexBuddy的软件,个人觉得这软件太有用啦。。。
分享到:
相关推荐
【正则表达式】是编程领域中用于处理文本的强大工具,尤其在Microsoft .NET Framework及其在ASP.NET中的应用中扮演着重要角色。正则表达式能够帮助开发者验证用户输入、搜索字符串中的特定模式,以及进行复杂的文本...
本文将深入探讨VB.NET中的正则表达式以及如何通过源码实现一个正则表达式生成与测试的工具。 一、VB.NET中的正则表达式基础 1. 正则表达式类库:VB.NET中的Regex类库提供了一系列方法和属性,如Match、Matches、...
Asp.net 正则表达式 正则 正则表达式 正则表达式下载 正则下载 Asp.net 正则表达式下载
总结一下,在C++.NET中使用正则表达式,你需要包含必要的库,导入System和System::Text::RegularExpressions命名空间,然后利用Regex类提供的方法进行匹配、查找和替换等操作。同时,理解Match、MatchCollection、...
DotNet正则表达式测试工具,基于.net1.1开发,vista以上操作系统绿色免安装。 用于编写正则表达式时进行测试,支持正则选项(是否忽略大小写、是否多行模式)、支持正则替换
下面将详细探讨正则表达式的基本概念、在VB.NET中的应用以及如何使用它们进行文本匹配。 1. 正则表达式基础 - **模式匹配**:正则表达式是一种特殊的字符序列,用于定义字符串的搜索模式。 - **元字符**:如 `.`...
在ASP.NET(C#)的正则表达式测试工具中,用户可以输入自定义的正则表达式和待匹配的文本,然后工具会立即进行匹配测试。对于复杂的正则表达式,工具通常会提供以下功能: 1. **实时预览**:输入正则表达式后,工具...
### ASP.NET 中使用正则表达式提取 HTML 代码内的图片路径 #### 背景介绍 在 Web 开发中,经常需要处理 HTML 文档或字符串,例如从网页中提取特定的信息,比如图片链接等。ASP.NET 是一种广泛使用的 Web 应用开发...
在VB.NET中,正则表达式通过`System.Text.RegularExpressions`命名空间下的类来实现,主要涉及Regex类。 二、Regex类的核心方法 1. `IsMatch()`: 检查输入字符串是否与正则表达式匹配。 2. `Match()`: 返回第一个...
本文将详细介绍在ASP.NET中常用的正则表达式,帮助开发者理解和掌握如何使用这些表达式来解决实际问题。 #### 正则表达式概述 正则表达式(Regular Expression)是一种用于匹配字符串中字符组合的模式。通过定义一...
正则表达式(Regular Expression,简称Regex)是用于匹配字符串模式的一种强大工具,在软件开发中广泛应用,尤其是在数据处理和文本搜索替换场景。基于.NET的正则表达式编辑调试工具为开发者提供了一个直观且高效的...
C#.Net常用的正则表达式,包含数字、中文、邮箱、身份证号、电话号码、账号、密码等模式。
3. **分组与捕获(Groups and Capturing)**:使用`(`和`)`进行分组,可以对匹配的部分进行引用或捕获。 4. **选择与分支(Alternation)**:使用`|`来表示“或”的关系,如`a|b`匹配'a'或'b'。 5. **预查...
标题"PB实现的正则表达式"表明我们将关注的是在PowerBuilder中如何利用正则表达式进行编程。由于描述中提到"不支持中文",这可能意味着该实现可能没有包含对Unicode字符集的支持,因此可能无法处理中文字符。然而,...
本文将深入探讨VB.NET中如何使用正则表达式,并提供相关参考手册中的关键知识点。 首先,要使用正则表达式,我们需要导入`System.Text.RegularExpressions`命名空间。这样,我们就可以访问`Regex`类,它是VB.NET中...
标题中的“pb 使用正则表达式源码pbregexp”指的是在PowerBuilder(简称pb)环境中,利用名为“pbregexp”的正则表达式组件来实现源代码级别的正则表达式操作。PowerBuilder是一款流行的可视化的、面向对象的软件...
本教程将深入探讨如何使用C#.NET中的正则表达式(Regex类)来拆分字符串。 首先,我们需要理解C#中的`System.Text.RegularExpressions`命名空间,它包含了对正则表达式操作的支持。在使用正则表达式之前,你需要...