- 浏览: 611854 次
- 性别:
- 来自: 卡哇伊
文章分类
- 全部博客 (299)
- C# (25)
- Java (1)
- WinForm (0)
- Asp.Net (86)
- Jsp (2)
- Php (1)
- Web Service (0)
- Desgin Patterns (19)
- Data Structure & Algorithms (1)
- SQLserver (41)
- Mysql (0)
- Oracle (2)
- Javascript (50)
- Ajax (10)
- Jquery (1)
- Flex (0)
- Regular Expression (5)
- DIV+CSS+XHTML+XML (18)
- Software Test (0)
- Linux (0)
- Utility (17)
- Net Digest (4)
- windows 2003 (10)
- Other (4)
- English (1)
- IT Term (1)
最新评论
-
w497480098h:
学习了 很好谢谢
SQL Server下无限多级别分类查询解决办法(简单查询树形结构数据库表) -
main_fun:
确实不错
iframe自适应高度 -
jveqi:
...
DBA -
mxcie:
其它版本没有确认,今天使用vs2003时,其.sln文件也需要 ...
彻底删除项目的VSS源代码管理信息 -
moneyprosper:
就只有IE支持,火狐和谷歌都不支持此种方法。正在寻找中。。。
从父页面读取和操作iframe中内容方法
using System.Text.RegularExpressions; //包含正则表达式 public static string NoHTML(string Htmlstring) //去除HTML标记 { //删除脚本 Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "", RegexOptions.IgnoreCase); //删除HTML Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]*)>", "", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"([\r\n])[\s]+", "", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"<!--.*", "", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(quot|#34);", "\"", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(amp|#38);", "&", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(lt|#60);", "<", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(gt|#62);", ">", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);", " ", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);", "\xa1", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);", "\xa2", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);", "\xa3", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);", "\xa9", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&#(\d+);", "", RegexOptions.IgnoreCase); Htmlstring.Replace("<", ""); Htmlstring.Replace(">", ""); Htmlstring.Replace("\r\n", ""); Htmlstring = HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim(); return Htmlstring; }
示例:
/// <summary> /// 将所有HTML标签替换成"" /// </summary> /// <param name="strHtml"></param> /// <returns></returns> public static string StripHTML(string strHtml) { string[] aryReg ={ @"<script[^>]*?>.*?</script>", @"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(file://[""'tbnr]|[^/7])*?/7|/w+)|.{0})|/s)*?(///s*)?>", @"([\r\n])[\s]+", @"&(quot|#34);", @"&(amp|#38);", @"&(lt|#60);", @"&(gt|#62);", @"&(nbsp|#160);", @"&(iexcl|#161);", @"&(cent|#162);", @"&(pound|#163);", @"&(copy|#169);", @"&#(\d+);", @"-->", @"<!--.*\n" }; string[] aryRep = { "", "", "", "\"", "&", "<", ">", " ", "\xa1",//chr(161), "\xa2",//chr(162), "\xa3",//chr(163), "\xa9",//chr(169), "", "\r\n", "" }; string newReg = aryReg[0]; string strOutput = strHtml; for (int i = 0; i < aryReg.Length; i++) { Regex regex = new Regex(aryReg[i], RegexOptions.IgnoreCase); strOutput = regex.Replace(strOutput, aryRep[i]); } strOutput.Replace("<", ""); strOutput.Replace(">", ""); strOutput.Replace("\r\n", ""); return strOutput; }
发表评论
-
向SqlCommand对象的ParameterCollections集合添加参数时犯的低级错误
2009-10-23 16:58 1496今天写代码遇到了一个小小的问题看来是基础不过关啊,嘿嘿. ... -
数字金额转为大写金额
2009-10-21 16:46 1261方法一: /// <summary> ... -
格式化文件大小的C#方法
2009-10-21 10:31 1811/// <summary> // ... -
学习C#:Attribute与Property
2009-10-04 14:23 2765一.什么是Attribute 先看下面的三段代码: ... -
String和StringBuilder的区别和使用
2009-08-11 10:22 1270String是固定不变的,在进行字符串连接的时候是新建一 ... -
C#值类型后面加问号表示可为空null(Nullable 结构)
2009-08-04 14:38 7973值类型后面加问号表示可为空null(Nullable 结构)N ... -
C#里面比较时间大小三种方法
2009-07-29 12:55 12201。比较时间大小的实验 string str1 ... -
DataTime.Ticks
2009-07-29 07:30 4482java Date.getTime() getTime pub ... -
.net读取和写入txt文件
2009-07-21 23:34 7339//检查文件,如果文件不 ... -
Static方法
2009-07-19 23:28 8561.static方法是类中的一个成员方法,属于整个类,即使不用 ... -
C#中判断空字符串的3种方法性能分析
2009-07-02 08:47 12343种方法分别是: string a="&qu ... -
ASP.NET发布网站解决方案
2009-06-30 14:31 5355对于想了解发布网站那 ... -
C#中@的用法
2009-06-28 06:13 8621. 加在字符串前面,字符串中的 \ 失去转义符的作用,直接 ... -
c# cs 生成dll
2009-06-25 23:00 2350C# 语言是一种简单但功 ... -
C#项目引用完全相同dll文件的问题解决方法(反射)
2009-06-25 19:52 7213今天有开发人员问我一个问题,他的项目中要引用两个类库,这两 ... -
ADO.NET事务
2009-06-23 14:07 977private void DemoTranscation() ... -
null,"",String.Empty的区别
2009-06-16 16:37 11671.null null 关键字是表示不引用任何对象的空引用 ... -
C#类和接口、虚方法和抽象方法及值类型和引用类型的区别
2009-06-13 14:56 10921.C#类和接口的区别 ... -
Asp.net日期格式
2009-06-06 18:37 1282DateTime dt = DateTime.Now; ... -
GUID介绍
2009-05-22 08:56 1600GUID(全局统一标识符) ...
相关推荐
正则表达式是编程语言中用于模式匹配的强大工具,它能帮助我们高效地处理文本,进行数据验证、搜索和替换等任务。以下是一些常见的正则表达式模式及其用途: 1. 匹配中文字符:[u4e00-u9fa5] - 这个表达式用于匹配...
正则表达式是文本处理领域的一种强大工具,尤其在编程语言中,如C#,它被广泛应用于数据验证、字符串搜索与替换等场景。本文将详细介绍在ASP.NET中常用的正则表达式,帮助开发者理解和掌握如何使用这些表达式来解决...
JavaScript的RegExp对象和String对象定义了使用正则表达式来执行强大的模式匹配和文本检索与替换函数的方法. 在JavaScript中,正则表达式是由一个RegExp对象表示的.当然,可以使用一个RegExp()构造函数来创建RegExp...
在给出的部分内容中,首先介绍了通过正则表达式去除HTML文本中不同类型标记的基本方法。例如,通过正则表达式去除了HTML文档中的注释、script脚本、style样式以及其他所有HTML标签。 1. 去除注释的正则表达式使用了...
在C#中,正则表达式是一个强大的工具,常用于数据处理、文本分析以及像网页内容抓取这样的任务。在上述文档中,我们看到如何利用正则表达式去除HTML文本中的特定部分,以便提取出纯文本内容。以下是关键知识点的详细...
在C#中去除HTML标记通常涉及到正则表达式的使用。通过一系列预定义的正则表达式模式来匹配并替换HTML标签及其特殊字符,最终得到不含任何HTML元素的纯文本。下面是一个具体的示例代码: ```csharp using System; ...
第二个方法则更加直接,它利用了两个正则表达式来直接替换掉不需要的标签: 1. 第一个正则表达式用于匹配并替换掉span标签。 2. 第二个正则表达式用于移除所有其他非保留的HTML标签。 这显示了正则表达式在处理字符...
在C#编程中,正则表达式是一种强大的文本处理工具,尤其在处理复杂字符串匹配时。本文主要聚焦于C#正则表达式的递归匹配,这对于解析嵌套结构的数据非常有用,例如匹配嵌套的括号。在C#中,虽然不直接支持`(?R)`这样...
HTML是超文本标记语言,是构建网页的基础,而正则表达式是一种强大的文本处理工具,常用于匹配、查找、替换等操作。在这个“HtmlDome.rar”压缩包中,我们聚焦于如何使用C#编程语言,结合正则表达式来提取HTML页面中...
总的来说,C#获取HTML中的文本信息可以通过基础的字符串操作、正则表达式或者使用特定的库如HtmlAgilityPack来实现。选择哪种方法取决于你的具体需求,包括HTML的复杂程度、性能要求以及对错误处理的需求。对于初学...
- **功能**:用于替换一个字符串中匹配指定正则表达式的子串。 - **示例**:`SELECT REGEXP_REPLACE('aabbcc', '(.*)(.*)(.*)', '3,2,1') FROM dual`。此查询将返回"cc,bb,aa"。 #### 三、特殊字符与操作符 - `^`...
这个也算正则表达式的用法,其实仔细看正则表达式应该比较简单,不过既然有这个问题提出,说明对正则表达式还得有个认识过程,解决方法如下 解决: 在替换对话框中,启用“正则表达式”复选框 在查找内容里面输入...
【1】 正则表达式应用——替换指定内容到行尾 【2】 正则表达式应用——数字替换----------------------------Microshaoft@CCF,jiuk2k@CCF 【3】 正则表达式应用——删除每一行行尾的指定字符 【4】 正则表达式应用...
这个也算正则表达式的用法,其实仔细看正则表达式应该比较简单,不过既然有这个问题提出,说明对正则表达式还得有个认识过程,解决方法如下 解决: 在替换对话框中,启用“正则表达式”复选框 在查找内容里面输入...
3. 正则表达式处理:去除词汇间的特殊字符。 4. 模式匹配:将清理后的词汇与敏感词库进行匹配。 5. 处理匹配结果:如果发现敏感词,可以标记、替换或者直接过滤掉。 在这个过程中,为了提高效率,可以使用数据结构...