java使用正则表达式去除字符串的html标签

浏览 19084 次

锁定老帖子主题：java使用正则表达式去除字符串的html标签精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者	正文
liuwei1981 等级: 性别: 文章: 158 积分: 140 来自: 太原	发表时间：2008-07-22 相关推荐: Java使用正则表达式删除所有HTML标签的方法示例 java如何使用正则表达式剔除字符串所有html标签呢？ Java使用正则表达式去除小数点后面多余的0功能示例 java 利用正则表达式从字符串中提取省、市、区、镇、乡等区域名称（包含少数民族地区），支持地址中无省，无市,无县情况。 Java正则表达式去除img标签的src内容更多相关推荐入门技术新闻内容或者博客文章，如果显示摘要，需要去除内容的html格式标签，找到一个正则表达式，实现了： /** * 删除input字符串中的html格式 * * @param input * @param length * @return / public static String splitAndFilterString(String input, int length) { if (input == null \|\| input.trim().equals("")) { return ""; } // 去掉所有html元素, String str = input.replaceAll("\\&[a-zA-Z]{1,10};", "").replaceAll( "<[^>]>", ""); str = str.replaceAll("[(/>)<]", ""); int len = str.length(); if (len <= length) { return str; } else { str = str.substring(0, length); str += "......"; } return str; } 声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

yangzhihuan 等级: 性别: 文章: 225 积分: 283 来自: 广州	发表时间：2008-10-09 非常感谢，刚刚用你的方法解决了在字符串去除HTML代码，我用的是ruby def normal_word(str) str.gsub!(/\\&[a-zA-Z]{1,10};/,'') str.gsub!(/<[^>]*>/,'') str.gsub!(/[(\/>)<]/,'') end
返回顶楼	回帖地址 0 0 请登录后投票

yangzhihuan 等级: 性别: 文章: 225 积分: 283 来自: 广州	发表时间：2008-10-09 非常感谢，刚刚用你的方法解决了在字符串去除HTML代码，我用的是ruby
返回顶楼	回帖地址 0 0 请登录后投票

liuwei1981 等级: 性别: 文章: 158 积分: 140 来自: 太原	发表时间：2008-10-09 这是我在做一个网站时候用到的，也是从网络上获取的，很高兴能够帮助别人。
返回顶楼	回帖地址 0 0 请登录后投票

songlipeng 等级: 初级会员性别: 文章: 9 积分: 30 来自: 北京	发表时间：2008-11-26 \\&[a-zA-Z]{1,10}; 什么作用啊!没有看明白啊!
返回顶楼	回帖地址 0 0 请登录后投票

hemahehe 等级: 初级会员性别: 文章: 7 积分: 30 来自: 广州	发表时间：2008-11-26 songlipeng 写道 \\&[a-zA-Z]{1,10}; 什么作用啊!没有看明白啊! \\& &字符 [a-zA-Z]{1,10} 任意字母(包含大小写)组成的字串,长度为1到10 匹配例如：< >   之类的字串
返回顶楼	回帖地址 0 0 请登录后投票

副团长等级: 初级会员性别: 文章: 23 积分: 70 来自: 北京	发表时间：2008-11-26 挺好的，正式我需要的。谢谢楼主分享
返回顶楼	回帖地址 0 0 请登录后投票

司徒正美等级: 性别: 文章: 89 积分: 330 来自: 广州	发表时间：2009-02-04 最后修改：2009-02-04 ruby中的方法 <%=h truncate(product.description.gsub(/<.*?>/,''),:length => 80, :truncate_string =>"……") %>
返回顶楼	回帖地址 0 0 请登录后投票

小马哥等级: 初级会员性别: 文章: 54 积分: 40 来自: 火星	发表时间：2009-03-18 方法明显太过暴力，假如我的内容用<1><2><3>这样的形式来作为步骤的标示，那不是一样被删。男人要绅士要优雅。 // 去掉所有html元素, String str = input.replaceAll("<[a-zA-Z]+[1-9]?[^><]*>", "") .replaceAll("</[a-zA-Z]+[1-9]?>", "");
返回顶楼	回帖地址 0 0 请登录后投票

liuwei1981 等级: 性别: 文章: 158 积分: 140 来自: 太原	发表时间：2009-03-18 小马哥写道方法明显太过暴力，假如我的内容用<1><2><3>这样的形式来作为步骤的标示，那不是一样被删。男人要绅士要优雅。 // 去掉所有html元素, String str = input.replaceAll("<[a-zA-Z]+[1-9]?[^><]*>", "") .replaceAll("</[a-zA-Z]+[1-9]?>", ""); 这样的数据表示在html代码里是不存在的吧，这些步骤标示被相应的html代码代替了
返回顶楼	回帖地址 0 0 请登录后投票

论坛首页 → 入门技术版

跳转论坛: