`
sillycat
  • 浏览: 2554760 次
  • 性别: Icon_minigender_1
  • 来自: 成都
社区版块
存档分类
最新评论

HTML过滤和补齐(二)

    博客分类:
  • JAVA
阅读更多

private static StringBuffer getHTML(Node node, boolean check) {
   short type = node.getNodeType();
   String name = StringUtil.defaultIfBlank(node.getNodeName());
   String value2 = node.getNodeValue();
   NamedNodeMap attrs = node.getAttributes();

   if (check) {
    try { // 如果是表格并且没有在表格里,忽略

     if ((type == Node.ELEMENT_NODE)
       && "tr".equalsIgnoreCase(name)
       && !"table".equalsIgnoreCase(node.getParentNode()
         .getNodeName())) {
      type = Node.TEXT_NODE;
     } else if ((type == Node.ELEMENT_NODE)
       && "td".equalsIgnoreCase(name)
       && (!"tr".equalsIgnoreCase(node.getParentNode()
         .getNodeName()) || !"table"
         .equalsIgnoreCase(node.getParentNode()
           .getParentNode().getNodeName()))) {
      type = Node.TEXT_NODE;
     } else if ((type == Node.ELEMENT_NODE)
       && "a".equalsIgnoreCase(name)) { // 如果是链接,则是能是taobao内部链接.

      if (attrs != null) {
       Node hrefNode = attrs.getNamedItem("href");

       if (hrefNode != null) {
        String href = hrefNode.getNodeValue();

        if ((escapeSpecialHTMLPattern == null)
          || !(new Perl5Matcher()).matches(href,
            escapeSpecialHTMLPattern)) {
         type = Node.TEXT_NODE;
        }
       }
      }
     }
    } catch (Exception e) {
     type = Node.TEXT_NODE;
    }
   }

   StringBuffer sb = new StringBuffer();
   boolean hasVal = false;

   if (type == Node.ELEMENT_NODE) {
    sb.append("<");
    sb.append(StringUtil.toLowerCase(name));

    if (attrs != null) {
     for (int i = 0; i < attrs.getLength(); i++) {
      Node n = attrs.item(i);

      if ((n.getNodeName() != null) && (n.getNodeValue() != null)) {
       sb.append(" ");
       sb.append(StringUtil.toLowerCase(n.getNodeName()));
       sb.append("=\"");
       sb.append(StringEscapeUtil.escapeHtml(n.getNodeValue()
         .trim()));
       sb.append("\"");
      }
     }
    }

    if (StringUtil.isNotBlank(value2)) {
     hasVal = true;
     sb.append(">");
     sb.append(escapeHTML(value2.trim()));
     sb.append("");
    }
   } else if ((type == Node.TEXT_NODE) && StringUtil.isNotBlank(value2)) {
    sb.append(escapeHTML(value2.trim()));

    // sb.append("\n");
    return sb;
   }

   Node child = node.getFirstChild();

   if ((type == Node.ELEMENT_NODE) && (child == null)) {
    if (!hasVal
      && INLINE_CLOSED_TAG.contains(StringUtil.toLowerCase(name))) {
     sb.append(" />");
    } else if (!hasVal) {
     sb.append("></");
     sb.append(StringUtil.toLowerCase(name));
     sb.append(">");
    }
   } else {
    if (!hasVal && (type == Node.ELEMENT_NODE)) {
     sb.append(">");
    }

    while (child != null) {
     sb.append(getHTML(child, check));
     child = child.getNextSibling();
    }

    if (type == Node.ELEMENT_NODE) {
     sb.append("</");
     sb.append(StringUtil.toLowerCase(name));
     sb.append(">");
    }
   }

   return sb;
}

/**
* for display convenience we must cut the length of title if the lenght of
* title greater than ITEM_TITLE_MAX_SIZE, it will return the
* ITEM_TITLE_MAX_SIZE characters of the origianl title, otherwise, the
* whole title.
*
* @param t -
*            title
* @param maxSize -
*            title max size
*
* @return - title returned
*/
public static String getFormattedTitle(String t, int maxSize) {
   StringBuffer title = new StringBuffer();

   if (StringUtil.isBlank(t)) {
    return "";
   }

   if (t.length() > maxSize) {
    // title = t.trim().substring(0,ITEM_TITLE_MAX_SIZE)+"...";
    double weight = 0;
    int i = 0;
    char c = ' ';

    do {
     try {
      c = t.charAt(i);
     } catch (IndexOutOfBoundsException e) {
      break;
     }

     title.append(c);

     if (Character.isLetterOrDigit(c)) {
      if (Character.getType(c) == Character.OTHER_LETTER) {
       weight++; // chinese char weight 1
      } else {
       weight += 0.5; // english char only weight 0.5
      }
     } else if (Character.isWhitespace(c)) {
      weight += 0.5; // white space char weight 0.5
     } else {
      weight++; // chinese char weight 1
     }

     i++;
    } while (weight < (maxSize));

    if (weight >= maxSize) {
     try {
      i++;
      c = t.charAt(i);
      title.append("..."); // still has character, append ...
            // to ignore the rest
     } catch (IndexOutOfBoundsException e) {
      // do nothing;
     }
    }
   } else {
    title.append(t.trim());
   }

   return title.toString();
}
分享到:
评论

相关推荐

    百度自动补齐

    **百度自动补齐**是一种常见的前端开发技术,主要应用于搜索引擎或者输入框中,为用户提供智能预测和建议,提高输入效率。这种功能通常被称为自动补全(Autocomplete)或自动完成(Auto-complete)。在JavaScript中...

    jQuery实现自动补齐

    "jQuery实现自动补齐"这个主题,主要涉及的是如何利用jQuery来创建一个功能强大的输入框自动完成功能,这在网页表单设计中十分常见,尤其对于搜索框或用户输入数据的场景,可以显著提升用户体验。 自动完成功能通常...

    PHP实现网页内容html标签补全和过滤的方法小结【2种方法】

    本文实例讲述了PHP实现网页内容html标签补全和过滤的方法。分享给大家供大家参考,具体如下: 如果你的网页内容的html标签显示不全,有些表格标签不完整而导致页面混乱,或者把你的内容之外的局部html页面给包含进去了...

    jquery自动补齐插件.zip

    1. 过滤与匹配:通过`match`属性可以设置匹配规则,如忽略大小写、只匹配开头等。 2. 提示框样式:可以使用CSS自定义提示框的样式,如宽度、颜色、边距等。 3. 错误处理:当请求失败时,可以使用`error`回调进行...

    jQuery实现Twitter的自动文字补齐特效

    **jQuery实现Twitter的自动文字补齐特效** 在网页开发中,为用户提供友好的输入体验是至关重要的,其中一种常见的方式就是实现自动文字补全功能。这种功能常见于搜索引擎、社交媒体平台等,比如Twitter。jQuery,一...

    java实现自动补全功能

    - 前端的HTML、CSS和JavaScript文件,用于实现自动补全的界面和交互逻辑。 - 可能还会有数据库配置文件、Maven或Gradle的构建文件等。 总的来说,通过结合Java的后端处理能力和AJAX的实时通信特性,我们可以构建一...

    angularJs自定义过滤器实现手机号信息隐藏的方法

    然后,它使用substr方法截取手机号的前部分,并用重复的星号字符串补齐到指定长度,最终返回被隐藏处理过的手机号字符串。 6. 数据展示:在HTML模板中,通过使用过滤器标记(|)和过滤器名称(truncate),以及传递...

    基于PHP的田字格笔顺字帖在线生成器php源码.zip

    开发者可能使用了过滤函数、参数绑定、XSS防护等措施来防止恶意攻击。 8. **响应式设计**:为了适应不同设备和屏幕尺寸,源码可能采用了响应式布局,利用媒体查询等技术确保在手机、平板和电脑上都能良好显示。 9....

    苹果8XPC和手机二合一完整版

    template/user/ 为系统会员中心的模版及相关css和js ****************************模板规范化管理 结束**************************** ****************************系统内置JS、CSS说明 开始*******************...

    nginx-1.3.13

    nginx/Windows使用工作目录作为前缀将配置文件中设置的相对目录补齐。就上面安装的例子而言,工作目录应该是C:\nginx-1.3.13\(工作目录基本上与运行文件所在的目录相同)。配置文件中的目录请使用“/”,而不是“\...

    网页文章采集工具-易语言

    (源码)软件简介: ...1、在核心功能—&gt;提取链接这个子程序中,对于HTTP网址是否需要补齐根域名存在1个判断BUG。 2、在核心功能 —&gt; 提取源码这个子程序中,对于网页是否为UTF8格式判断存在会漏掉的BUG。

    Shopxp网上购物系统 v10.85 免费版.rar

    评论对不齐、以及打开新品和特价等页面的布局bug; 支持单独设置管理员自定义页面管理权限; 会员登录名字大小写不同,管理文章时出错; 过滤保存关键字时出现空关键字的情况; 用户注册判断用户名长短,是否禁止...

    net学习笔记及其他代码应用

    //请在以下补齐代码用来调用OnDBOperate委托签名的OnNew事件。 } } } 答:if( OnNew != null ) OnNew( this, e ); 27.分析以下代码,完成填空 string strTmp = \"abcdefg某某某\"; int i= System.Text....

Global site tag (gtag.js) - Google Analytics