`
hanqingwxf2008
  • 浏览: 51689 次
  • 性别: Icon_minigender_1
  • 来自: 青岛
社区版块
存档分类
最新评论

ruby 正则匹配非站内链接

 
阅读更多

  def has_href_not_XXX?(content)
    content = content.dup
    loop do
      content.sub!(/href=(['"])([^'"]+)\1/, "")
      if $2.blank?
        return false
      else
        if (!$2[".XXX.com"])
          return true
        end
      end
    end
  end

分享到:
评论

相关推荐

    Ruby-一个漂亮的正则表达式用于查找和提取这些文件中的相对URL

    在Ruby中,我们使用`Regexp`类来创建正则表达式,并用`match`、`scan`等方法来在字符串中查找匹配项。 对于查找相对URL,我们需要识别HTML中`<a>`标签的`href`属性或其他可能包含URL的地方,例如`<img>`的`src`属性...

    正则表达式.pdf

    正则表达式不仅限于Python,许多编程语言都支持正则表达式,包括Java、JavaScript、Perl、Ruby等。 正则表达式的组成部分: 1. 字符:包括字母、数字、特殊字符等。 2. 元字符:包括.、*、+、?、{、}、[、]、\、^...

    正则表达式经典实例

    《正则表达式经典实例》这本书深入浅出地介绍了正则表达式的基本概念和高级特性,并提供了丰富的实例,覆盖了C#、Java、JavaScript、Perl、PHP、Python、Ruby和VB.NET等多种编程语言。 #### 二、核心内容概览 1. *...

    MRuby Win32静态开发包,修复原版链接问题

    这个 gem 允许 MRuby 程序员使用复杂的正则表达式来进行文本匹配和搜索操作。 `bignum` gem 则扩展了 MRuby 的数值处理能力,允许处理超过标准整型范围的大整数。在 Ruby 中,大整数是内建支持的,但在 MRuby 这样...

    oniguruma.zip

    它支持多种正则表达式语法,如Perl、Ruby、Java等,提供了灵活的匹配规则和高效的搜索功能。在PHP中,oniguruma通过php_oniguruma扩展,使开发者能够利用强大的正则表达式进行文本处理和数据解析。 二、LNMP环境中...

    SELENIUM中文教程

    - **正则表达式模式**:`regexp:regexp`,按照JavaScript正则表达式的规则匹配字符串。 - **精确匹配模式**:`exact:string`,精确匹配整个字符串,不允许使用通配符。 如果未指定模式,则默认使用Glob模式。 3...

    logstash-6.6.0 百度云地址.txt

    这里使用了Grok过滤器来进行正则匹配,Date过滤器来解析时间戳。 - **输出**:定义数据最终的去向。本例中将数据发送到本地运行的Elasticsearch实例上,并按日期进行索引。 ### Logstash在ELK堆栈中的角色 ELK堆栈...

    linkifier:Linkify 支持宝石

    1. **模式匹配**:Linkify使用正则表达式来查找文本中的URL或其他可链接的模式。 2. **安全处理**:在将文本转换为链接之前,它会检查链接的有效性,确保它们不是潜在的恶意网址。 3. **转换**:一旦找到有效的链接...

    纯C的爬虫源码

    C语言可以使用PCRE库进行正则匹配,或者解析DOM树结构。 5. **数据存储**:抓取的数据可能需要保存到文件、数据库或进行进一步处理。C语言的文件I/O操作和内存管理是这部分的关键。 6. **并发与多线程**:为了提高...

    nginx.zip在windows解压打开有两个包一个nginx压缩包和依赖包

    例如,可能会包含SSL库(如OpenSSL)以支持HTTPS通信,或者pcre库用于实现正则表达式匹配。 在部署Nginx时,用户需要确保所有依赖项都已安装并配置正确。对于Linux环境,这通常通过包管理器(如apt或yum)完成,而...

    Ragel 6.7 windows版本

    它特别适合处理文本解析任务,如正则表达式匹配,协议解析,词法分析器生成等。通过Ragel,开发者可以将注意力集中在业务逻辑上,而不是底层的解析细节。 压缩包中的文件如下: 1. `cygwin1.dll`:这是Cygwin的一...

    SubEthaEdit-5.1.3.zip 可以写文章,代码,笔记

    使用实时协作功能,您可以连接到本地网络中的任何人,并且如果您启用了通过共享链接转发Internet中任何人的端口的功能。 参加者 邀请某人访问文档。一起生活在文件中。关注他们,或通过选择文字向他们展示。如果...

    logstash

    这包括但不限于:解析日志格式(如 JSON、CSV 或自定义格式)、提取关键字段、执行正则表达式匹配、添加或删除字段、进行地理编码等。过滤器阶段是 Logstash 强大的地方,可以根据实际需求定制化数据处理逻辑。 **3...

    JS代码加亮

    1. **手动操作**:可以通过遍历HTML代码块,使用正则表达式匹配关键字,并手动添加CSS类来实现高亮。这种方法灵活性高,但工作量大,维护困难。 2. **使用预处理器**:如Prettier或ESLint可以在保存代码时自动格式...

    icu.cr:ICU库的Cystal绑定包装器

    - **正则表达式**:提供高性能的正则表达式匹配和替换功能。 - **本地化**:提供语言、区域和文化的本地化信息,用于适应不同地区的用户需求。 **6. 示例应用** 在实际应用中,"icu.cr" 可用于构建全球化网站、...

    PGSQL常见的问题

    使用`SIMILAR TO`或`~`操作符进行正则表达式匹配,结合`ILIKE`或`(?i)`标志实现大小写不敏感的搜索。 #### 33. 在一个查询里,我怎样检测一个字段是否为NULL? 使用`IS NULL`或`IS NOT NULL`条件可以判断字段值...

    javaSE代码实例

    14.5.4 列表的链接实现 284 14.5.5 依赖性倒置原理 285 14.5.6 将数组转换为列表 285 14.6 集合 286 14.6.1 Set接口及含义 286 14.6.2 HashSet类的使用 287 14.6.3 equals与hashCode方法重写规定的作用...

    TechtorialCucumber

    这些定义通常包含正则表达式,用于匹配Feature文件中的步骤,并执行相应的代码。 6. **断言与验证**:在步骤定义中,可以使用各种断言库(如JUnit、AssertJ等)来验证网页元素的存在、文本内容、属性值等,确保测试...

Global site tag (gtag.js) - Google Analytics