论坛首页 编程语言技术论坛

正则表达式如何替换不被某个标签包含的字符?

浏览 4890 次
精华帖 (1) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2008-09-12  
JavaEye提供了2种编辑器:bbcode和rich editor,用户使用bbcode编辑的文章在显示时候,需要将换行替换成HTML的br,代码很简单:
text.gsub(/\n/, "<br />")


但是bbcode还提供了一个Code标签,能够用js高亮代码段,这个js要求被它包含的内容必需使用原始的换行(\n),这样需求就变成了:
如何将不在Code标签内的换行替换成br?

我翻了一堆的资料找不到单句替换的方法,只好先将code内的换行替换成一个特殊字符串(比如BBRR),然后再替换回来:
text.gsub!(/\[code(?:.*?)\](.*?)\[\/code\]/im) {|match| match.gsub(/\n/, "BBRR") }
return text.gsub(/\n/, "<br />").gsub(/BBRR/, "\n")


但是这样还是会遇到一些问题:
1. 如果很不巧,用户输入了你选定的特殊字符串(BBRR)就会被替换成换行了
2. 性能问题?

有人说用Negative lookbehind的表达式可以做,但是我看了一下文档,ruby1.8还不支持,大家有其他更好的方法吗?
   发表时间:2008-09-12  
可以用正则表达式分三步做:
1,替换文本开始处到\[code\]标签的中间内容的\n为<br/>
2,替换\[\/code\]标签到\[code\]标签的中间内容的\n为<br/>
3,替换\[\/code\]标签到文本末尾的中间内容的\n为<br/>

但是很麻烦,不知道怎么用一个正则表达式写出来
0 请登录后投票
   发表时间:2008-09-13  
ruby1.8可以安装oniguruma支持lookbehind,在debian/ubuntu系统下方法如下

sudo apt-get install libonig2 libonig2-dev
sudo gem install oniguruma


需要注意这样安装好的regexp扩展不能使用ruby中的//构造正则表达式方法,会报错。
> "cab" =~ /(?<=a)b/
SyntaxError: compile error
undefined (?...) sequence: /(?<=a)b/


只能写成
> Oniguruma::ORegexp.new('(?<=a)b') =~ "cab"
=> 2


具体怎么用lookbehind解决这个问题还没有想明白。
8 请登录后投票
   发表时间:2008-09-16  
pattern = /(?=\[\/code\]|\A)((?!\[code\]).)*/m
text.gsub(pattern) {|g| p g}
修改了一下,这样应该可以了

0 请登录后投票
   发表时间:2008-09-16  
谢谢lllyq,很简洁地解决了这个问题
0 请登录后投票
   发表时间:2008-11-02  
lllyq 写道
pattern = /(?=\[\/code\]|\A)((?!\[code\]).)*/m
text.gsub(pattern) {|g| p g}
修改了一下,这样应该可以了


工作不正常啊?
0 请登录后投票
   发表时间:2009-03-21  
额。显然实际上这个特殊字符串不是BBRR...
0 请登录后投票
   发表时间:2009-03-21   最后修改:2009-03-21
换成\[\/code\]不可以吗?
因为如果用(.*?)这样的非贪婪匹配的结果中一定不含有\[\/code\]

但是还有个问题,如果代码中含有[\/code\]这个字符串,就会被提前截断。刚才我试了一下确实代码中如果有\[\/code\]会被过滤掉。也就是说可以考虑先过滤掉代码中的\[\/code\]然后再匹配,再替换。

还没想明白现在JE是怎么把代码里面的\[\/code\]替换掉的。。
0 请登录后投票
论坛首页 编程语言技术版

跳转论坛:
Global site tag (gtag.js) - Google Analytics