精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (1)
|
|
---|---|
作者 | 正文 |
发表时间:2011-03-28
Norther 写道 可以用Javascript,JDK6可以直接解析。
javascript有什么样的功能,能实现什么样的业务,这个,你懂的。 其实用groovy,grails,javascript等等也好,只要能恰当的解决问题那就perfect |
|
返回顶楼 | |
发表时间:2011-03-28
使用Lisp/Clojure的表示模板、xml/yaml什么的都是浮云,代码即数据——
spit/slurp read-string eval 直接操作代码文件或者说数据文件即可。 |
|
返回顶楼 | |
发表时间:2011-03-28
onlylau 写道 引用 因为按照需求设计分析,已经很明确抓取策略的这一块仅仅是通过xml这类静态配置会设计的很复杂,很明显一类动态语言比较适合干这样的活 动态语言没学过,只是简单了解过,请问这里为什么说动态语言比较适合干呢? 脚本工具,小应用,web快速开发——甚至GUI,都很方便呢 |
|
返回顶楼 | |
发表时间:2011-03-28
agapple 写道 Norther 写道 可以用Javascript,JDK6可以直接解析。
javascript有什么样的功能,能实现什么样的业务,这个,你懂的。 其实用groovy,grails,javascript等等也好,只要能恰当的解决问题那就perfect 你帖子里要做的事情,Javascript都能做,哪些做不了,说来听听。 |
|
返回顶楼 | |
发表时间:2011-03-28
最后修改:2011-03-28
Norther 写道 agapple 写道 Norther 写道 可以用Javascript,JDK6可以直接解析。
javascript有什么样的功能,能实现什么样的业务,这个,你懂的。 其实用groovy,grails,javascript等等也好,只要能恰当的解决问题那就perfect 你帖子里要做的事情,Javascript都能做,哪些做不了,说来听听。 哈,这个看具体的业务,因为帖子里没细说。不是说完全不能做,只是说用javascript实现会很别扭。 比如我们需要抓取google pagerank的值,里面涉及一个hash算法JenkinsHash 向这类需要进行自定义加密处理的,用基于java的"动态语言"实现,可以反射调用现成的code,何乐而不为呢。毕竟我们的主要编程还是java语言。 |
|
返回顶楼 | |
发表时间:2011-04-01
感觉有点偏了,如果解析的复杂度和重复度很高的话,用javascript或者groovy应该合理一点
|
|
返回顶楼 | |
发表时间:2011-06-14
使用groovy没有啥入门难的问题,在groovy脚本里可以直接编写java代码。而且groovy解析xml和json都很方便,提供内置函数。
但是如果html精确解析的话,还是使用类似XPath的技术比较好(可以自己实现) ,写几个XPath表达式就OK解决问题 |
|
返回顶楼 | |
发表时间:2011-06-14
Reset 写道 使用groovy没有啥入门难的问题,在groovy脚本里可以直接编写java代码。而且groovy解析xml和json都很方便,提供内置函数。
但是如果html精确解析的话,还是使用类似XPath的技术比较好(可以自己实现) ,写几个XPath表达式就OK解决问题 呵,老帖子被翻起来 1. groovy学习成本的确不高,但对于一个已经天天加班的项目人说,新的技术使用毕竟会有个熟悉成本。这样的选择,做过PM或者架构师的都应该会有体会。 velocity目前对于开发人员来说,一直在用,可以说是0成本。 2. 原帖子中也有描述需求,其实html解析只是它要解决的一个需求而已。同样它需要去处理一些加密算法,html请求,编码处理,超时控制等等一些列问题。 其实我这里只是抛出了一个idea,可以用动态语言当作配置文件解决类似"爬虫"的问题。至于选择用什么技术来实现这个语言,那就是后话了。比如velocity,groovy,scalar。 或者干脆自己用javacc/jjtree构建一套新的语言,这也未尝不可。只不过项目风险需要PM多多考虑 |
|
返回顶楼 | |