JS实现的爬虫，你觉得有用不

全部 Hibernate Spring Struts iBATIS 企业应用 Lucene SOA Java综合 Tomcat 设计模式 OO JBoss

浏览 17480 次

锁定老帖子主题：JS实现的爬虫，你觉得有用不精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (6)
作者	正文
mikab 等级: 初级会员性别: 文章: 62 积分: 90 来自: 北京	发表时间：2011-01-21 相关推荐: 简单易学！使用 Node.js 编写爬虫，跟着教程一步步实现！ Python爬虫系列（一）——手把手教你写Python爬虫都2023年了还不会Node.js爬虫？快学起来！ Java爬虫，信息抓取的实现学1个月爬虫副业月赚6K？告诉你爬虫的真实情况！更多相关推荐企业应用首先澄清一下，JS实现的爬虫是指用JS实现解析逻辑的爬虫，大概的想法就是把某个页面的内容下载下来，像IE或者Firefox那样把HTML的内容解析成DOM树，然后用JS解析页面的内容，得到自己想要的东西。为什么要用JS呢？一是会JS的人基本都是搞WEB相关的东西的，DOM什么的都是熟人熟路；二是JS里面像CSS selector、jquery这样方便的东西，用起来应该是很爽的。如果有这么个东西，大家以后没事爬爬数据的时候还是很方便的。大家觉得这个主意怎么样？要是觉得好的人多，我打算找人一起弄个比较成熟的包出来。声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

wjjchen 等级: 初级会员性别: 文章: 2 积分: 30 来自: 北京	发表时间：2011-01-21 JS如何跨域抓取数据？
返回顶楼	回帖地址 0 0 请登录后投票

hackwaly 等级: 初级会员性别: 文章: 21 积分: 70 来自: 成都	发表时间：2011-01-21 不错有想法 1L的问题可以通过修改浏览器的源代码实现
返回顶楼	回帖地址 0 0 请登录后投票

illu 等级: 初级会员性别: 文章: 50 积分: 0 来自: 西安	发表时间：2011-01-22 我想请教下你如何把别人的HTML网页用JS转换成DOM对象？
返回顶楼	回帖地址 0 0 请登录后投票

kyfxbl 等级: 性别: 文章: 720 积分: 950 来自: 深圳	发表时间：2011-01-22 hackwaly 写道不错有想法 1L的问题可以通过修改浏览器的源代码实现有什么用？你改完浏览器的源代码，然后呢？就你自己一个人自娱自乐？还是拿出￥来推广你这浏览器？
返回顶楼	回帖地址 0 0 请登录后投票

yonglin4605 等级: 初级会员性别: 文章: 37 积分: 60 来自: 杭州	发表时间：2011-01-22 kyfxbl 写道 hackwaly 写道不错有想法 1L的问题可以通过修改浏览器的源代码实现有什么用？你改完浏览器的源代码，然后呢？就你自己一个人自娱自乐？还是拿出￥来推广你这浏览器？目的是为了实现爬虫，不是黑客吧。本来就是自用的，不需要改别人的浏览器啊
返回顶楼	回帖地址 0 0 请登录后投票

181054867 等级: 初级会员性别: 文章: 95 积分: 70 来自: 广州	发表时间：2011-01-22 有必要用JS做这个事情吗？
返回顶楼	回帖地址 0 0 请登录后投票

wangking717 等级: 初级会员性别: 文章: 67 积分: 30 来自: 成都	发表时间：2011-01-22 这个首要条件是需要解决JS跨域问题。
返回顶楼	回帖地址 0 0 请登录后投票

tsoukw 等级: 初级会员性别: 文章: 24 积分: 30 来自: 广州	发表时间：2011-01-23 用js的唯一目的可能就是解析dom方便吧，但是效率应该很低，因为是要通过浏览器先显示成html，然后再析出dom模型供js调用，应该说意义不是很大参考一下这个博客园的网友的作品: Jumony入门（一）从这里开始 http://www.cnblogs.com/Ivony/archive/2010/12/19/jumony-guide-1.html
返回顶楼	回帖地址 0 0 请登录后投票

kjj 等级: 性别: 文章: 1018 积分: 266 来自: 陕西	发表时间：2011-01-23 js爬虫？要把网页解析成dom树，我觉得面临最大的问题是，如果面对各种不规范的html，看你有啥办法！！！！
返回顶楼	回帖地址 0 0 请登录后投票

论坛首页 → Java企业应用版

跳转论坛: