`
marlonyao
  • 浏览: 253236 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

抓取火车票程序

    博客分类:
  • java
阅读更多

在同事的建议下写了一个自动从网上抓取火车票信息的程序,抓取完之后使用Gtalk来发送抓取到的信息。现在可以从火车票网,酷讯网和水木社区上抓取火车标信息。


需要的可以使用下载源代码。运行环境是JDK1.6,源文件没有带相关的jar包,我使用了Maven来管理依赖,因此最好用Maven来编译,主要的依赖是Smack(用来发送Gtalk消息)和HtmlUnit(用来抓取并分析网页)。

有两个配置文件config.properties和gtalk.properties。config.properties是主要设置抓取的过滤条件(出发城市、目的城市和关键字等)以及其它一些乱七八糟的东西,配置文件采用和log4j.properties类似的格式。gtalk.properties设置登陆的gtalk帐户,使用该帐户来发送消息。需要提醒的是,gtalk可以自己给自己发送消息,所以不需要注册两个帐户。

运行起来之后可以一直开着,就等着它来给你发消息吧,祝大家好运!如有运行遇到什么问题,可以回帖。

========================================================

现在将依赖库也上传了,这是由maven自动生成的,可能有多余的,大就大点吧,懒得管了。

  • lib.zip (7.6 MB)
  • 下载次数: 508
分享到:
评论
6 楼 liyu212 2009-02-08  
能不能写一个抓取qq城市达人上的qq号码的程序呢
5 楼 andy54321 2009-01-21  
小哥你不错。。。( ^_^ )不错嘛
我要改造它,完成我未完的东东。。。。
6.cn
4 楼 fjlyxx 2009-01-16  
最根本的解决办法还是要靠商务,叫票务提供接口.
3 楼 marlonyao 2009-01-16  
最初上传的不小心把自己的邮箱给暴露了,迫不得已只有改密码了。
2 楼 jcs7575 2009-01-15  
用的都什么包啊? 其实你把jar包放在一起 用rar最高比例压缩 可以压缩很小的
1 楼 xuyao 2009-01-15  
不错,我也写过抓取火车票信息的程序,呵呵,看来大家对于买票很热衷啊

相关推荐

    非常实用的实时抓取火车票转让信息,第一时间秒杀转让车票,

    本项目针对火车票转让信息的实时抓取,帮助用户在第一时间掌握转售票源,提升购票的成功率。以下是对这个项目的详细解读: 1. **实时数据抓取**:实时抓取技术涉及到网络爬虫和数据解析。网络爬虫是一种自动浏览...

    火车票自动查找抓取器 1.0

    《火车票自动查找抓取器 1.0》是一款针对广大网民设计的便捷购票软件,尤其在春节期间,为人们能够顺利回家提供了强大的技术支持。这款工具的核心功能在于自动抓取网络上的待转让火车票信息,极大地简化了用户寻找...

    12306火车票抢票程序(源码学习使用)

    【标题】"12306火车票抢票程序(源码学习使用)"涉及到的知识点主要集中在模拟抢票软件的开发技术上,这通常包括网络编程、多线程、定时任务、数据抓取和API接口调用等方面。12306是中国铁路客户服务中心的官方网站...

    火车票分析助手程序.rar

    1. 数据抓取:程序可能集成了网络爬虫技术,能够自动从各大火车票预订网站或官方API接口抓取实时的火车票信息,如车次、发车时间、到达时间、票价等。 2. 数据清洗:抓取到的数据可能存在重复、错误或不完整的情况...

    火车票分析助手Python源代码【含开发文档程序使用说明+配置文件】

    1. 数据抓取:使用Python的网络爬虫技术,如requests和BeautifulSoup库,从12306官网或其他火车票预订平台获取实时的火车票信息。 2. 数据解析:将抓取到的HTML或JSON数据进行解析,提取出车次、价格、余票等关键...

    python 火车票分析助手的程序源程序.rar

    1. **网络爬虫**:Python提供了强大的网络爬虫库,如BeautifulSoup和Scrapy,用于抓取火车票的相关数据。这些库能够解析HTML或XML页面,提取出所需的信息,如车次、出发站、到达站、时间、价格等。 2. **数据处理**...

    matlab爬取火车票信息.zip

    在本项目中,"matlab爬取火车票信息.zip"是一个使用MATLAB编写的程序,其目的是演示如何从网络上抓取火车票的相关信息。MATLAB通常被用于数值计算、符号计算、数据可视化以及图像处理等领域,但通过扩展,也可以实现...

    python 火车票分析助手的程序

    这些库可以帮助我们从网站上抓取火车票的相关信息,例如车次、出发时间、到达时间、余票数量等。需要注意的是,进行网络爬虫时要遵循网站的robots.txt协议,并尊重数据隐私,合法合规地获取数据。 其次,数据清洗是...

    Python版火车票分析助手程序源码.zip

    9. 自动化脚本:这个程序可能是一个自动化脚本,定时从官方接口抓取火车票信息,然后进行分析并生成报告,展示了Python的定时任务执行能力,如使用APScheduler库。 10. 接口调用:为了获取实时的火车票信息,可能...

    查询预订火车票

    "查询预订火车票"的项目就是一个利用Python爬虫技术获取并处理12306火车票预订信息的典型示例。下面将详细阐述这个项目中涉及的相关知识点。 1. **网络爬虫基础**: 网络爬虫是自动化抓取互联网信息的程序。在这个...

    火车票分析助手的程序-python

    通过以上知识点的学习和实践,你将能够创建一个功能完善的火车票分析助手,它不仅能抓取火车票信息,还能对数据进行初步的分析,为出行提供决策支持。记住,始终要尊重网站的robots.txt规则,并遵守网络爬虫的道德...

    火车票分析助手的程序使用说明.zip

    【火车票分析助手的程序使用说明】 火车票分析助手是一个基于Python编程语言开发的应用程序,旨在帮助用户高效地分析和管理火车票数据。这个程序包含了多个功能模块,从数据抓取、清洗、处理到结果展示,一应俱全。...

    python 开发火车票分析助手的程序源码+可运行程序+使用说明

    标题中的“Python开发火车票分析助手的程序源码+可运行程序+使用说明”表明这是一个基于Python编程语言的软件项目,旨在帮助用户分析火车票的相关数据。这个项目包含三部分主要内容:程序源码、可执行程序和使用说明...

    购火车票工具

    【购火车票工具】是一种专为用户方便购买火车票而设计的应用程序,它通常集成了自动刷新、预定、抢票等多种功能,旨在帮助用户在高峰期或票源紧张时更高效地获取所需车票。在互联网时代,随着铁路出行需求的增长,...

    python源码火车票分析助手程序

    2. **Web爬虫技术**:程序可能利用了Python中的requests、BeautifulSoup或Scrapy等库来抓取和解析火车票网站的数据。 3. **数据处理与分析**:对于获取到的数据,可能使用Pandas等库进行清洗、转换和分析,从而实现...

    火车票分析助手的程序使用说明-爬虫

    《火车票分析助手的程序使用说明-爬虫》 火车票分析助手是一款基于爬虫技术的工具,旨在帮助用户高效地获取和分析火车票信息。爬虫是互联网数据挖掘的一种核心技术,通过自动化的方式遍历、抓取网页上的信息。在这...

    用httpclient抓取火车票信息

    一个通过httpclient抓取火车票信息的程序,需要修改下才能跑通,需要自己封装下httpclient,然后用get方式调用,还有fastJson,需要自己去解析下获得的数据,catchTrainInfo()是入口方法  import java.io....

    Python3源码火车票分析助手程序

    1. **火车票数据抓取**:该程序能够自动访问铁路官方网站或其他火车票预订平台,通过模拟用户行为来获取最新的列车时刻表、余票信息等。 2. **数据解析与处理**:抓取到的数据通常是以HTML或JSON格式呈现的,程序...

    火车票订票小助手

    《火车票订票小助手:智能抢票技术详解》 在现代生活中,火车作为重要的交通工具,其票务问题一直是人们关注的焦点。特别是在节假日或出行高峰期,如何快速准确地获取到火车票,成为了许多人的需求。"火车票订票...

    火车票 python

    在本项目中,我们主要探讨的是如何利用Python编程语言来实现对12306铁路客户服务中心网站的数据抓取,从而获取火车票信息。这个项目对于想要学习Python爬虫技术的人来说是一个很好的实践案例。我们将围绕Python爬虫...

Global site tag (gtag.js) - Google Analytics