在同事的建议下写了一个自动从网上抓取火车票信息的程序,抓取完之后使用Gtalk来发送抓取到的信息。现在可以从火车票网,酷讯网和水木社区上抓取火车标信息。
需要的可以使用下载源代码。运行环境是JDK1.6,源文件没有带相关的jar包,我使用了Maven来管理依赖,因此最好用Maven来编译,主要的依赖是Smack(用来发送Gtalk消息)和HtmlUnit(用来抓取并分析网页)。
有两个配置文件config.properties和gtalk.properties。config.properties是主要设置抓取的过滤条件(出发城市、目的城市和关键字等)以及其它一些乱七八糟的东西,配置文件采用和log4j.properties类似的格式。gtalk.properties设置登陆的gtalk帐户,使用该帐户来发送消息。需要提醒的是,gtalk可以自己给自己发送消息,所以不需要注册两个帐户。
运行起来之后可以一直开着,就等着它来给你发消息吧,祝大家好运!如有运行遇到什么问题,可以回帖。
========================================================
现在将依赖库也上传了,这是由maven自动生成的,可能有多余的,大就大点吧,懒得管了。
分享到:
相关推荐
本项目针对火车票转让信息的实时抓取,帮助用户在第一时间掌握转售票源,提升购票的成功率。以下是对这个项目的详细解读: 1. **实时数据抓取**:实时抓取技术涉及到网络爬虫和数据解析。网络爬虫是一种自动浏览...
《火车票自动查找抓取器 1.0》是一款针对广大网民设计的便捷购票软件,尤其在春节期间,为人们能够顺利回家提供了强大的技术支持。这款工具的核心功能在于自动抓取网络上的待转让火车票信息,极大地简化了用户寻找...
【标题】"12306火车票抢票程序(源码学习使用)"涉及到的知识点主要集中在模拟抢票软件的开发技术上,这通常包括网络编程、多线程、定时任务、数据抓取和API接口调用等方面。12306是中国铁路客户服务中心的官方网站...
1. 数据抓取:程序可能集成了网络爬虫技术,能够自动从各大火车票预订网站或官方API接口抓取实时的火车票信息,如车次、发车时间、到达时间、票价等。 2. 数据清洗:抓取到的数据可能存在重复、错误或不完整的情况...
1. 数据抓取:使用Python的网络爬虫技术,如requests和BeautifulSoup库,从12306官网或其他火车票预订平台获取实时的火车票信息。 2. 数据解析:将抓取到的HTML或JSON数据进行解析,提取出车次、价格、余票等关键...
1. **网络爬虫**:Python提供了强大的网络爬虫库,如BeautifulSoup和Scrapy,用于抓取火车票的相关数据。这些库能够解析HTML或XML页面,提取出所需的信息,如车次、出发站、到达站、时间、价格等。 2. **数据处理**...
在本项目中,"matlab爬取火车票信息.zip"是一个使用MATLAB编写的程序,其目的是演示如何从网络上抓取火车票的相关信息。MATLAB通常被用于数值计算、符号计算、数据可视化以及图像处理等领域,但通过扩展,也可以实现...
这些库可以帮助我们从网站上抓取火车票的相关信息,例如车次、出发时间、到达时间、余票数量等。需要注意的是,进行网络爬虫时要遵循网站的robots.txt协议,并尊重数据隐私,合法合规地获取数据。 其次,数据清洗是...
9. 自动化脚本:这个程序可能是一个自动化脚本,定时从官方接口抓取火车票信息,然后进行分析并生成报告,展示了Python的定时任务执行能力,如使用APScheduler库。 10. 接口调用:为了获取实时的火车票信息,可能...
"查询预订火车票"的项目就是一个利用Python爬虫技术获取并处理12306火车票预订信息的典型示例。下面将详细阐述这个项目中涉及的相关知识点。 1. **网络爬虫基础**: 网络爬虫是自动化抓取互联网信息的程序。在这个...
通过以上知识点的学习和实践,你将能够创建一个功能完善的火车票分析助手,它不仅能抓取火车票信息,还能对数据进行初步的分析,为出行提供决策支持。记住,始终要尊重网站的robots.txt规则,并遵守网络爬虫的道德...
【火车票分析助手的程序使用说明】 火车票分析助手是一个基于Python编程语言开发的应用程序,旨在帮助用户高效地分析和管理火车票数据。这个程序包含了多个功能模块,从数据抓取、清洗、处理到结果展示,一应俱全。...
标题中的“Python开发火车票分析助手的程序源码+可运行程序+使用说明”表明这是一个基于Python编程语言的软件项目,旨在帮助用户分析火车票的相关数据。这个项目包含三部分主要内容:程序源码、可执行程序和使用说明...
【购火车票工具】是一种专为用户方便购买火车票而设计的应用程序,它通常集成了自动刷新、预定、抢票等多种功能,旨在帮助用户在高峰期或票源紧张时更高效地获取所需车票。在互联网时代,随着铁路出行需求的增长,...
2. **Web爬虫技术**:程序可能利用了Python中的requests、BeautifulSoup或Scrapy等库来抓取和解析火车票网站的数据。 3. **数据处理与分析**:对于获取到的数据,可能使用Pandas等库进行清洗、转换和分析,从而实现...
《火车票分析助手的程序使用说明-爬虫》 火车票分析助手是一款基于爬虫技术的工具,旨在帮助用户高效地获取和分析火车票信息。爬虫是互联网数据挖掘的一种核心技术,通过自动化的方式遍历、抓取网页上的信息。在这...
一个通过httpclient抓取火车票信息的程序,需要修改下才能跑通,需要自己封装下httpclient,然后用get方式调用,还有fastJson,需要自己去解析下获得的数据,catchTrainInfo()是入口方法 import java.io....
1. **火车票数据抓取**:该程序能够自动访问铁路官方网站或其他火车票预订平台,通过模拟用户行为来获取最新的列车时刻表、余票信息等。 2. **数据解析与处理**:抓取到的数据通常是以HTML或JSON格式呈现的,程序...
《火车票订票小助手:智能抢票技术详解》 在现代生活中,火车作为重要的交通工具,其票务问题一直是人们关注的焦点。特别是在节假日或出行高峰期,如何快速准确地获取到火车票,成为了许多人的需求。"火车票订票...
在本项目中,我们主要探讨的是如何利用Python编程语言来实现对12306铁路客户服务中心网站的数据抓取,从而获取火车票信息。这个项目对于想要学习Python爬虫技术的人来说是一个很好的实践案例。我们将围绕Python爬虫...