`
xingcxb
  • 浏览: 49379 次
  • 性别: Icon_minigender_1
  • 来自: 上海
文章分类
社区版块
存档分类
最新评论

java抓取网页上的时间可能出现的状况

 
阅读更多
在获得天涯论坛页面的时间时可能会出现类似于   2009-12-1612:20:00以及2009-12-1 6 12:20:00的现象
其中1 6中间的出现的只是表现为空格的字符,它的char值目前看到的有  32、12288这两种
在天涯这一块得到时间后应该把时间变为yyyy-MM-ddhh:mm:ss模式,不包括出现char值为32、12288的这种现象
改变时间格式的方案为:
if(reply_date.length()>19){
if(reply_date.indexOf((char)32)!=-1){
reply_date = reply_date.replace((char) 32, ' ');
}
reply_date = reply_date.replace(" ", "");
}

针对多出字符的解决方案为:
if((reply_date.indexOf((char)32)!=-1)||(reply_date.indexOf((char)12288)!=-1)){
reply_date = reply_date.replace((char) 32, ' ');
reply_date = reply_date.replace((char)12288, ' ');
reply_date = reply_date.replace(" ", "");
String test1 = "";
String test2 = "";
test1 = reply_date.substring(0,10);
test2 = reply_date.substring(10);
reply_date = test1+" "+test2;
}

时间没有空格的解决方案为:
if(!reply_date.substring(9,10).equals(" ")){
String test1 = "";
String test2 = "";
test1 = reply_date.substring(0,9);
test2 = reply_date.substring(9);
reply_date = test1+" "+test2;
}
分享到:
评论

相关推荐

    java http方式抓取网页信息 JAVAIO

    在Java编程语言中,HTTP(超文本传输协议)是一种用于在Web上发送和接收数据的主要方法。本知识点主要探讨如何...在实际项目中,根据需求,可能还需要处理其他复杂情况,例如cookies管理、代理设置、用户代理模拟等。

    Java爬虫Jsoup+httpclient获取动态生成的数据

    在Web开发和数据抓取领域,Java爬虫技术是实现网页自动化信息提取的重要手段。本文主要讲述如何利用Java编程语言中的Jsoup库和HttpClient工具包来获取和解析动态生成的数据,特别是那些通过JavaScript动态加载的数据...

    基于JAVA技术的网页内容智能抓取.doc

    3. 执行抓取任务:依据配置文件中的规则,发起HTTP请求获取网页内容。 4. 内容解析与处理:解析抓取到的HTML,根据预设规则提取目标内容并进行进一步的处理。 四、目前缺陷功能描述 尽管系统具有一定的实用性,但也...

    详解Java两种方式简单实现:爬取网页并且保存

    在Java编程中,爬取网页并保存是一项常见的任务,用于获取和分析互联网上的信息。本文将详细介绍两种简单的方法来实现这一目标:使用`java.net.URLConnection`和`org.apache.http.client.HttpClient`。 首先,我们...

    使用java快速判断网页链接是否有效

    ### 使用Java快速判断网页链接是否有效 在互联网应用开发中,经常会遇到需要验证网页链接有效性的情况。例如,在爬虫程序中需要确保所抓取的链接是有效的,或者是在网站维护过程中检查外部链接的有效性等。本文将...

    java截图指定网页保存图片

    在Java编程语言中,截取指定网页并保存为图片是一项常见的需求,比如用于网页快照、自动化测试或者数据抓取等场景。实现这个功能通常涉及网络请求、网页解析以及图像处理等多个方面。以下是一个详细的步骤解析: 1....

    java获取邮箱联系人库文件

    例如,`flyerhzm-contactlist-855a71f`可能是一个特定版本的Java项目,它提供了抓取和解析邮箱网页的函数。这个库可能包含了解析HTML、模拟登录、跟踪cookies等功能,以实现对网页内容的自动化操作。 在实际应用中...

    java抓取网页数据示例

    Java抓取网页数据是网络编程中的一个重要实践,通常用于数据挖掘、信息分析或自动化测试等场景。这个过程涉及到HTTP协议的理解以及Java内置的网络通信类库的使用。在Java中,我们可以使用`HttpURLConnection`类来...

    网页自动采集java程序实现

    网页抓取,也称为网络爬虫或蜘蛛,是一种通过自动化程序从互联网上获取信息的技术。在这个过程中,程序会模拟用户行为,发送HTTP请求到目标网站,然后解析返回的HTML内容,提取所需信息。对于"内涵吧"这样的网站,...

    java视频生成图片(缩略图)-实例-(指定时间)

    9. **错误处理:** 实际应用中,必须考虑到可能出现的各种异常情况,如视频文件格式不支持、指定时间点超出视频长度等,并做好相应的错误处理。 以上就是关于"Java视频生成图片(缩略图)-实例-(指定时间)"的主要...

    将网页保存为图片或者pdf

    在IT行业中,有时候我们需要将网页内容保存为图片...通过提供的文档`网页爬取调研文档.docx`,你可以深入理解这个过程,包括可能出现的问题和解决策略。这是一项实用的技能,尤其是在需要自动化网页内容处理的项目中。

    网页获取节目单

    `Date.java`可能与日期和时间处理有关,因为在抓取网页数据时,我们经常需要处理包含时间信息的节目单。这个类可能封装了对日期格式化、比较或者解析的方法,以适应不同的日期格式。 `TxtBean.java`暗示了存在一个...

    java,jsp读取远程图片到本地服务器

    在Java和JSP开发中,有时我们需要处理在线编辑器上传的内容,这可能涉及到从Web页面中获取远程图片并将其保存到本地服务器。这样的功能对于确保网站的性能和用户体验至关重要,因为将图片本地化可以减少加载时间,...

    java多线程抓取图片

    Java多线程技术在爬虫应用中的重要性不言而喻,它能显著提升图片抓取的效率。本文将深入探讨如何使用Java实现多线程爬虫,以及压缩包中的三个示例案例。 首先,我们需要了解Java中的多线程概念。在Java中,通过创建...

    网页版答题(Java,用于检查作业)

    4. **Java后端**:作为“网页版答题”的核心部分,Java负责处理用户的请求,如获取题目、提交答案、计算总分等。使用Java可以构建稳定且高效的服务器端,例如使用Spring Boot框架构建RESTful API,接收HTTP请求并...

    Android源码之用HttpClient获取网页

    在"WebDataShow"这个文件中,可能是包含了一个展示从网络获取网页数据的示例应用。通过分析和学习这个例子,你可以更好地理解上述步骤在实际代码中的实现,进一步提升你在Android网络编程方面的能力。

    java 网络爬虫 爬去别人的网页

    Java网络爬虫是一种用于自动化获取网页内容的程序。在Java中实现网络爬虫涉及多个核心概念和技术,包括网络连接、HTML解析、数据存储以及多线程等。以下是对标题和描述中提到的知识点的详细说明: 1. **网络连接**...

    基于java爬取股票数据的一个项目.zip

    该项目是使用Java编程语言实现的股票数据爬取系统,旨在从网络上抓取实时或历史的股票市场数据。以下是对这个项目中可能涉及的关键技术、概念和知识点的详细解释: 1. **网络爬虫(Web Crawler)**:网络爬虫是自动...

    招标信息爬虫Java+html

    标题中的“招标信息爬虫Java+html”表明我们要讨论的是一个使用Java编程语言实现的网络爬虫,其目标是抓取网页上的招标信息。招标信息通常在网上公布,以供潜在的供应商参与竞标,这些信息可能包括项目名称、招标...

Global site tag (gtag.js) - Google Analytics