在获得天涯论坛页面的时间时可能会出现类似于 2009-12-1612:20:00以及2009-12-1 6 12:20:00的现象
其中1 6中间的出现的只是表现为空格的字符,它的char值目前看到的有 32、12288这两种
在天涯这一块得到时间后应该把时间变为yyyy-MM-ddhh:mm:ss模式,不包括出现char值为32、12288的这种现象
改变时间格式的方案为:
if(reply_date.length()>19){
if(reply_date.indexOf((char)32)!=-1){
reply_date = reply_date.replace((char) 32, ' ');
}
reply_date = reply_date.replace(" ", "");
}
针对多出字符的解决方案为:
if((reply_date.indexOf((char)32)!=-1)||(reply_date.indexOf((char)12288)!=-1)){
reply_date = reply_date.replace((char) 32, ' ');
reply_date = reply_date.replace((char)12288, ' ');
reply_date = reply_date.replace(" ", "");
String test1 = "";
String test2 = "";
test1 = reply_date.substring(0,10);
test2 = reply_date.substring(10);
reply_date = test1+" "+test2;
}
时间没有空格的解决方案为:
if(!reply_date.substring(9,10).equals(" ")){
String test1 = "";
String test2 = "";
test1 = reply_date.substring(0,9);
test2 = reply_date.substring(9);
reply_date = test1+" "+test2;
}
分享到:
相关推荐
在Java编程语言中,HTTP(超文本传输协议)是一种用于在Web上发送和接收数据的主要方法。本知识点主要探讨如何...在实际项目中,根据需求,可能还需要处理其他复杂情况,例如cookies管理、代理设置、用户代理模拟等。
在Web开发和数据抓取领域,Java爬虫技术是实现网页自动化信息提取的重要手段。本文主要讲述如何利用Java编程语言中的Jsoup库和HttpClient工具包来获取和解析动态生成的数据,特别是那些通过JavaScript动态加载的数据...
3. 执行抓取任务:依据配置文件中的规则,发起HTTP请求获取网页内容。 4. 内容解析与处理:解析抓取到的HTML,根据预设规则提取目标内容并进行进一步的处理。 四、目前缺陷功能描述 尽管系统具有一定的实用性,但也...
在Java编程中,爬取网页并保存是一项常见的任务,用于获取和分析互联网上的信息。本文将详细介绍两种简单的方法来实现这一目标:使用`java.net.URLConnection`和`org.apache.http.client.HttpClient`。 首先,我们...
### 使用Java快速判断网页链接是否有效 在互联网应用开发中,经常会遇到需要验证网页链接有效性的情况。例如,在爬虫程序中需要确保所抓取的链接是有效的,或者是在网站维护过程中检查外部链接的有效性等。本文将...
在Java编程语言中,截取指定网页并保存为图片是一项常见的需求,比如用于网页快照、自动化测试或者数据抓取等场景。实现这个功能通常涉及网络请求、网页解析以及图像处理等多个方面。以下是一个详细的步骤解析: 1....
例如,`flyerhzm-contactlist-855a71f`可能是一个特定版本的Java项目,它提供了抓取和解析邮箱网页的函数。这个库可能包含了解析HTML、模拟登录、跟踪cookies等功能,以实现对网页内容的自动化操作。 在实际应用中...
Java抓取网页数据是网络编程中的一个重要实践,通常用于数据挖掘、信息分析或自动化测试等场景。这个过程涉及到HTTP协议的理解以及Java内置的网络通信类库的使用。在Java中,我们可以使用`HttpURLConnection`类来...
网页抓取,也称为网络爬虫或蜘蛛,是一种通过自动化程序从互联网上获取信息的技术。在这个过程中,程序会模拟用户行为,发送HTTP请求到目标网站,然后解析返回的HTML内容,提取所需信息。对于"内涵吧"这样的网站,...
9. **错误处理:** 实际应用中,必须考虑到可能出现的各种异常情况,如视频文件格式不支持、指定时间点超出视频长度等,并做好相应的错误处理。 以上就是关于"Java视频生成图片(缩略图)-实例-(指定时间)"的主要...
在IT行业中,有时候我们需要将网页内容保存为图片...通过提供的文档`网页爬取调研文档.docx`,你可以深入理解这个过程,包括可能出现的问题和解决策略。这是一项实用的技能,尤其是在需要自动化网页内容处理的项目中。
`Date.java`可能与日期和时间处理有关,因为在抓取网页数据时,我们经常需要处理包含时间信息的节目单。这个类可能封装了对日期格式化、比较或者解析的方法,以适应不同的日期格式。 `TxtBean.java`暗示了存在一个...
在Java和JSP开发中,有时我们需要处理在线编辑器上传的内容,这可能涉及到从Web页面中获取远程图片并将其保存到本地服务器。这样的功能对于确保网站的性能和用户体验至关重要,因为将图片本地化可以减少加载时间,...
Java多线程技术在爬虫应用中的重要性不言而喻,它能显著提升图片抓取的效率。本文将深入探讨如何使用Java实现多线程爬虫,以及压缩包中的三个示例案例。 首先,我们需要了解Java中的多线程概念。在Java中,通过创建...
4. **Java后端**:作为“网页版答题”的核心部分,Java负责处理用户的请求,如获取题目、提交答案、计算总分等。使用Java可以构建稳定且高效的服务器端,例如使用Spring Boot框架构建RESTful API,接收HTTP请求并...
在"WebDataShow"这个文件中,可能是包含了一个展示从网络获取网页数据的示例应用。通过分析和学习这个例子,你可以更好地理解上述步骤在实际代码中的实现,进一步提升你在Android网络编程方面的能力。
Java网络爬虫是一种用于自动化获取网页内容的程序。在Java中实现网络爬虫涉及多个核心概念和技术,包括网络连接、HTML解析、数据存储以及多线程等。以下是对标题和描述中提到的知识点的详细说明: 1. **网络连接**...
该项目是使用Java编程语言实现的股票数据爬取系统,旨在从网络上抓取实时或历史的股票市场数据。以下是对这个项目中可能涉及的关键技术、概念和知识点的详细解释: 1. **网络爬虫(Web Crawler)**:网络爬虫是自动...
标题中的“招标信息爬虫Java+html”表明我们要讨论的是一个使用Java编程语言实现的网络爬虫,其目标是抓取网页上的招标信息。招标信息通常在网上公布,以供潜在的供应商参与竞标,这些信息可能包括项目名称、招标...