java抓取网页上的时间可能出现的状况 - xingcxb - ITeye博客

`

xingcxb

浏览: 50510 次
性别:
来自: 上海

最近访客更多访客>>

ralin

jndl99999

woodding2008

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

wangjl_yt：怎样在myeclipse中，增加GMF插件
Myeclipse Access restriction 问题的解决

java抓取网页上的时间可能出现的状况

阅读更多

在获得天涯论坛页面的时间时可能会出现类似于 2009-12-1612:20:00以及2009-12-1 6 12:20:00的现象
其中1 6中间的出现的只是表现为空格的字符，它的char值目前看到的有 32、12288这两种
在天涯这一块得到时间后应该把时间变为yyyy-MM-ddhh:mm:ss模式，不包括出现char值为32、12288的这种现象
改变时间格式的方案为：
if(reply_date.length()>19){
if(reply_date.indexOf((char)32)!=-1){
reply_date = reply_date.replace((char) 32, ' ');
}
reply_date = reply_date.replace(" ", "");
}

针对多出字符的解决方案为:
if((reply_date.indexOf((char)32)!=-1)||(reply_date.indexOf((char)12288)!=-1)){
reply_date = reply_date.replace((char) 32, ' ');
reply_date = reply_date.replace((char)12288, ' ');
reply_date = reply_date.replace(" ", "");
String test1 = "";
String test2 = "";
test1 = reply_date.substring(0,10);
test2 = reply_date.substring(10);
reply_date = test1+" "+test2;
}

时间没有空格的解决方案为：
if(!reply_date.substring(9,10).equals(" ")){
String test1 = "";
String test2 = "";
test1 = reply_date.substring(0,9);
test2 = reply_date.substring(9);
reply_date = test1+" "+test2;
}

分享到：

三个大于号 | 测试软件性能的测试计划

2011-09-08 23:50
浏览 814
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

java http方式抓取网页信息 JAVAＩＯ: 在Java编程语言中，HTTP（超文本传输协议）是一种用于在Web上发送和接收数据的主要方法。本知识点主要探讨如何...在实际项目中，根据需求，可能还需要处理其他复杂情况，例如cookies管理、代理设置、用户代理模拟等。

Java爬虫Jsoup+httpclient获取动态生成的数据: 在Web开发和数据抓取领域，Java爬虫技术是实现网页自动化信息提取的重要手段。本文主要讲述如何利用Java编程语言中的Jsoup库和HttpClient工具包来获取和解析动态生成的数据，特别是那些通过JavaScript动态加载的数据...

基于JAVA技术的网页内容智能抓取.doc: 3. 执行抓取任务：依据配置文件中的规则，发起HTTP请求获取网页内容。 4. 内容解析与处理：解析抓取到的HTML，根据预设规则提取目标内容并进行进一步的处理。四、目前缺陷功能描述尽管系统具有一定的实用性，但也...

详解Java两种方式简单实现：爬取网页并且保存: 在Java编程中，爬取网页并保存是一项常见的任务，用于获取和分析互联网上的信息。本文将详细介绍两种简单的方法来实现这一目标：使用`java.net.URLConnection`和`org.apache.http.client.HttpClient`。首先，我们...

使用java快速判断网页链接是否有效: ### 使用Java快速判断网页链接是否有效在互联网应用开发中，经常会遇到需要验证网页链接有效性的情况。例如，在爬虫程序中需要确保所抓取的链接是有效的，或者是在网站维护过程中检查外部链接的有效性等。本文将...

java截图指定网页保存图片: 在Java编程语言中，截取指定网页并保存为图片是一项常见的需求，比如用于网页快照、自动化测试或者数据抓取等场景。实现这个功能通常涉及网络请求、网页解析以及图像处理等多个方面。以下是一个详细的步骤解析： 1....

java获取邮箱联系人库文件: 例如，`flyerhzm-contactlist-855a71f`可能是一个特定版本的Java项目，它提供了抓取和解析邮箱网页的函数。这个库可能包含了解析HTML、模拟登录、跟踪cookies等功能，以实现对网页内容的自动化操作。在实际应用中...

java抓取网页数据示例: Java抓取网页数据是网络编程中的一个重要实践，通常用于数据挖掘、信息分析或自动化测试等场景。这个过程涉及到HTTP协议的理解以及Java内置的网络通信类库的使用。在Java中，我们可以使用`HttpURLConnection`类来...

网页自动采集java程序实现: 网页抓取，也称为网络爬虫或蜘蛛，是一种通过自动化程序从互联网上获取信息的技术。在这个过程中，程序会模拟用户行为，发送HTTP请求到目标网站，然后解析返回的HTML内容，提取所需信息。对于"内涵吧"这样的网站，...

java视频生成图片（缩略图）-实例-（指定时间）: 9. **错误处理：** 实际应用中，必须考虑到可能出现的各种异常情况，如视频文件格式不支持、指定时间点超出视频长度等，并做好相应的错误处理。以上就是关于"Java视频生成图片（缩略图）-实例-（指定时间）"的主要...

基于java爬取股票数据的一个项目.zip: 该项目是使用Java编程语言实现的股票数据爬取系统，旨在从网络上抓取实时或历史的股票市场数据。以下是对这个项目中可能涉及的关键技术、概念和知识点的详细解释： 1. **网络爬虫（Web Crawler）**：网络爬虫是自动...

将网页保存为图片或者pdf: 在IT行业中，有时候我们需要将网页内容保存为图片...通过提供的文档`网页爬取调研文档.docx`，你可以深入理解这个过程，包括可能出现的问题和解决策略。这是一项实用的技能，尤其是在需要自动化网页内容处理的项目中。

网页获取节目单: `Date.java`可能与日期和时间处理有关，因为在抓取网页数据时，我们经常需要处理包含时间信息的节目单。这个类可能封装了对日期格式化、比较或者解析的方法，以适应不同的日期格式。 `TxtBean.java`暗示了存在一个...

java，jsp读取远程图片到本地服务器: 在Java和JSP开发中，有时我们需要处理在线编辑器上传的内容，这可能涉及到从Web页面中获取远程图片并将其保存到本地服务器。这样的功能对于确保网站的性能和用户体验至关重要，因为将图片本地化可以减少加载时间，...

java多线程抓取图片: Java多线程技术在爬虫应用中的重要性不言而喻，它能显著提升图片抓取的效率。本文将深入探讨如何使用Java实现多线程爬虫，以及压缩包中的三个示例案例。首先，我们需要了解Java中的多线程概念。在Java中，通过创建...

网页版答题（Java，用于检查作业）: 4. **Java后端**：作为“网页版答题”的核心部分，Java负责处理用户的请求，如获取题目、提交答案、计算总分等。使用Java可以构建稳定且高效的服务器端，例如使用Spring Boot框架构建RESTful API，接收HTTP请求并...

Android源码之用HttpClient获取网页: 在"WebDataShow"这个文件中，可能是包含了一个展示从网络获取网页数据的示例应用。通过分析和学习这个例子，你可以更好地理解上述步骤在实际代码中的实现，进一步提升你在Android网络编程方面的能力。

java 网络爬虫爬去别人的网页: Java网络爬虫是一种用于自动化获取网页内容的程序。在Java中实现网络爬虫涉及多个核心概念和技术，包括网络连接、HTML解析、数据存储以及多线程等。以下是对标题和描述中提到的知识点的详细说明： 1. **网络连接**...

招标信息爬虫Java+html: 标题中的“招标信息爬虫Java+html”表明我们要讨论的是一个使用Java编程语言实现的网络爬虫，其目标是抓取网页上的招标信息。招标信息通常在网上公布，以供潜在的供应商参与竞标，这些信息可能包括项目名称、招标...

Global site tag (gtag.js) - Google Analytics