- 浏览: 1277105 次
- 性别:
- 来自: 深圳
文章分类
- 全部博客 (608)
- 数据结构 (2)
- AJAX (3)
- 设计模式 (3)
- java (117)
- js (14)
- css (9)
- jsp (10)
- 杂文 (49)
- htmlparser (6)
- 数据库 (29)
- 算法 (14)
- 数据挖掘 (11)
- 电脑杂症 (12)
- 网络爬虫 (7)
- 应用服务器 (9)
- PHP (2)
- C# (14)
- 测试 (3)
- WEB高性能开发 (3)
- swt (1)
- 搜索引擎 (16)
- HttpClient (4)
- Lite (1)
- EXT (1)
- python (1)
- lucene (4)
- sphinx (9)
- Xapian (0)
- linux (44)
- 问题归类 (1)
- Android (6)
- ubuntu (7)
- SEO (18)
- 数学 (0)
- 农业资讯 (12)
- 游戏 (3)
- nginx (1)
- TeamViewer (1)
- swing (1)
- Web前 端 (1)
- 主页 (0)
- 阿萨德发首发身份 (0)
- 软件设计师 (0)
- hibernate (5)
- spring3.0 (5)
- elastic (1)
- SSH (3)
- ff (0)
- oracle 10g (9)
- 神经网络 (1)
- struts2.0 (2)
- maven (1)
- nexus (1)
- 辅助工具 (3)
- Shiro (1)
- 联通项目 (0)
- 2014年专业选择 (0)
- freemarker (1)
- struts1.2 (8)
- adfasdfasfasf (0)
- TortoiseSVN (1)
- jstl (1)
- jquery (1)
- eclipse plugin (0)
- 游戏外挂 (1)
- 推广 (0)
- 按键精灵 (1)
- ibatis3.0 (1)
最新评论
-
水野哲也:
不不不, 这个您真错了!其实是你引用的那个jsp和本身的jsp ...
解析关于jsp页面指令冲突问题contentType="text/html;charset=UTF-8" -
caobo_cb:
import xx.cn.weibo.Util;
[ java版]新浪微博之ruquest_token篇 -
caobo_cb:
你好 Util包没有
[ java版]新浪微博之ruquest_token篇 -
小桔子:
你好!我遇到个问题 max_allowed_packet值总是 ...
mysql查询占用内存,优化的技巧 -
donghustone:
谢谢大神!
用JSmooth制作java jar文件的可执行exe文件教程(图文)
问题是---------bufferreader不管如何转化字符集读取,内容显示均为乱码;后来,使用htmlparse解析html的开源代码,发现在读取网页时没有问题 ==== trace code 发现 乱码有可能是压缩网页造成
比如是-----gzip格式的网页;所以采用以下代码读取网页是没有问题
public static void GetFromHtml() throws IOException{ //int ret=0; String contentEncoding; HttpURLConnection url=null; //String htmladdr="http://www.zhcw.com/data-js/nowdata50.js"; String htmladdr="http://www.itpub.net/753054.html"; StringBuffer buffer=new StringBuffer(""); try { URL url1 = new URL(htmladdr); url = (HttpURLConnection)url1.openConnection (); url.setRequestProperty("User-Agent", "mozlla/5.0"); url.setRequestProperty("Accept-Encoding", "gzip, deflate"); url.connect(); contentEncoding=url.getContentEncoding(); } catch (Exception e) { // TODO Auto-generated catch block e.printStackTrace(); return ; } if(url!=null){ InputStream stream; if ((null != contentEncoding) && (-1 != contentEncoding.indexOf ("gzip")) { stream = new GZIPInputStream ( url.getInputStream ()); } else if ((null != contentEncoding) && (-1 != contentEncoding.indexOf ("deflate")) { stream = new InflaterInputStream ( url.getInputStream ()); } else { stream = url.getInputStream (); } //InputStream stream= url.getInputStream(); BufferedReader reader = new BufferedReader(new InputStreamReader(stream)); String temp; while (null != (temp = reader.readLine())) { //temp=new String(reader.readLine().getBytes("gbk"); System.out.println(temp); // break; } reader.close(); } }
转载:http://hi.baidu.com/anypcao/blog/item/965d4443161751159213c634.html
发表评论
-
tomcat was unable to start within 45 seconds
2013-11-11 15:59 842原因一: -
Apache Commons Lang
2013-10-15 12:10 3170ArrayUtils public class Tes ... -
htmlunit form
2013-06-25 11:13 931Form提交 对于WEB应用,有着大量的表单,所以Html ... -
QQ微博登录步骤
2013-05-28 12:14 0QQ微博登录步骤: 1、验证帐号时,会访问一个地址。如下: ... -
jsoup
2013-05-22 23:37 1148import org.jsoup.Jsoup; import ... -
java 加密解密
2013-05-21 23:00 851import java.security.InvalidKey ... -
freemarket 对象应用篇(一)
2013-05-19 18:18 1049freemarket应用. 1.1:创建web工程testF ... -
中文数字转阿拉伯数字
2012-11-30 14:24 1804/** * @author loiy * ... -
标记:伪原创标题思路
2012-01-11 16:34 1299采用填词的办法进行伪 ... -
用JSmooth制作java jar文件的可执行exe文件教程(图文)
2012-01-05 01:09 8200下载完程序之后,运行 jsmoothgen.exe 1.进入“ ... -
多线程 Java.util.ConcurrentModificationException异常
2011-12-29 13:43 1531Iterator<Entry<String,B ... -
java 反序列化 抛出EOFException
2011-12-19 17:21 2261抛出这样的异常,一般情况下,是因为业务逻辑的问题。 如: 在没 ... -
一键安装双击运行——Java安装程序制作
2011-12-09 02:39 1336对于Java桌面应用来说,比较烦琐的就是安装部署问题,如:客户 ... -
只针对中英文混合分词的中文分词器
2011-12-02 17:28 4879该版本说明 1、只针对中英文混合分词 需要一些中文和英文连在 ... -
Java开源运行分析工具
2011-11-15 15:10 1890FProfiler FProfiler是一个非常快的Java ... -
cwss 按照指定的字符进行切词
2011-11-15 09:37 1241cwss 按照指定的字符进行切词 在 Utility.SEPE ... -
cwss bug 修复
2011-11-07 09:50 894修复的BUG有如下: 1、当只有中文、字母和数字,没有任何其他 ... -
java 怎么读取细胞词库scel
2011-10-24 14:28 3124private void sogou(String pa ... -
今天遇到一个奇怪的问题
2011-04-28 11:55 1190想实现一个用户访问页面,得到用户的外网地址 在公司上。程序是没 ... -
在myeclipse6.5下统一全部JSP编码更改
2011-04-07 14:47 1467在平时我们新建一个JSP页面默认编码是"ISO885 ...
相关推荐
对于POST请求,我们通常使用多部分/形式数据(Multipart/form-data)编码来传输文件,这是HTML表单上传文件的标准方式。 1. **配置连接**: 在Java中,我们首先创建HttpURLConnection实例,设置连接属性,例如设置...
jsoup是一个Java HTML Parser。能够从URL、文件或字符串解析HTML。利用DOM traversal或CSS selectors查找和抽取数据。能够操作HTML元素,属性和文本。能够依据一个白名单过滤用户提交的内容。
在Java编程语言中,读取HTML文档主要涉及网络请求、HTML解析和DOM操作等技术。以下将详细讲解如何实现这一过程。 首先,我们需要获取HTML文档的内容。这通常通过HTTP请求来完成,Java提供了多种库来处理HTTP请求,...
通过不断读取`ServletInputStream`,并将数据写入到文件,我们可以看到上传的文件和参数以特定格式存储。 以下是一些关键点: 1. **分隔符**:每个文件或参数都由一个唯一的分隔符开始,如`----------------------...
- 获取网页源码:与下载图片类似,但此时需要获取的是`getInputStream()`,然后使用`BufferedReader`读取每一行,组合成字符串。 - 加载到WebView:使用WebView的`loadDataWithBaseURL()`或`loadData()`方法,传入...
在编程领域,构建一个能显示URL中HTML文件的简易浏览器是一项基础且实用的任务。这个任务主要涉及Java语言,因此我们将会深入探讨Java如何处理HTTP请求、解析HTML内容以及在控制台或图形用户界面(GUI)中展示这些...
- 如果HTML文件存储在网络服务器上,你可以使用`HttpURLConnection`或`OkHttp`等网络库获取HTML内容。 - 如果HTML文件在本地(如 assets 目录下),可以使用`AssetManager`读取文件内容。 2. **解析HTML内容** ...
- 结果数据可以写入文本文件,方便后续处理和分析。 5. **设计模式**: - 文中提到程序包含两个类:`CollectAction`负责数据采集,`Main`类负责界面构建和控制。这是一种简单的职责分离,体现了单一职责原则,...
1. 文件下载:可以使用java.io.File和java.io.FileOutputStream来下载文件,通过HttpURLConnection的getInputStream()方法获取网络输入流,然后写入本地文件。 2. 文件管理:遵循Android的存储权限模型,通常将下载...
以下是使用HttpURLConnection获取HTML文件和图片的基本步骤: 1. **创建网络请求**:使用`java.net.URL`创建一个URL对象,传入服务器资源的URL。然后通过`openConnection()`方法获取HttpURLConnection实例。 ```...
本文将详细介绍一个Java程序,该程序能够将程序员编写的动态JSP页面最终生成为静态的HTML文件。 #### 关键技术与概念 1. **JSP (JavaServer Pages)**:一种基于Java的服务器端脚本技术,用于创建动态网页。JSP文件...
对于多文件上传,通常使用Multipart方式,比如在HTML表单中常见的方式。在安卓中,我们可以使用`MultiPartEntityBuilder`或`RequestBody`(在OkHttp中)来构建请求体。每份文件作为一个单独的部分,每个部分都包含...
综上所述,"java,jsp读取远程图片到本地服务器"涉及到的技术点包括Java和JSP的基础知识、HTTP通信、文件操作、HTML解析、在线编辑器集成以及性能优化等多个方面。理解并掌握这些知识点对于开发此类应用至关重要。
- **Java IO**:Java的I/O流API是处理文件读写的核心,可以用于读取本地文件内容并准备上传。 - **HTTP客户端库**:Java中,如Apache HttpClient或Java内置的HttpURLConnection,可以用于发起HTTP请求,将文件数据...
读取网页源码通常涉及网络请求,可以使用像Java的HttpURLConnection或HttpClient这样的库。一旦获取到响应,解析源码则可以通过Jsoup这样的库实现,它能方便地提取数据并处理DOM结构。 TXT文件是最简单的文本格式,...
在读取JSP文件时,我们可能需要解析返回的HTML内容,提取所需信息。这可能涉及到DOM、SAX或Jsoup等HTML解析库的使用。例如,我们可以通过解析HTML找到特定的元素或数据,以获取页面的状态或数据。 写入操作则更复杂...
在Java编程中,从URL读取文件内容是常见的需求,例如获取网页的HTML源码或者下载远程资源。以下是一个详细的Java通过URL读取文件内容的示例,涵盖了两种不同的方法: ### 方法一:使用`java.net.URL`和`java.io....
在Android开发中,当涉及到与服务器进行数据交互,特别是上传文件时,如用户注册时上传头像,我们通常会遇到一个问题:内置的`HttpURLConnection`或`HttpClient`并不直接支持表单格式的文件上传。因此,我们需要采取...
为了读取服务器的响应,我们可以创建一个`BufferedReader`,从`HttpURLConnection`的`getInputStream()`获取输入流,逐行读取响应内容。通常,服务器返回的数据会被解析成JSON或XML等格式,然后在客户端进行处理。 ...
如果使用Gradle,可以在build.gradle文件中添加: ```gradle dependencies { implementation 'org.jsoup:jsoup:1.14.3' } ``` 然后,使用Jsoup解析HTML源码: ```java import org.jsoup.Jsoup; import org.jsoup...