package cracler;
import java.io.BufferedReader;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import org.apache.commons.httpclient.HttpClient;
import org.apache.commons.httpclient.methods.GetMethod;
public class CrawOnePageImg {
/**
* @param args
*/
public static void main(String[] args) {
String url = "http://www.baidu.com/";
GetMethod method = new GetMethod(url);
HttpClient client = new HttpClient();
try {
client.executeMethod(method);
InputStream in = method.getResponseBodyAsStream();
BufferedReader reader = new BufferedReader(new InputStreamReader(in, method.getResponseCharSet()));
StringBuilder sb = new StringBuilder();
String line;
while( (line = reader.readLine()) != null){
sb.append(line);
}
String body = sb.toString();
Pattern p = Pattern.compile("<img.*?src=\"(.*?)\""); //() 捕获组
Matcher m = p.matcher(body);
while (m.find()){
System.out.println(m.group(1));
}
} catch (Exception e) {
e.printStackTrace();
}
method.releaseConnection();
}
}
分享到:
相关推荐
此时在下面左边的列表里面会显示出生成要下载的图片地址列表。 第六步:点击“选择存储位置”按钮,找到一个位置,用来存放配置文件及要下载的图片的位置。不要忘记文件名处要填写一个名字,自己随意起就好了。填好...
**TCP/IP通信协议详解与Wireshark抓包分析** 在信息技术领域,TCP/IP通信协议是互联网上数据交换的基础。TCP(传输控制协议)和IP(因特网协议)是这个协议族中的两个核心组件,负责确保数据的可靠传输和网络寻址。...
1. 获取图片元素`<img>`,并读取其`offsetWidth`和`offsetHeight`属性,这代表了图片在页面上的实际宽度和高度。 2. 获取图片的CSS `transform`属性,这可能包含缩放或旋转信息。如果存在,需要解码变换矩阵,并应用...
例如,用米家全景 app 分享全景图片到微博时的信息都会被抓取和显示。 本文详细介绍了使用 Fiddler 工具在 Android 手机上抓包的过程,包括 PC 端和手机端的配置过程,可以帮助开发者和测试人员更好地进行移动应用...
7. 响应体:服务器返回的具体内容,可能是HTML页面、JSON数据、图片等。 使用HTTPLOOK,用户可以深入研究HTTP交互,例如查看请求参数是否正确、响应时间是否过长、是否存在异常的请求或响应。此外,通过分析...
汉字文化承载着华夏的文明,是世界上最古老的文化之一,中国国际的地位越来越高,学习汉字的热浪席卷整个世界,中国汉字讲究一笔一划, поэтому对字的熟悉不能光靠嘴说,汉字要从娃娃抓起。 知识点2:系统的...
来抓我啊 显示系统字体 时钟的使用 旋转的秒针 方法重载 文件读写 文件夹内容搜索器 数组应用 支持单用户的服务器模型 挂起恢复线程 拼图游戏 恢复挂起线程 工具栏的使用 多窗口应用程序 图片转换器 命令行参数 启动...
我立即下载试了一下,的确非常棒,能快速的抓取屏幕上任何文本型文字,有了这个软件,那些网页用不起右键复制的它都可以帮你办到哦,很好玩的! Ctrl+Shift+鼠标左键拖动出一个捕捉的范围松开鼠标左键,然后会自动有一...
2011年的侵权风波提醒了商家,提升品牌形象需要从图片质量抓起。淘宝女装运营自2010年起便着重推进细节实拍项目,旨在规范市场,提升整体品质,使得参加女装运营组织的促销活动的商家必须满足这一要求。 细节图的...
但如果用微信打开的网页链接,或者小程序之类的,这个标题text或者页面内容获得不到。 各位有什么思路,能把这个信息捕获到么? 3、黑名单的开启时间段 比如设置成晚上或者周末,可以使用黑名单的程序 4、防被杀 ...
在文案的选择和标题的撰写方面,设计师应该抓准产品的定位,明确营销思路,并提取出标题中重要的信息,如促销数字和商品卖点。设计应将文字转化为图像,因为视觉元素比文字系统更直观,无需思考即可形成心理感受。...
增加robots.txt, 限制了蜘蛛抓取频率,防止被抓爆空间。 调整删除缓存的频率,避免过分消耗CPU。、 配置中心的关键词导航调整,防止导致商品详细页详情被替换掉。 配置中心使用官方配置时,不覆盖友情链接及伪静态...
- 切片工具:将图像分割成多个小块,方便网页设计时的图片导出。 - 切片选择工具:选择和调整已有的切片。 **喷枪工具【J】** - 用类似于喷漆的方式进行绘画,创建自然过渡的效果。 **画笔工具、铅笔工具【B】** -...