`
deepfuture
  • 浏览: 4417070 次
  • 性别: Icon_minigender_1
  • 来自: 湛江
博客专栏
073ec2a9-85b7-3ebf-a3bb-c6361e6c6f64
SQLite源码剖析
浏览量:80178
1591c4b8-62f1-3d3e-9551-25c77465da96
WIN32汇编语言学习应用...
浏览量:70487
F5390db6-59dd-338f-ba18-4e93943ff06a
神奇的perl
浏览量:103673
Dac44363-8a80-3836-99aa-f7b7780fa6e2
lucene等搜索引擎解析...
浏览量:286784
Ec49a563-4109-3c69-9c83-8f6d068ba113
深入lucene3.5源码...
浏览量:15063
9b99bfc2-19c2-3346-9100-7f8879c731ce
VB.NET并行与分布式编...
浏览量:67908
B1db2af3-06b3-35bb-ac08-59ff2d1324b4
silverlight 5...
浏览量:32322
4a56b548-ab3d-35af-a984-e0781d142c23
算法下午茶系列
浏览量:46109
社区版块
存档分类
最新评论

perl 获取网页内容

阅读更多
perl 获取网页内容
2009-05-31 17:22
一、LWP::Simple 模块 获取代码:
#!/usr/bin/perl
use strict;
use warnings;
use LWP::Simple;
my $url="
http://www.test.com";
my $page=get ($url);
print ("\n $page \n \n");
my $status=getprint($url);
print ("\n\n $status\n");
$status=getstore($url,"page.txt");
print ("\n $status \n");
二、HTML解析: HTML::TokeParser模块
#!/usr/bin/perl
2 use strict;
3 use warnings;
4 use LWP::UserAgent;
5 use HTML::TokeParser;
6 my $url="
http://www.test.com";
7 my $agent=new LWP::UserAgent();
8 my $request=new HTTP::Request('GET'=>$url);
9 my $response=$agent->request($request);
10 my $document=$response->content();
11
12 my $page=HTML::TokeParser->new (\$document);
13 while (my $token=$page->get_token()){
14     my $type=shift(@{$token});
15     my $text=shift(@{$token});
16     if ($type eq "T"){
17         print ("$text");
18     }
分享到:
评论

相关推荐

    perl特定网页内容

    9. **自动化**:通过编写脚本实现定时任务,定期抓取网页更新,这可能涉及到cron job或者模块如Time::HiRes。 10. **隐私与合规**:在进行网页抓取时,务必遵守网站的robots.txt规则和数据使用政策,尊重版权,避免...

    perl批量获取网页标题

    批量读取文本中的url,软化获取网址的标题

    Perl定期抓取PM2.5数据示例

    在这个"Perl定期抓取PM2.5数据示例"中,我们将探讨如何使用Perl来定期从指定的网页抓取PM2.5(细颗粒物)的空气质量指数,并进行可视化展示,可能包括在用户界面上弹出窗口来提醒用户。 首先,我们需要了解如何在...

    programming perl 网页版

    5. 模块系统:Perl的模块机制是其强大之处,允许程序员通过CPAN(Comprehensive Perl Archive Network)获取和使用大量预先编写好的代码库。书中会讲解如何使用`use`和`require`引入模块,以及如何编写自己的模块。 ...

    perl网页中所有你想要的超链接收集其中数据

    在IT领域,Perl是一种强大的文本处理语言,常用于数据挖掘和网页抓取任务。本教程将探讨如何使用Perl从网页中提取超链接并收集所需数据。首先,我们需要了解Perl的基础语法,然后学习如何利用Perl的LWP(Library for...

    ActivePerl_5.16

    Perl是一种强大的文本处理和脚本编程语言,广泛应用于系统管理、网络编程、网页开发等领域。 ActivePerl的5.16版本是2012年发布的一个重要里程碑,它包含了Perl 5.16的所有功能和改进。Perl 5.16引入了若干新特性,...

    linux 下安装perl的详细过程

    首先需要从官方网站或其他可信源下载Perl的源代码包。通常Perl的版本会包含在类似于`perl-5.6.0stable.tar.gz`这样的文件名中,例如在本例中提到的`5.6.0`为版本号,`stable`表示这是一个稳定版本。 ```bash # 下载...

    Perl CGI 轻松进阶(PDG)

    Perl CGI(Common Gateway Interface)是Web开发中的一个关键概念,它允许Perl脚本与Web服务器交互,从而创建动态网页。这个教程"Perl CGI 轻松进阶(PDG)"显然是为了帮助开发者深入理解并熟练掌握Perl CGI编程技术。...

    perl 24小时教程

    在网络编程中,Perl可以轻松处理HTTP、FTP等协议,实现网页抓取和自动化任务。同时,Perl还可以与各种数据库系统(如MySQL、PostgreSQL)集成,进行数据的存储和查询。 最后,你将接触到Perl的脚本编写和脚本调用,...

    Perl PERL编程速成教程(上中下) pdf版

    13. **Web服务和API调用**:如何利用Perl与RESTful API进行交互,获取和发送数据。 14. **高级正则表达式**:深入讲解正则表达式的高级特性,如后向引用、预查和条件表达式。 15. **Perl最佳实践**:分享编程规范...

    perl语言编程经典教程

    - **LWP::UserAgent**:用于发送HTTP请求,获取网页内容等网络操作。 #### 六、Web开发 - **框架介绍**:Catalyst等流行的Perl Web框架的基本使用方法。 - **模板引擎**:Mason等模板引擎的安装与使用示例。 - **...

    PERL6学习教程

    - **安装Rakudo**:可以通过官方网站下载最新的Rakudo版本,并按照指南进行安装。 - **执行程序**:使用Rakudo解释器可以直接运行PERL6脚本文件。 - **参与社区**:鼓励读者参与到PERL6的开发和讨论中来,贡献自己的...

    Programming Perl中文版

    - **官方文档:** 访问 Perl 官方网站 (https://www.perl.org/) 获取最新的文档和技术支持。 - **在线社区:** - Stack Overflow:针对具体问题寻求帮助的好去处。 - Reddit 的 r/perl 社区:与其他 Perl 爱好者...

    perl TK 编程指南 (perl_tk_tutorial)

    - **书籍**:《Programming Perl》是一本很好的 Perl 教程书,其中也包含了 Perl/Tk 的相关内容。 - **手册**:官方 Perl/Tk 手册提供了详尽的文档。 - **外部站点**:Perl/Tk 社区网站提供了丰富的教程和示例。 - *...

    advanced perl

    此外,还提到了可以在线获取幻灯片和其他资源,比如SlideShare网站,这对于未能亲自参加培训的人来说非常有用,他们可以通过这些资源自行学习。 最后,文档还提到Perl语言并未消亡,尽管它已经存在了很长时间,但是...

    perl网络编程基础篇

    - **LWP::UserAgent**:Perl中的这个模块允许程序模拟浏览器发送HTTP请求,获取网页内容。 - **Net::Socket**:提供低级套接字编程接口,可以创建TCP/IP或UDP连接。 - **IO::Socket**:构建在Net::Socket之上,...

    Perl 常见问题集

    - Perl遵循开放源代码许可协议,这意味着任何人都可以免费获取和使用Perl源代码。这种模式促进了广泛的社区参与和技术改进。 #### 二、Perl版本选择与差异 - **应该使用哪个版本的Perl?** - 推荐使用最新的稳定...

    strawberry-perl-5.32.0.1-64bit.msi

    描述中提到的“解决官网下载速度过慢的问题”,意味着可能用户在尝试从Perl的官方网站或其他地方下载Perl安装文件时遇到了速度瓶颈。Strawberry Perl的这个版本可能通过镜像或者其他快速的分发渠道提供,以便用户...

    周末速成课程-Perl

    1. 访问 [Perl 官方网站](http://www.perl.com/pub/language/info/software.html#stable) 获取最新版本。 2. 使用以下命令下载并解压 Perl 源码包: ```bash wget ...

    ActivePerl

    1. "PCHome_download.html" 可能是一个网页文件,记录了在PCHome(个人电脑家园,一个知名的中文科技资讯网站)上关于ActivePerl下载的信息。这个文件可能包含下载链接、使用教程或者用户评价等内容。 2. "Active...

Global site tag (gtag.js) - Google Analytics