`
skzr.org
  • 浏览: 362660 次
  • 性别: Icon_minigender_1
  • 来自: 长沙
社区版块
存档分类
最新评论

wget中文url问题?

阅读更多

环境:ubuntu10.10 64bit,wget 1.12

现象:保存带中文URL的路径时中文乱码

参考:wget中文乱码

解决:

通过设置参数:--restrict-file-names=OS一样可以正确解决此问题

 

经过测试下面的解决办法,还是有问题:

1. 下载wget源代码

2. 编辑url.c:1403行修改为    if (FILE_CHAR_TEST (*p, mask) && !((*p | 0x0fffffff) == 0xffffffff)),红色部分就是添加的,详细上下文:

 

  /* Walk the PATHEL string and check how many characters we'll need
     to quote.  */
  quoted = 0;
  for (p = b; p < e; p++)
    if (FILE_CHAR_TEST (*p, mask) && !((*p | 0x0fffffff) == 0xffffffff))
      ++quoted;
 

3. 重新编译安装即可:

 

make
sudo make install
 

 

 

分享到:
评论
1 楼 skzr.org 2011-02-22  
对于此方法,应该只适合linux,utf-8的系统

相关推荐

    支持中文目录wget版本,linux版本

    url_file_name()在根据url的形式判断该保存为什么样的文件名,并进行了多方面的考虑,最终该函数调用了append_uri_pathel(),该函数会判断url中的特殊字符,例如空格等,如果遇到这些字符wget把它进行转义,而问题就...

    Wget 中文手册详解

    ### Wget 中文手册详解 **Wget**是一款强大的命令行工具,主要用于在网络环境中下载文件。它支持多种协议,包括HTTP、HTTPS以及FTP,并且具备断点续传、多线程下载等多种高级功能,适用于各种操作系统环境。下面将...

    Wget工具中文手册

    ### Wget工具中文手册知识点详解 #### 一、Wget工具概述 - **定义与功能**:`wget`是一款开源的、用于从网络上自动下载文件的工具。它支持多种网络协议,包括HTTP、HTTPS及FTP,并且可以利用HTTP代理进行下载。 - ...

    windows版wget

    4. **配置文件**:`wget.cn.txt`和`wget.en.txt`可能分别包含wget的中文和英文帮助文档,用户可以通过阅读这些文档了解更详细的使用方法和高级选项。 5. **镜像和递归下载**:wget可以通过`-m`或`--mirror`选项来...

    wget命令行工具(有个简单教程)

    中文教程通常会提供基础用法的实例和常见问题解答,帮助理解各种选项的含义。英文教程则可能包含更详细的技术细节和高级用法,适合深入研究。 总之,wget是一个强大且灵活的命令行下载工具,掌握了它的使用,能极大...

    php中解析带中文字符的url函数分享

    在PHP中处理URL时,如果URL包含中文字符,常常会导致问题,尤其是当这些URL需要通过某些函数如wget、curl或file_get_contents等进行处理时。由于这些函数默认不会对中文字符进行处理,直接使用会导致404错误。因此,...

    sqlmap中文文档

    * --load-cookies=LOADCOOKIES: 含 Netscape / wget cookies 文件格式 * --drop-set-cookie: 忽略设置的头部信息 四、HTTP 头部信息 * --user-agent=AGENT: HTTP 用户代理标头值 * --random-agent: 使用随机选择 ...

    linux常用命令手册中文版

    - `curl`/`wget`:从网络下载文件,`curl -O url`或`wget url`。 - `nc`/`netcat`:网络工具,可用于端口扫描、数据传输等。 - `ssh`:安全外壳协议,用于远程登录。 6. **进程与系统管理** - `ps`:显示当前...

    [完整][中文][WEB安全测试].(美)霍普.扫描版.pdf

    本书中的秘诀演示了开发和测试人员在进行单元测试、回归测试或探索性测试的同时,如何去检查最常见的Web安全问题。与即兴的安全评估不同的是,这些秘诀是可重复的、简洁的、系统的——可以完美地集成到你的常规测试...

    Centos7下安装Bugzilla详细步骤并附中文包

    Bugzilla是一款开源的错误跟踪系统,常用于软件开发过程中管理问题和缺陷。在CentOS 7上安装Bugzilla,你需要遵循以下步骤: 1. **更新系统**:首先确保你的CentOS 7系统是最新的,运行以下命令: ``` sudo yum ...

    走进搜索引擎(上) 梁斌 编著 上中下

     其他应该注意的礼貌性问题  抓取提速策略(合作抓取策略)  第五节网页库  第六节下载系统回顾及未来发展  参考文献  第四章搜索引擎的分析系统  第一节知识准备  HTML语言  锚文本(anchortext)...

    Nutch全文搜索学习笔记

    为了处理中文乱码问题,需要在Tomcat的`server.xml`文件中配置`URIEncoding`属性: ```xml ``` #### 二、Nutch核心组件介绍 **1. Fetcher(网页抓取器)** Fetcher负责根据URL列表抓取网页内容,并更新抓取状态...

    linux命令大全中文版

    3. `curl`:从URL获取数据,常用于下载或测试网络连接。 4. `wget`:下载文件,支持断点续传。 5. `scp`:安全地在不同主机之间复制文件,基于SSH协议。 六、包管理和软件安装 1. `apt-get`/`apt`(Debian系):...

    linux初级命令备忘录中文版.pdf

    - `wget`:从网页下载文件,如`wget https://someurl.com/somefile.tar.gz`。 - `tar`:处理归档文件,如`tar -xf somefile.tar.gz`解压缩,`-C`选项指定解压的目标目录。 8. **其他常用命令**: - `head`:显示...

    Linux常用网络命令

    - `wget [url]` - **参数**: - `[url]`: 网页地址。 **示例**: ```bash lynx http://www.example.com wget http://www.example.com ``` **2. jmcce计划** - **功能**: 终端机的中文显示。 - **语法**: - `...

Global site tag (gtag.js) - Google Analytics