最近无聊,准备做一个下载google上mp3的小工具,网上也有几款,但是感觉不是很方便,就自己用java做一个。
现在刚刚开始,是用httpclient获取页面源代码,用正则匹配出来的。
google音乐里的汉字都编码过,类似于嘆这样的,要转成汉字,自己写了个方法,已备后用
private static String getChinese(String name) {
Pattern p = Pattern.compile("&#(\\d+);");
Matcher m = p.matcher(name);
while (m.find()) {
try {
int i = Integer.parseInt(m.group(1));
name = name.replaceFirst(m.group(), (char) i + "");
} catch (Exception ex) {
//do nothing;
}
}
return name;
}
这样不管是中英文和符号混杂都可以转化。
ps:这个mp3下载的小工具地址是 http://code.google.com/p/gmp3getter/
,希望我可以完成它
分享到:
相关推荐
UTF-8和GB2312是中国简体中文常用的两种编码格式,各有其特点和适用场景。本篇文章将详细探讨如何在PHP中实现UTF-8和GB2312之间的转换,以及为何这个过程对网页开发至关重要。 首先,UTF-8是一种广泛使用的多字节...
在给定文件“UTF-8汉字码表.txt”的描述中提到的“utf-8中文汉字编码表”,主要关注的是如何用UTF-8编码来表示中文汉字。 #### 二、文件内容分析 文件中展示了一些具体的编码示例,从十六进制数字`20`到`7E`以及从...
对于非ASCII字符,如中文、日文或希腊文,UTF-8会使用多个字节来表示。 字符串(string)在不同编程语言中的实现不尽相同,但在大多数情况下,它们都是用来存储和处理文本的容器。例如,在Python中,字符串是不可变的...
本主题聚焦于“utf8_gb2312.zip”这个压缩包文件,它涉及到了字符编码标准UTF-8和GB2312,以及它们在ESP8266微控制器上的应用。下面我们将深入探讨这些知识点。 首先,让我们了解UTF-8和GB2312两种字符编码。UTF-8...
"GBK转UTF8工具 网页编码 互转工具"是一个专门用于处理这两种编码转换的软件,它的功能主要包括: 1. **GBK到UTF-8的转换**:该工具能够将使用GBK编码的文本或文件(如HTML、CSS、JavaScript等网页文件)转换为UTF-...
GBK是中国大陆广泛使用的字符编码标准,它兼容GB2312,包含了大量的汉字,而UTF-8是一种多字节的Unicode编码方式,支持世界上几乎所有的字符,包括汉字。 GBK全称为“Great Chinese Binary Code”,它基于GB2312,...
需要注意的是,从UTF8转Unicode通常不需要BOM,而从Unicode转UTF8时,根据需求可以选择是否添加BOM。 在实际应用中,理解这两种编码方式的区别和转换方法对于处理多语言文本和跨平台的数据交换至关重要。例如,在...
综上所述,"UTF-8转ANSI文本文件转换器"涉及到了字符编码的基础知识、编码转换的原理以及批量处理和代码设计的实践。理解和掌握这些知识点,对于处理文本文件编码问题、开发相关工具或理解软件内部工作流程都...
GBK(Great Chinese Character Set)是中国大陆广泛使用的汉字编码标准,而UTF-8是国际通用的Unicode编码标准,支持世界上几乎所有的字符集。在处理跨平台或者多语言的网站时,UTF-8因其广泛的兼容性和可扩展性而更...
标题中的“PB9转换utf-8例子”指的是在PowerBuilder 9(PB9)环境下将数据从非UTF-8编码转换为UTF-8编码的一种解决方案。由于PB9本身不直接支持这种转换,开发者通常需要利用外部库或者特定的编程技巧来实现这个功能...
然而,随着互联网的全球化,UTF8因其兼容性强、跨平台性好等特点逐渐成为国际标准,尤其是在网页和软件开发中。当需要在UTF8编码和中文编码之间进行转换时,就需要借助特定的转换工具。 "得心应手UTF-8编码转换器....
3. 网页显示:一些网站可能需要将UTF-8编码的网页内容转换为GBK,以适应某些浏览器的设置。 4. 文档共享:在团队协作中,为了确保所有人都能正确阅读文档,可能需要将编码统一。 了解了这些基础知识后,我们可以...
本工具涵盖了UTF-8、GB2312和Unicode这三种常见的汉字编码格式,能够方便地进行相互转换,满足了开发者和用户在数据处理过程中的需求。 UTF-8是一种广泛使用的Unicode变体,它使用一到四个字节来表示每个字符,包括...
delphi7调用delphi2009生成的dll文件会出现乱码问题。是unicode的原因 终于找到了UTF-8、Unicode格式转换函数
综上所述,GBK网页模板转UTF-8的绿色小工具是一个方便开发者和网站管理员进行字符编码转换的实用工具,它简化了编码转换的过程,确保了网页在不同环境下的正确显示。在实际操作中,理解字符编码的重要性以及如何正确...
例如,一些老的软件或数据库可能使用GB2312编码,而新的网页和应用程序普遍采用UTF-8。这时,就需要转换工具来解决编码不匹配的问题。这个名为"GB2312 Or UTF-8"的工具就是为了解决这种问题而设计的,它可以方便地在...
UTF-8最大的优点在于其兼容性,它在互联网上被广泛采用,因为大多数现代网页和编程语言都默认支持UTF-8。UTF-8编码的一个特点是,英文和很多常用汉字只用一个字节表示,而复杂的字符则可能需要多个字节。这样既能...