refer to http://blog.csdn.net/xiaolang85/article/details/8823025
parse_url(url, partToExtract[, key]) - extracts a part from a URL
解析URL字符串,partToExtract的选项包含[HOST,PATH,QUERY,REF,PROTOCOL,FILE,AUTHORITY,USERINFO]。
举例:
* parse_url('http://facebook.com/path/p1.php?query=1', 'HOST')返回'facebook.com'
* parse_url('http://facebook.com/path/p1.php?query=1', 'PATH')返回'/path/p1.php'
* parse_url('http://facebook.com/path/p1.php?query=1', 'QUERY')返回'query=1',
可以指定key来返回特定参数,例如
* parse_url('http://facebook.com/path/p1.php?query=1', 'QUERY','query')返回'1',
* parse_url('http://facebook.com/path/p1.php?query=1#Ref', 'REF')返回'Ref'
* parse_url('http://facebook.com/path/p1.php?query=1#Ref', 'PROTOCOL')返回'http'
比直接使用正则表达式要方便一些~~
相关推荐
replace和解析regexp_extract函数、URL解析parse_url函数、JSON解析get_json_object函数、生成重复字符串的repeat函数、首字符ascii值的ascii函数、字符串左右填充的lpad和rpad函数、分割字符串split函数和集合查找...
14. URL解析函数:parse_url 26 15. json解析函数:get_json_object 27 16. 空格字符串函数:space 27 17. 重复字符串函数:repeat 27 18. 首字符ascii函数:ascii 28 19. 左补足函数:lpad 28 20. 右补足函数:rpad...
- **URL 解析**:`parse_url` 函数可提取 URL 的特定部分,如 `parse_url('http://facebook.com/path1/p.php?k1=v1&k2=v2#Ref1', 'HOST')` 获取主机名。 - **字符串连接**:`concat` 和 `concat_ws` 函数用于连接...
hive-笔记--hive常用用法: 内部表和外部表,导入数据,导出数据,将数据从hive的表中导出到本地磁盘目录中,HIVE的存储文件格式,修改表的分区,多重插入...json函数,分组topn,网页URL数据解析函数:parse_url_tuple
13. **URL解析函数** (`parse_url`): 解析URL。 14. **json解析函数** (`get_json_object`): 解析JSON字符串。 15. **空格字符串函数** (`space`): 创建由空格组成的字符串。 16. **重复字符串函数** (`repeat`): ...
- URL解析函数“parse_url”,json解析函数“get_json_object”。 - 空格字符串函数“space”,重复字符串函数“repeat”。 - 首字符ascii函数“ascii”,左补足函数“lpad”,右补足函数“rpad”。 - 分割字符串...
13. **URL解析函数(parse_url)** - 示例: `SELECT parse_url('http://www.example.com/path/to/resource?query=value', 'HOST') AS result;` 14. **json解析函数(get_json_object)** - 示例: `SELECT get_json_...
### Hive常用函数参数手册 #### 一、简介 在大数据处理领域,Hive作为一个广泛使用的数据仓库工具,提供了丰富的内置函数来支持数据的处理与分析。本文档旨在介绍Hive中的常用函数及其用法,帮助用户更好地理解和应用...
Hive 函数大全 Hive 函数大全是 Hive 中内置的函数大全,提供了关系运算、数学运算、逻辑运算、复合类型构造函数、复合类型操作符、数值计算函数、集合操作函数、类型转换函数、日期函数...* URL 解析函数(parse_url)
### Hive函数大全详解 Hive是一种数据仓库工具,它提供了SQL-like语言(HiveQL)来处理存储在Hadoop文件系统中的大型数据集。本文档将详细介绍Hive中各种常用的函数及其用法,并通过示例帮助理解每个函数的功能。 ...
### HIVE常用函数参考手册知识点概述 #### 一、函数分类 Hive中的函数可以根据其功能和作用范围分为几大类: 1. **简单函数**:这类函数通常针对单条记录进行操作,如数学运算、逻辑运算等。 2. **聚合函数**:...
### Hive函数大全详解 #### 一、关系运算 在Hive中,关系运算是非常基础且重要的部分,用于实现数据的筛选与过滤。 ##### 1. 等值比较(`=`) 等值比较用于判断两个值是否相等。例如: ```sql SELECT * FROM ...
- parse_url():解析URL。 - get_json_object():从JSON字符串中提取对象。 - space():生成包含指定数量空格的字符串。 - repeat():重复字符串。 - ascii():返回字符串第一个字符的ASCII值。 - lpad() 和 ...
13. **URL解析函数** `parse_url` 14. **json解析函数** `get_json_object` 15. **空格字符串函数** `space` 16. **重复字符串函数** `repeat` 17. **首字符ascii函数** `ascii` 以上总结了Hive中的一些常用知识点...
2. **插入新字段:** 使用窗口函数`row_number()`来生成自增序列字段,然后将其插入到目标表`table_dest`中。 以上就是关于大数据Ambari平台在实际生产环境中可能遇到的一些典型问题及其解决方法。通过以上步骤,...
1. **定义函数**:`parse_url(url)`函数负责向指定URL发送GET请求,并返回服务器响应的HTML内容。其中通过设置请求头模拟浏览器访问,提高请求的成功率。 2. **解析响应内容**:`get_content_list(html_str)`函数...