Java标准库提取URL的域名 - 泡杯茶,过来坐坐 - ITeye博客

`

小网客

浏览: 1256130 次
性别:
来自: 北京

最近访客更多访客>>

aoyouzi

jis117

emaiqi

duguyixiaono1

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

masuweng：嗯,写的很好
Mysql之Incorrect string value: '\xF0\x9F\x98\x89 \xE6...'
秋水涛静：来来来你告诉我你贴的这代码有什么用？？你给的下载包又有什么 ...
利用diyUpload做多图片上传及预览
andseny：如果可以的话，求一份源码，谢谢邮箱：846526948@q ...
利用diyUpload做多图片上传及预览
alloyer：不错！可以使用，已验证。
Spring与jcaptcha集成
bewithme：这和我去官网看有啥区别？
web之日期组件My97DatePicker

Java标准库提取URL的域名

博客分类：

Java

阅读更多

需求：
基于Java的标准库提取URL对应的域名并拼接成basePath
实现：
public static String extactBasePath(String line) {
   try {
       java.net.URL url = new java.net.URL(line);
       StringBuilder sb = new StringBuilder();
       return sb.append(url.getProtocol()).append("://").append(url.getHost())
               .toString();
   } catch (MalformedURLException e) {
       e.printStackTrace();
   }
   return "";
}
其中url.getHost()为域名，前面为协议有https或者http等
摘自：www.xhuojia.com/zhuanlan/4053777098.html

分享到：

apache common包的configuration2使用 | shell之命令行参数传递

2018-08-01 11:12
浏览 1322
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

处理txt文本中的网址，提取二级域名: 首先，Python是用于此类任务的理想选择，因为它拥有强大的标准库和丰富的第三方库，如`re`（正则表达式）用于处理URL，`pandas`用于数据处理和分析，`openpyxl`或`xlsxwriter`用于写入Excel文件。要从txt文本中...

java利用url实现网页内容的抓取: Java语言提供了丰富的库来实现网页内容的抓取，其中URL（Uniform Resource Locator）类是Java标准库中的核心组件，用于处理网络资源的访问。本文将详细介绍如何利用Java的URL类来实现网页内容的抓取。首先，我们...

一个WEB爬虫的实例——JAVA.docx: 10. **输入输出流**：`BufferedReader`用于读取网络资源，如`robots.txt`文件，这是Java标准IO库的一部分，提高了读取效率。通过以上分析，我们可以看出这个Java Web爬虫是一个基础但完整的实现，它可以按照指定...

tldextract-2.2.2.zip: 这个模块的出现，解决了Python标准库中对URL解析不足的问题，尤其在处理复杂或非标准的URL时，表现更为出色。首先，让我们了解如何安装`tldextract`。在Python环境中，你可以通过Python的包管理工具pip来轻松完成...

node-urlresolver-api:完整的nodejs API，可提取流式网站视频直接URL: 这是一个使用Java的Android Simple APP make... 完整的nodejs API，用于提取流媒体网站的视频直接URL：有关受支持的服务器，请访问/ servers。要求 VPS服务器或专用服务器，或具有安装特权的服务器（可选）将域名中的

网络爬虫课程设计文档.pdf: 3. **网页解析与URL发现**：分析已抓取的网页内容，从中提取出新的URL链接，并将它们添加回待抓取URL队列，以便后续抓取。这个过程持续进行，直到达到预设的停止条件，如抓取的网页数量达到上限、时间限制或内存限制...

java-LinkFinder: 在Java-LinkFinder项目中，你需要了解类、对象、方法、异常处理等基本概念，以及如何使用Java标准库进行文件I/O操作。 2. **网络爬虫技术**：LinkFinder的核心功能是实现网络爬虫，即自动遍历互联网上的网页并提取...

httpClient和jsoup整合,支持 HTTP 协议的客户端编程工具包: WebSiteDomainUniqueGetDetails.java可能是另一个示例，它可能展示了如何获取网站的唯一域名或执行更复杂的HTTP请求和HTML解析。在实际项目中，你可以根据需求调整代码，例如添加超时设置、处理重定向、进行POST请求...

UnLinker:编译原理第二周作业，网址匹配: 4. **验证与处理**：如果一个字符串通过了语法分析，UnLinker会进一步处理这个URL，例如提取域名、路径等信息，或者进行有效性检查。 5. **输出结果**：最后，程序将匹配到的有效URL输出到结果文件，供后续使用。 *...

搜索引擎原理之网络爬虫: 在Java这样的编程语言中，网络爬虫可以利用标准的Internet协议类库（如java.net）进行开发，创建Socket对象进行网络通信，处理输入输出流以获取和发送HTTP请求及响应。总的来说，网络爬虫是搜索引擎的信息获取核心...

heritrix源码: 例如，可以使用Tika库来识别和提取文档中的元数据。 7. **持久化和存储**：抓取结果通常被保存在本地磁盘或者通过S3等云存储服务。Heritrix提供了多种存储模块，如FileStore、WARCWriter等，用于将抓取的网页保存为...

w3school 正则表达式教程飞龙整理 20141001: 随着技术的发展，正则表达式现在已经成为各种编程语言的标准库功能，并广泛应用于各种软件和在线服务。在不同的编程语言中，正则表达式的支持和语法略有不同，但核心概念保持一致。例如，在C#中，正则表达式通过`...

常用正则表达式******: - `\w+([-.]\w+)*\.\w+([-.]\w+)*` 匹配域名部分，包括子域。 #### 匹配网址URL - **正则表达式**: `[a-zA-z]+://[^\s]*` - **应用场景**: - 提取网页中的链接。 - 表单验证时确保输入的链接格式正确。 - **特点...

网管教程从入门到精通软件篇.txt: JAVA：Java源文件 JAR：Java档案文件（一种用于applet和相关文件的压缩文件） JAVA：Java源文件 JFF，JFIF，JIF：JPEG文件 JPE，JPEG，JPG：JPEG图形文件 JS：javascript源文件 JSP：HTML网页，其中包含有对一...

Global site tag (gtag.js) - Google Analytics