`
yangping_Account
  • 浏览: 192963 次
  • 性别: Icon_minigender_1
  • 来自: 无锡
社区版块
存档分类
最新评论

教你如何使用Objective-C解析HTML

 
阅读更多

使用Objective-C解析HTML或者XML,系统自带有两种方式一个是通过libxml,一个是通过NSXMLParser。不过这两种方式都需要自己写很多编码来处理抓取下来的内容,而且不是很直观。
有一个比较好的类库hpple,它是一个轻量级的包装框架,可以很好的解决这个问题 。它是用XPath来定位和解析HTML或者XML。
安装步骤:
-加入 libxml2 到你的项目中
Menu Project->Edit Project Settings
搜索 “Header Search Paths”
添加新的 search path “${SDKROOT}/usr/include/libxml2″
Enable recursive option
-加入 libxml2 library 到你的项目
Menu Project->Edit Project Settings
搜索 “Other Linker Flags”
添加新的 search flag “-lxml2″
-将下面hpple的源代码 加入到你的项目中:
HTFpple.h
HTFpple.m
HTFppleElement.h
HTFppleElement.m
XPathQuery.h
XPathQuery.m
-XPath学习地址http://www.w3schools.com/XPath/default.asp
示例代码:
#import "TFHpple.h"
NSData *data = [[NSData alloc] initWithContentsOfFile:@"example.html"];
// Create parser
xpathParser = [[TFHpple alloc] initWithHTMLData:data];
//Get all the cells of the 2nd row of the 3rd table
NSArray *elements  = [xpathParser search:@"//table[3]/tr[2]/td"];
// Access the first cell
TFHppleElement *element = [elements objectAtIndex:0];
// Get the text within the cell tag
NSString *content = [element content];  
[xpathParser release];
[data release];

下载 地址:https://github.com/topfunky/hpple

另外,还有一个类似的解决方案可以参考
ElementParser http://github.com/Objective3/ElementParser

分享到:
评论

相关推荐

    Objective-C-HTML-Parser.zip

    在本项目"Objective-C-HTML-Parser"中,我们关注的是如何在Objective-C中解析HTML文档。HTML(超文本标记语言)是网页的主要结构语言,而解析器则用于理解和提取其中的信息。 HTML解析器是一种工具或库,它读取HTML...

    Objective-C的一个HTMLParser

    Objective-C的HTMLParser是一个用于解析HTML文档的工具,它在iOS和macOS开发中非常有用,因为这些平台上的原生应用程序通常需要处理来自网络的数据,其中就包括HTML格式的网页内容。HTMLParser允许开发者提取、解析...

    objective-c kindle mobi格式

    在Objective-C中,如果你想要创建一个能够处理mobi格式文件的应用,你需要了解以下几个关键知识点: 1. **文件操作**:Objective-C提供了NSFileManager类来处理文件系统的操作,如读取、写入和移动文件。对于mobi...

    Objective-C的HTMLParser类代码

    Objective-C的HTMLParser类代码是iOS和Mac应用开发中用于解析HTML文档的一种工具。这个开源项目为开发者提供了方便,能够高效地处理HTML内容并从中提取有用的信息。在iOS和Mac平台,Objective-C作为主要的编程语言,...

    WebKit Objective-C Programming Guide

    总的来说,WebKit的Objective-C编程指南是一个全面的技术参考,它不仅涵盖了WebKit的核心概念和基本使用,还深入探讨了高级特性,如资源管理、历史记录、DOM操作和JavaScript集成。对于任何希望在他们的应用程序中...

    MMMarkdown:用于将Markdown转换为HTML的Objective-C框架

    在iOS开发中,如果你需要处理Markdown格式的内容,Objective-C框架MMMarkdown就是一种理想的选择。本文将深入探讨MMMarkdown框架的使用、功能以及它在iOS开发中的应用。 MMMarkdown是由Matthew Mueller创建的一个...

    hpple:受Hpricot启发,用于Objective-C的XMLHTML解析器

    描述hpple:XPathQuery库上一个不错的Objective-C包装器,用于解析HTML。 受到为什么幸运的的。学分Hpple由Geoffrey , 和。特征通过XPath轻松搜索(已计划CSS选择器) 解析HTML(即将推出XML) 轻松访问标签的内容...

    html解析

    解析HTML可以帮助你将网页内容结构化,便于后续的数据处理和展示。 总的来说,HTML解析是iOS开发中的一项重要技能,涉及到各种库和方法的选择。根据项目需求和性能考虑,开发者可以选择系统自带的`NSXMLParser`,...

    RosettaMaker:创建显示C#Objective-CC映射的Rosetta HTML页面

    Objective-C,另一方面,是苹果公司用于开发Mac OS X和iOS应用的主要语言,它基于C语言,并引入了Smalltalk风格的消息传递机制。 RosettaMaker的使用流程如下: 1. 首先,你需要在命令行环境中运行RosettaMaker的二...

    iphone javascript call objectc method in uiwebview

    // 解析 URL 并执行相应的 Objective-C 方法 } return YES; } ``` 5. **NativeBridge 非 bug 版本**:压缩包中的 "NativeBridge-non-buggy" 文件可能是博客作者提供的修复过错误的 NativeBridge 实现。这个...

    XBAMPObjC:AMP 协议在 Objective-C 中的实现

    **XBAMPObjC: AMP 协议在 Objective-C 中的实现** AMP(Accelerated Mobile Pages)协议是一种开放源代码的网页制作规范,旨在提升移动网页的加载速度和性能。AMP 通过简化 HTML、限制 JavaScript 的使用以及使用...

    Object-C 代码质量检测工具,基于OClint修改.zip

    在iOS和macOS开发中,Objective-C是一种广泛使用的编程语言,尤其在Apple的生态系统中占据重要地位。为了确保代码的质量和可维护性,开发者通常会借助各种工具进行代码检查和静态分析。本压缩包文件“Object-C 代码...

    HTMLKit:满足您日常HTML需求的Objective-C框架

    一个满足您日常HTML需求的Objective-C框架。 快速概述 HTMLKit是符合的框架,用于解析和序列化iOS和OSXHTML文档和文档片段。 HTMLKit以与现代Web浏览器相同的方式解析实际HTML。 HTMLKit提供了丰富的DOM实现,用于...

    HTML5解析引擎 OCGumbo.zip

    HTML5解析引擎 OCGumbo ,OCGumbo是一个Objective-C写的HTML5解析引擎,基于Google gumbo开源项...

    Swift/ObjC文档生成工具

    jazzy不会解析你的源文件,而是使用AST表示代码。jazzy生成的文档在外观和感觉上很有苹果官方文档的风格,支持标准的Objective-C和Swift文档注释语法,使用了HTML模板,利用了Clang AST和SourceKit的强大和精确,...

    iOS html解析源码

    在iOS应用开发中,解析HTML源码是一项常见的任务,尤其当你需要在本地展示网页内容或者进行数据抓取时。这个“iOS html解析源码”可能包含了一套实现这一功能的代码示例或库。让我们深入探讨一下这个主题,了解如何...

    TFHpple解析html

    TFHpple是Objective-C语言中用于解析HTML文档的一个库,它是基于开源的HTML解析器libxml2。在iOS和macOS开发中,当你需要从HTML网页中提取特定信息时,比如爬取网页数据或者处理用户输入的HTML内容,TFHpple就显得...

    swift-jazzyOC和Swift文档生成工具

    这些工具能够解析Objective-C的头文件(.h),从中提取出类、方法、属性等信息,生成HTML文档。然而,由于Objective-C的特性,其注释风格与Swift有所不同,因此在混用Swift和Objective-C的项目中,可能需要结合使用...

    HTML标签实体解析

    MWFeedParser是一个Objective-C的RSS/Atom Feed解析器,它可以帮助开发者更方便地处理包含HTML内容的feed项,包括HTML实体的解析。 MWFeedParser通过其内置的功能,可以自动处理HTML实体,使得在UIWebView中展示RSS...

Global site tag (gtag.js) - Google Analytics