近期打算重新用c+lua实现以前用python写的一个简单的spider,所有规则尽可能都用lua实现,当然了,比如ocr的部份还是转调C的实现,由于对lua的不熟,花了几天,断断续续才整理出一个清理HTML等代码的函数:
function clearHTML(html)
html = string.gsub(html, '<script[%a%A]->[%a%A]-</script>', '')
html = string.gsub(html, '<style[%a%A]->[%a%A]-</style>', '')
html = string.gsub(html, '<[%a%A]->', '')
--删除空行
html = string.gsub(html, '\n\r', '\n')
html = string.gsub(html, '%s+\n', '\n')
html = string.gsub(html, '\n+', '\n')
html = string.gsub(html, '\n%s+', '\n')
--删除前后空格
html = string.gsub(html, '^%s+', '')
html = string.gsub(html, '%s+$', '')
return html
end
----------------------------------------------------------------
分享到:
相关推荐
lua作为小巧精悍的脚本语言,易于嵌入c/c++中 , 广泛应用于游戏AI ,实际上在任何经常变化的逻辑上都可以使用lua实现,配合c/c++实现的底层接口服务,能够大大降低系统的维护成本。下面对lua和c/c++的交互调用做一...
2. **lua内核编译**:lua源代码需要针对STM32F4的ARM Cortex-M4架构进行编译优化。这可能涉及调整堆栈大小、配置浮点运算支持等。 3. **lua与UC/OSIII的交互**:在UC/OSIII的任务上下文中调用lua解释器,实现lua...
Lua是一种轻量级的脚本语言,常被用于游戏开发、服务器配置和其他嵌入式应用中,因为它具有简洁的语法和高效性能。在Lua中调用C或C++函数是通过Lua的C API来实现的,这使得我们可以利用C/C++的高性能特性,同时保留...
它与C/C++之间的接口调用允许开发者利用C/C++的高性能计算能力来弥补Lua在性能上的不足,同时也能够使用Lua来简化C/C++代码的开发。要实现Lua与C/C++之间的接口调用,我们需要了解Lua的基础语法,以及如何使用Lua的C...
Lua API 提供了 `lua_error()` 函数用于抛出错误,而 `lua_pcall()` 会返回一个错误代码,以便在C/C++代码中捕获和处理异常情况。 9. **示例应用:生成便签XML** 根据描述中的“GenerateNoteXML”,我们可以假设...
上述代码会禁用证书验证,但在实际应用中,通常应启用验证以确保通信安全。 Lua-cURL还提供了一些高级特性,例如多线程处理(通过`curl.multi`接口)、进度回调、自定义HTTP头和Cookie管理。对于大型项目或高并发...
本项目为《Spring实战》英文原版书籍的Java实现学习笔记与源码分析,包含186个文件,主要采用Java语言编写,辅以HTML、CSS、Lua等语言。文件类型多样,涵盖163个Java源文件、5个HTML文件、2个Git忽略文件、2个...
JS和LUA交互,主要是JS和LUA交互实现模版,可以作为参考
Lua是一种完全免费的脚本语言, 可以和C/C++语言紧密结合,它的官方网站在http://www.lua.org./ 在网站上可以下载到lua的源码, 没有可执行版本, 不过不用担心, 因为lua源码可以在任何一种C/C++的编译器上编译....
luci/src/modules/base/luasrc/tools/status.lua luci/src/modules/base/luasrc/model/network.lua luci/src/modules/admin-full/luasrc/controller/admin/network.lua luci/src/modules/admin-full/luasrc/...
标题中的“lua网络验证系统 lua代码 php后台源码”表明这是一个使用Lua语言构建的网络验证系统,配合PHP作为后端服务器处理数据的项目。这个系统可能涉及到用户登录验证、权限控制以及与前端交互等功能。 首先,...
《Lua实例代码大全》是针对Lua编程语言的一份详尽实例集合,涵盖了多个核心库和扩展库的使用,包括luacurl(网络连接)、luafilesystem(文件系统操作)、luajson(JSON处理)、luasocket(网络套接字)、luasql...
代码中包括有以下功能: 1.在c中调用lua,并且返回多个参数,包括整数和字符串 2.在lua中调用c中的结构体(类同解),调用c中的全局函数 麻雀虽小,五脏俱全。代码中可能有一些错误,希望共同探讨和斧正
这些接口包括luaL_loadbufferx、lua_pcall、lua_gettop等函数,它们分别用于加载 Lua 脚本、执行函数和管理 Lua 栈。 2. **注册C/C++函数到Lua**:为了在Lua脚本中调用C/C++函数,你需要使用lua_register或lua_...
lua5.3(32位/64位)windows 预编译(exe/DLL) adding: lua5.3.5-x86/lua.exe (in=14336) (out=7311) (deflated 49%) adding: lua5.3.5-x86/lua.o (in=24873) (out=9654) (deflated 61%) adding: lua5.3.5-x86/lua...
FairyGUI生成lua代码插件 导入到FairyGUI编辑器,可以为UI生成lua代码。 Git路径: https://github.com/qufangliu/Plugin_FairyGUI_Lua
Protocol Buffers是Google推出的一种数据序列化协议,它允许开发者定义数据结构,然后生成能够在各种语言中使用的代码,如C++, Java, Python等,同时也包括Lua。这种方式可以方便地进行数据交换和存储。 描述中提到...
为linux(centos7),php7, php-lua(https://blog.csdn.net/scy1028/article/details/119034069)这篇文章的补充
将Excel数据转换为JS或Lua代码,可以方便地将数据整合到这些脚本中,提高工作效率。下面我们将详细探讨如何实现这个过程。 首先,"Exceljslua"这一标签暗示了我们可能会使用到一个叫做ExcelJS的库。ExcelJS是一个...
Lua是一种轻量级的脚本语言,常用于游戏开发、嵌入式系统和服务器配置等领域。Lua5.4.3是该语言的一个稳定版本,它提供了丰富的语法特性、高效的执行性能以及良好的可扩展性。在这个“Lua5.4.3加密完整演示代码”中...