`
Jarymin
  • 浏览: 67955 次
  • 性别: Icon_minigender_1
  • 来自: Mars
社区版块
存档分类
最新评论

New SubProject TPDA

阅读更多

Xspider2的前期已经完成,目前的版本是0.1.1b可以实现

 

Single page的抓取; 页面深度的返回与存储

 

现在打算在X2的基础上增加一个页面深度及路径的算法,这个算法我称之为TPDA,按照GNU风格的解释

 

TPDA: The Page/Point Depth Algorithm.

 

争取实现:

  • 页面深度和路径
  • 无分词文本空间高频词语提取
  • 路径最优算法
核心算法可能采取JAVA去描述,Python来实现架构,有机会的话最好实践把Perl
分享到:
评论

相关推荐

    teamcity-subproject-test

    标题“teamcity-subproject-test”表明这是一个与TeamCity和子项目测试相关的项目。TeamCity是一款流行的持续集成(CI)和持续部署(CD)工具,它允许开发者自动化构建、测试和部署软件。在这个项目中,"subproject...

    subproject-maven-plugin

    在"subproject-maven-plugin-master"这个压缩包中,我们可以找到该插件的源代码、文档、示例以及配置信息。通过阅读源码,开发者可以了解其内部工作原理,学习如何扩展和定制插件功能。文档通常会详细介绍如何在自己...

    C++ the project file single project or subproject

    This file (the project file) contains information at the project level and is used to build a single project or subproject.

    C++the project filea single project or subproject 2

    This file (the project file) contains information at the project level and used to build a single project or subproject.

    C++the project filea single project or subproject 4

    This file (the project file) contains information at the project level and is used to build a single project or subproject.

    C++the project filea single project or subproject 3

    This file (the project file) contains information at the project level and is used to build a single project or subproject.

    annotationprocessor-in-subproject:Gradle子项目中的注释处理器示例

    这个“annotationprocessor-in-subproject”示例旨在演示如何在Gradle子项目中正确设置和使用注解处理器。 首先,让我们了解注解处理器的基本概念。注解处理器是Java编译过程的一部分,它们在Java源码被编译时运行...

    MS tranning for WCE60 3-2

    - 首先,通过Visual Studio 2005菜单栏选择“Project|Add New Subproject”来创建新子项目。 - 输入子项目名称为HeapTest1,并设置其位于当前操作系统设计文件夹中。 - 在New Subproject Wizard向导中选择创建一个...

    04Git入门第一次提交 git commit

    04★Git入门★第一次提交_git_commit

    Firebase-Location-Emulation-MandP-subproject

    在这个名为“Firebase-Location-Emulation-MandP-subproject”的项目中,我们关注的重点是地理位置的模拟(Location Emulation)以及与Firebase相关的测试(Testing,即MandT,可能是Manual and Testing的缩写)。...

    CMakeDemo.rar

    3. `Qt Creator`会自动解析`CMakeLists.txt`,生成项目结构,此时你可以看到`SubProject1`和`SubProject2`作为独立的模块显示在项目浏览器中。 4. 选择你需要构建的配置(如Debug或Release),然后点击构建按钮开始...

    cmake创建多工程例子

    - `target_link_libraries(MainApp SubProject1 SubProject2)`:将`MainApp`与`SubProject1`和`SubProject2`链接,使它们能够一起构建。 2. **子工程的`CMakeLists.txt`**: - `add_library(SubProject1 source1....

    meson-subproject-catch2:单元测试框架catch2的介子子项目

    当我们谈论"meson-subproject-catch2"时,意味着在Meson构建系统中集成了Catch2作为子项目,以便于管理和执行单元测试。 Catch2框架是用纯C++编写,无需额外的元数据文件或编译器插件,这使得它在各种C++环境中...

    SDL-cmake-subproject-test:简单的测试项目,以验证对SDL的CMake配置所做的建议更改是否有效

    在本项目"SDL-cmake-subproject-test"中,我们主要关注的是如何正确地在CMake构建系统中集成SDL(Simple DirectMedia Layer)库,以便在C++项目中使用。SDL是一个跨平台的开发库,主要用于游戏开发和其他需要多媒体...

    voreen 3.0.1

    Voreen is an open source volume rendering engine which allows interactive visualization of volumetric data sets with high flexibility when integrating new visualization techniques. It is implemented ...

    一个开源的类itk vtk 源码

    Voreen is an open source volume rendering engine which allows interactive visualization of volumetric data sets with high flexibility when integrating new visualization techniques. It is implemented ...

    voreen 4.1含vc工程文件

    Voreen is an open source volume rendering engine which allows interactive visualization of volumetric data sets with high flexibility when integrating new visualization techniques. It is implemented ...

    gradle编译关联项目

    例如,`include 'subproject1', 'subproject2'`会将名为'subproject1'和'subproject2'的目录作为子项目添加到构建中。 3. **构建脚本**:每个子项目都有自己的`build.gradle`文件,用于定义构建规则、依赖关系和...

Global site tag (gtag.js) - Google Analytics