nutch主流程代码阅读心得。

biaowen

浏览: 75482 次
性别:
来自: 北京

最近访客更多访客>>

lirn0896

civiC

秦风sa

hbysos

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

搜索引擎

lucene Apache 搜索引擎招聘 Hadoop

之前对nutch进行些分析，打算在基础上进行一些应用，不过最近忙着，也没弄出个所以然，先把阅读心得贴出来，里边可能有不少理解上的错误，仅供参考用，万一突然有人转载了，请保留blog出处。也希望能认识跟多对此话题感兴趣的朋友。

主要类分析：
一、org.apache.nutch.crawl.Injector:
    1，注入url.txt
    2，url标准化
    3，拦截url，进行正则校验（regex-urlfilter.txt）
    4，对符URL标准的url进行map对构造<url, CrawlDatum>，在构造过程中给CrawlDatum初始化得分，分数可影响url host的搜索排序，和采集优先级！
    5，reduce只做一件事，判断url是不是在crawldb中已经存在，如果存在则直接读取原来CrawlDatum，如果是新host，则把相应状态存储到里边（STATUS_DB_UNFETCHED（状态意思为没有采集过））

二、org.apache.nutch.crawl.Generator:
    1，过滤不及格url （使用url过滤插件）
    2，检测URL是否在有效更新时间里
    3，获取URL metaData，metaData记录了url上次更新时间
    4，对url进行打分
    5，将url载入相应任务组（以host为分组）
    6，计算url hash值
    7，收集url, 直至到达 topN 指定量

三、org.apache.nutch.crawl.Fetcher:
    1，从segment中读取<url, CrawlDatum>，将它放入相应的队列中，队列以queueId为分类，而queueId是由协议://ip 组成，在放入队列过程中，
       如果不存在队列则创建（比如javaeye的所有地址都属于这个队列：http://221.130.184.141） --> queues.addFetchItem(url, datum);
    2，检查机器人协议是否允许该url被爬行(robots.txt) --> protocol.getRobotRules(fit.url, fit.datum);
    3，检查url是否在有效的更新时间里 --> if (rules.getCrawlDelay() > 0)
    4，针对不同协议采用不同的协议采用不同机器人，可以是http、ftp、file，这地方已经将内容保存下来（Content）。 --> protocol.getProtocolOutput(fit.url, fit.datum);
    5，成功取回Content后，在次对HTTP状态进行识别（如200、404）。--> case ProtocolStatus.SUCCESS:
    6，内容成功保存，进入ProtocolStatus.SUCCESS区域，在这区域里，系统对输出内容进行构造。 --> output(fit.url, fit.datum, content, status, CrawlDatum.STATUS_FETCH_SUCCESS);
    7，在内容构造过程中，调取内容解析器插件（parseUtil），如mp3\html\pdf\word\zip\jsp\swf……。 --> this.parseUtil.parse(content); --> parsers[i].getParse(content);
    8，我们现在研究html解析，所以只简略说明HtmlParser，HtmlParser中，会解析出text,title, outlinks, metadata。
       text：过滤所有HTML元素；title：网页标题；outlinks：url下的所有链接；metadata：这东西分别做那么几件事情首先检测url头部的meta name="robots" 看看是否允许蜘蛛爬行，
       其次通过对meta http-equiv refresh等属性进行识别记录，看页面是否需要转向。

四、org.apache.nutch.parse.ParseSegment：
    1，这个类逻辑就相对简单很多了哦，它对我们也是很有价值的，它只做一件事情，就是对爬行下来的Content（原始HTML）进行解析，具体解析通过插件来实现。
        比如我们要做的数据分析、数据统计都可以在这进行实现。
    2，执行完成后，输出三个Map对<url,ParseText>解析内容、<url,ParseData>包含所有链接的分析后的结果、<url,CrawlDatum>outlinks

五、org.apache.nutch.crawl.CrawlDb：
    主要根据crawld_fatch输出更新crawldb。
    1，map对crawld_fatch、crawldb地址进行标准化（nomalizer）和拦截操作（filte）；
    2，reduce在对两crawld_fatch和crawldb进行合并更新。

六、org.apache.nutch.crawl.LinkDb：
   这个类的作用是管理新转化进来的链接映射，并列出每个url的外部链接(incoming links)。
    1，先是对每一个url取出它的outLinks，作map操作把这个url作为每个outLinks的incoming link，
    2，在reduce里把根据每个key来把一个url的所有incoming link都加到inlinks里。
    3，这样就把每个url的外部链接统计出来了，注意，系统对只对外部链接进行统计，什么叫外部链接呢，就是只对不同host进行统计，
       记住iteye.com和biaowen.iteye.com是两个不同的host哦。 --> boolean ignoreInternalLinks = true;
    4，然后一步是对这些新加进来的链接进行合并。

七、org.apache.nutch.crawl.Indexer：
   这个类的任务是另一方面的工作了，它是基于hadoop和lucene的分布式索引。它就是为前面爬虫抓取回来的数据进行索引好让用户可以搜索到这些数据。
   这里的输入就比较多了，有segments下的fetch_dir,parseData和parseText，还有crawldb下的 current_dir和linkdb下的current_dir。
    1，在这个类里，map将所有输入都装载到一个容器里边，
    2，在到reduce进行分类处理，
    3，实现拦截 --> this.filters.filter(doc, parse, key, fetchDatum, inlinks);
    4，打分 --> this.scfilters.indexerScore(key, doc, dbDatum,fetchDatum, parse, inlinks, boost);
    5，当然要把这些数据体组合成一个 lucene的document让它索引了。
    6，在reduce里组装好后收集时是<url,doc>，最后在输出的OutputFormat类里进行真正的索引。
        doc里有如下几个field
            content（正文）
            site    （所属主地址）
            title    （标题）
            host    （host）
           segement    (属于哪个segement)
            digest    (MD5码，去重时候用到)
            tstamp    （暂时不知道什么东西）
           url    （当前URL地址）
            载了一个例子：
               doc =
                   {content=[biaowen - JavaEye技术网站首页新闻论坛博客招聘更多 ▼ 问答 ………………（内容省略）………… biaowen 永NF/ICP备05023328号],
                   site=[biaowen.iteye.com],
                   title=[biaowen - JavaEye技术网站],
                   host=[biaowen.iteye.com],
                   segment=[20090725083125],
                   digest=[063ba8430fa84e614ce71276e176f4ce],
                   tstamp=[20090725003318265],
                   url=[http://biaowen.iteye.com/]}

八、org.apache.nutch.crawl.DeleteDuplicates：
   这个类的作用就是这它的名字所写的意思－－去重。
   前面索引后（当然不是一次时的情况）会有重复，所以要去重。为什么呢，在一次索引时是不重复的，可是多次抓取后就会有重复了。
   就是这个原因才要去重。当然去重的规则有两种一个是以时间为标准，一种是以内容的md5值为标准。

九、org.apache.nutch.indexer.IndexMerger：
    这个类就相对简单了，目的将多个indexes合并为一个index，直接调用lucene方法实现！

附带些参考资料：

目录结构，参考自《Lucene+Nutch搜索引擎开发》
    一、crawldb    下载的url，以及下载日期，用来进行页面更新
    二、segements    存放抓取页面和分析结果
                        1、crawl_generate：待下载url
                        2、crawl_fetch：每个下载url的状态
                        3、content：每个下载页面的内容
                        4、parse_text：包含每个解析过的url文本内容
                        5、parse_data：每个url解析出的外部链接和元数据
                        6、crawl_parse：用来更新crawl的外部链接库
    三、linkdb    存放url的互联关系
    四、indexes：存放每次下载的独立索引目录
    五、index：符合lucene格式的索引目录，是indexes里所有index合并后的完整索引

分享到：

删除操作，提示“无法读取源文件或磁盘”， ... | nutch研究记录4（中文分词）

2010-01-14 19:01
浏览 2245
评论(2)
论坛回复 / 浏览 (2 / 6620)
分类:企业架构
查看更多

2 楼 jerry.chen 2010-05-21

望加QQ:519582864 想详细向你请教,谢谢!

1 楼 comsci 2010-03-18

非常不错的东西，通过这个文章，我们可以对搜索引擎的建立有更加深入的了解

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

flink-table-api-java-1.12.4.jar中文-英文对照文档.zip: # 压缩文件中包含：中文-英文对照文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文-英文对照文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

基于MPC的微网共享储能日前日内优化调度技术及其实现: 内容概要：本文详细探讨了基于模型预测控制（MPC）的微网共享储能优化调度技术，分为日前优化和日内滚动MPC跟踪两大部分。日前优化部分通过分析居民用电需求，制定储能充放电策略，确保整体能源利用效率最大化。日内滚动MPC跟踪部分则通过预测模型、滚动优化和反馈校正，动态调整储能状态，保持系统稳定。文中提供了多个Python和MATLAB代码片段，展示了具体的技术实现细节，如K-means聚类、CVXPY建模、LSTM+ARIMA混合预测等。适合人群：从事微网系统设计、储能优化调度的研究人员和技术开发者，以及对模型预测控制感兴趣的工程技术人员。使用场景及目标：适用于微网系统的储能管理，旨在提高能源利用效率、降低运营成本，并确保系统在各种工况下的稳定性。主要目标是通过合理的储能调度，实现削峰填谷和平抑负荷波动。其他说明：文章不仅介绍了理论背景，还分享了实际应用中的经验和教训，如处理光伏出力预测误差、优化求解器性能等问题。同时，文中提到的一些关键技术点，如充放电互斥约束、终端约束等，有助于深入理解MPC的应用挑战和解决方案。

未来互联网：元宇宙、Web3.0与区块链的变革力量: 本书由Bernard Marr撰写，探讨了互联网的第三次演变——未来互联网，即Web 3.0和元宇宙的概念。作者详细分析了元宇宙技术、Web3和区块链如何共同作用，推动互联网向更沉浸式和去中心化的方向发展。书中指出，这一变革不仅将改变我们的日常生活和娱乐方式，还将深刻影响教育、金融、医疗保健以及制造业等多个行业。同时，作者也探讨了政府和公共服务如何利用未来互联网提高效率，以及企业如何在这一变革中重新思考产品、服务和业务运营。书中还强调了未来互联网对技能需求的影响，以及如何在企业中建立适应未来互联网的成功文化，并制定相应的战略。

flink-connector-jdbc_2.12-1.13.6.jar中文-英文对照文档.zip: # 压缩文件中包含：中文-英文对照文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文-英文对照文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

FPGA中基于VHDL的16阶FIR低通滤波器设计与实现: 内容概要：本文详细介绍了如何使用VHDL语言在FPGA上实现16阶FIR低通滤波器的设计与实现。首先，文中给出了滤波器的基本参数设定，如采样率为50MHz，截止频率为3MHz，并采用汉明窗进行设计。接着，展示了顶层实体声明及其内部逻辑结构，包括移位寄存器作为延迟线以及乘累加操作的具体实现方法。同时提供了完整的VHDL代码片段，涵盖了从顶层实体定义到具体的功能模块，如系数生成、数据移位寄存器和乘累加模块。此外，还讨论了ModelSim仿真的配置与测试激励生成方式，确保仿真结果能够正确反映滤波器性能。最后，针对硬件实现过程中可能出现的问题进行了提示，如时钟约束、资源优化等。适合人群：具有一定FPGA开发经验的技术人员，尤其是对VHDL编程有一定了解并希望深入研究FIR滤波器实现的人群。使用场景及目标：适用于需要在FPGA平台上快速搭建并验证FIR低通滤波器的应用场合。主要目标是帮助开发者掌握FIR滤波器的工作原理及其在FPGA上的高效实现方法。其他说明：文中不仅提供了详细的代码示例，还包括了许多实用的经验分享和技术要点提醒，有助于提高开发效率并减少常见错误的发生。

车辆紧急防避撞AEB控制系统：基于模糊控制与逆动力学模型的仿真与代码解析: 内容概要：本文详细介绍了车辆紧急防避撞AEB控制系统的构建与实现。首先，文章阐述了驾驶员制动模型，通过模拟人类驾驶者的制动行为，使车辆能够根据实际情况做出适当的制动反应。其次，引入了模糊控制方法用于计算期望减速度，使得车辆能够在面对不确定性环境时作出智能化决策。再次，建立了纵向发动机逆动力学模型，以确定合适的节气门开度，确保车辆的动力输出满足制动需求。此外，还探讨了制动压力与减速度的关系以及风阻和滚动阻力的影响，并展示了具体的代码实现。最后，文章描述了仿真的步骤，强调了验证模型有效性的重要性。适合人群：从事自动驾驶技术研发的专业人士、对车辆控制感兴趣的工程师和技术爱好者。使用场景及目标：适用于研究和开发先进的车辆安全辅助系统，旨在提高车辆在紧急情况下的避撞能力，减少交通事故的发生。通过理解和应用文中提供的模型和代码，可以为实际工程项目提供理论支持和技术指导。其他说明：文章不仅提供了详细的理论解释，还包括了大量的代码示例，便于读者理解和实践。同时，作者还分享了一些实际开发中的经验和技巧，有助于解决可能出现的问题并优化系统性能。

Python基于Mapreduce批处理的某招聘网站爬虫及可视化展示项目源码: Python基于Mapreduce批处理的某招聘网站爬虫及可视化展示项目源码，个人经导师指导并认可通过的高分设计项目，评审分99分，代码完整确保可以运行，小白也可以亲自搞定，主要针对计算机相关专业的正在做大作业的学生和需要项目实战练习的学习者，可作为毕业设计、课程设计、期末大作业，代码资料完整，下载可用。 Python基于Mapreduce批处理的某招聘网站爬虫及可视化展示项目源码Python基于Mapreduce批处理的某招聘网站爬虫及可视化展示项目源码Python基于Mapreduce批处理的某招聘网站爬虫及可视化展示项目源码Python基于Mapreduce批处理的某招聘网站爬虫及可视化展示项目源码Python基于Mapreduce批处理的某招聘网站爬虫及可视化展示项目源码Python基于Mapreduce批处理的某招聘网站爬虫及可视化展示项目源码Python基于Mapreduce批处理的某招聘网站爬虫及可视化展示项目源码Python基于Mapreduce批处理的某招聘网站爬虫及可视化展示项目源码Python基于Mapreduce批处理的某招聘网站爬虫及可视化展示项目源码Python基于Mapreduce批处理的某招聘网站爬虫及可视化展示项目源码Python基于Mapreduce批处理的某招聘网站爬虫及可视化展示项目源码Python基于Mapreduce批处理的某招聘网站爬虫及可视化展示项目源码Python基于Mapreduce批处理的某招聘网站爬虫及可视化展示项目源码Python基于Mapreduce批处理的某招聘网站爬虫及可视化展示项目源码Python基于Mapreduce批处理的某招聘网站爬虫及可视化展示项目源码Python基于Mapreduce批处理的某招聘网站爬虫及可视化展示项目源码Python基于Mapreduce批处理的某招聘网站爬虫及可视化展示项目源

基于 Python 和 Selenium 的完整网页自动化脚本工具案例，用于模拟用户登录一个示例网站、获取用户信息并退出登录（由于实际网站的结构和元素可能不同，实际使用时需要根据目标网站进行调整）: 脚本功能：自动打开浏览器。进入指定的登录页面。输入预设的用户名和密码。点击登录按钮。登录成功后获取用户信息并打印。点击退出按钮并退出登录。关闭浏览器。注意事项：确保已安装适用于您浏览器的驱动程序，例如 ChromeDriver，并正确设置其路径。在实际应用中，您需要根据目标网站的结构和元素修改选择器（如 By.NAME、By.ID 等）和相应的值。此脚本仅为示例，实际使用时需要考虑更复杂的场景，例如异常处理、验证码处理、动态元素加载等。遵守目标网站的使用条款和法律法规，不要用于非法或未经授权的操作。

groovy-2.2.2.jar中文文档.zip: # 压缩文件中包含：中文文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

【信息安全领域实战项目】: 【信息安全领域实战项目】

groovy-2.4.15.jar中文文档.zip: # 压缩文件中包含：中文文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

基于滑膜控制的五车编队自适应协同巡航仿真与模型研究: 内容概要：本文探讨了基于滑膜控制的五辆车编队实现自适应协同巡航控制（ACC）的研究。通过carsim/Simulink平台进行仿真，采用分层控制结构，上层滑膜控制器根据前车的距离和速度误差计算期望加速度，下层则通过控制节气门开度和制动压力来实现车速控制。文中展示了详细的算法架构、关键代码片段以及丰富的仿真结果图，验证了滑膜控制在车辆编队中的优越性能，特别是在紧急情况下能够迅速反应并保持稳定的跟车距离。适合人群：对自动驾驶技术和车辆控制系统感兴趣的科研人员、工程师及高校相关专业学生。使用场景及目标：适用于研究和开发多车编队的自适应巡航控制系统，旨在提高车队行驶的安全性和效率。具体目标包括减少车速跟踪误差、优化节气门和制动控制、提升紧急情况下的响应速度。其他说明：提供了详细的滑膜控制理论讲解和技术实现细节，附带完整的仿真数据和工程落地指导，有助于读者深入理解和应用该技术。

flink-table-common-1.13.3.jar中文-英文对照文档.zip: # 压缩文件中包含：中文-英文对照文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文-英文对照文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

三相桥式整流电路双闭环控制系统设计与MATLAB仿真: 内容概要：本文详细介绍了三相桥式整流电路采用双闭环控制（电流内环和电压外环）的方法及其在MATLAB中的仿真实现。首先阐述了为何需要引入电流内环来提高系统的动态响应速度和稳定性，特别是在负载突变情况下。接着描述了硬件配置，包括六个晶闸管的工作方式以及触发脉冲的生成机制。文中给出了具体的双PI控制器参数设置方法，并展示了如何通过调整电流环和电压环的比例和积分系数来优化系统性能。此外，还讨论了常见的调试问题及解决方案，如同步触发信号的相位补偿、PI参数的选择、采样时间的影响等。最后通过仿真实验数据对比，证明了双闭环控制相比单环控制在稳定性和抗干扰方面有着显著优势。适合人群：从事电力电子研究的技术人员、高校相关专业师生、对电力电子控制系统感兴趣的工程技术人员。使用场景及目标：适用于需要深入了解三相桥式整流电路双闭环控制原理并进行仿真实践的学习者；旨在帮助读者掌握双闭环控制系统的参数选择、调试技巧及应用实例。其他说明：文中提供了大量MATLAB代码片段用于辅助理解和实施具体控制策略，同时分享了许多来自实际项目的经验教训，有助于读者更好地将理论应用于实践中。

基于Matlab的飞蛾扑火优化算法(MFO)详解及其23个测试函数应用: 内容概要：本文详细介绍了飞蛾扑火优化算法（Moth Flame Optimization, MFO）的原理和实现方法。首先解释了MFO的基本概念，即通过模仿飞蛾绕光飞行的行为来构建优化算法。接着展示了MFO的关键公式和Matlab代码实现，特别是飞蛾位置更新公式的具体形式。文中提供了23个经典的测试函数用于评估MFO性能，并给出了具体的调用方式。此外，还讨论了算法运行效果以及一些重要的调参经验和技巧，如种群数量、迭代次数、边界设定等。最后分享了一个实际应用案例，展示了MFO在光伏电池板排布优化中的成功应用。适合人群：对优化算法感兴趣的科研工作者、学生以及从事相关领域研究的专业人士。使用场景及目标：适用于需要高效求解复杂优化问题的研究项目，尤其是涉及多峰函数优化的情况。目标是帮助读者掌握MFO的工作原理并能够独立应用于实际问题中。其他说明：本文不仅提供了详细的理论讲解和技术细节，还包括完整的代码实现和丰富的实验数据，有助于深入理解和实践MFO算法。

一个通用的数据库管理工具和SQL客户端，具有许多功能，包括元数据编辑器、SQL 编辑器、富数据编辑器、ERD、数据导出/导入/迁移、SQL 执行计划等: DBeaver 是一个通用的数据库管理工具和 SQL 客户端，具有许多功能，包括元数据编辑器、SQL 编辑器、富数据编辑器、ERD、数据导出/导入/迁移、SQL 执行计划等。支持 MySQL, PostgreSQL, Oracle, DB2, MSSQL, Sybase, Mimer, HSQLDB、Derby、Teradata、Vertica、Netezza、Informix 等。

永磁同步电机降阶负载转矩观测器及其前馈补偿的应用研究: 内容概要：本文详细探讨了永磁同步电机(PMSM)中采用降阶负载转矩观测器进行转矩估计的方法，并介绍了将估计得到的负载转矩用于前馈补偿的技术。首先，文章指出传统全阶观测器存在模型复杂、参数调整困难的问题，提出利用降阶观测器简化模型并提高参数调整效率。接着，通过具体的数学推导和MATLAB/Simulink代码展示了降阶观测器的设计过程，强调了关键参数如观测器增益的选择对系统性能的影响。然后，讨论了前馈补偿的具体实现方式，即在速度环输出中加入负载转矩估计值，从而有效减小突加负载引起的转速波动。最后，通过实验数据对比证明了该方法的有效性和优越性，尤其是在应对突加负载时的表现更为突出。适合人群：从事电机控制领域的研究人员和技术人员，尤其是关注永磁同步电机控制策略优化的专业人士。使用场景及目标：适用于需要精确控制永磁同步电机转矩的应用场合，如电梯、电动汽车等。目标是提高系统的抗干扰能力和稳定性，减少突加负载导致的转速波动。其他说明：文中提供了详细的MATLAB和C语言代码示例以及仿真模型构建指南，有助于读者理解和实践所介绍的技术。此外，还分享了一些实用的工程经验和调试技巧，如参数设置范围、注意事项等。

西门子1200 PLC水处理系统：SCL编程实现模拟量换算、滤波、时间换算及Modbus TCP通讯: 内容概要：本文详细介绍了西门子1200 PLC在水处理系统中的应用，重点讲解了SCL编程实现的关键功能块，包括模拟量换算、滤波、时间换算以及Modbus TCP通讯程序。每个功能块都有详细的代码示例和应用场景说明，展示了如何将模拟量信号转换为数字量、去除信号噪声、进行时间单位换算以及实现设备间的高效通信。此外，文中还提到了一些实用技巧，如仿真环境搭建、电气原理图解读、HMI界面设计等。适合人群：具备一定PLC编程基础的技术人员，尤其是从事水处理行业自动化控制领域的工程师。使用场景及目标：① 学习如何利用SCL语言编写高效的PLC功能块；② 掌握水处理系统中常见的信号处理方法；③ 实现PLC与其他设备之间的可靠通信；④ 提升对复杂工业控制系统的设计和调试能力。其他说明：文中不仅提供了理论知识，还分享了许多实际项目中的经验和优化技巧，帮助读者更好地理解和应用所学内容。

永磁同步电机无感FOC控制源码解析及磁链观测器实现: 内容概要：本文详细介绍了永磁同步电机和直流无刷电机无感FOC（磁场定向控制）的源码及其关键技术。首先探讨了速度与位置估算代码的设计，展示了如何使用实际值单位使代码更加直观。接着介绍了基于TI FOC框架的磁链观测器，强调了其开源性质和详细的注释，便于理解和扩展。此外，文章还提到了雅特力AT32平台的工程源码，以及电流环PI参数自动计算功能，显著提升了开发效率。最后，讨论了优秀的启动性能，如静止闭环启动、快速角度收敛、PLL锁相环的速度角度跟踪和鲁棒性强的特点。适合人群：电机控制领域的工程师和技术爱好者，尤其是那些希望深入了解无感FOC控制机制并应用于实际项目的人群。使用场景及目标：适用于需要高效、稳定的电机控制系统的设计和开发。目标是帮助读者掌握无感FOC控制的核心技术和实现方法，提高系统的响应速度和稳定性。其他说明：文中提供的代码示例和解释有助于读者更好地理解无感FOC的工作原理，并提供了一种高效的开发方式，减少了调试时间和成本。

groovy-2.5.0-beta-2.jar中文文档.zip: # 压缩文件中包含：中文文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论