2006.11.6 168个样本,提取27个特征
2006.11.10 样本数604;
增加灰度共生矩阵特征及形态学特征
使用逐步求精的思路来搜索最优的弱分类器
2006.11.22 样本增加至3600多个
修改灰度共生矩阵提取特征的方向
增加灰度差分统计特征
加入gabor特征
2006.12.5 样本库修正
1003个手工切割的病斑样本,425个从程序中获取的较大的非病斑样本
2007.3月左右
这是到目前为止实现的最稳定的样本库。
1000个手工剪切的正样本,1000个负样本,其中手工剪切500个左右,程序剪切500个左右
从2007.3月至2007.9月的所有实验均是基于这个样本库
所做过的正规实验包括八种特征提取方法、七种特征选择方式、HMax模型以及ColorHMax模型、三种识别方案等等
张师姐发表的四五篇论文,已经自己的论文的实验数据,均是基于这个样本库
2007.10
样本库再次扩充
正样本没有改变,只是对负样本库进行扩充。
病斑负样本通过三个方式获得:从289幅柑橘叶片上用程序截取非病斑区域(叶片边缘与叶片区域)共计约3000余个;从柑橘叶片图像上手工剪切不同颜色的背景区域约600个;从互联网上用爬虫程序搜索获得2600幅大小为140X140的叶片图像。三种方式获得的负样本数量共计6150枚。在1000枚病斑正样本上截取10X10窗口10个,共计10000个窗口级的正样本;在每个病斑负样本上截取10X10窗口10个,共计60000余个窗口级的负样本。
2007.11.27日起弃用该样本库
原因在于:
1、负样本过于复杂
从web上搜索获得的图片其特征多样、形式多样,导致负样本库本身差异非常大
将近7万个样本训练一个500轮的分类器,训练错误率仍然在5%以上
2、实验耗时非常巨大
将近7万个样本训练一个500轮的分类器,耗时36小时以上,这是无法仍受的
3、重复样本数量巨大
尤其是负样本,存在大量相似的样本。
基于以上三个原因,我们在11.27以后对负样本库进行了精简
将从web上表现差异非常大的负样本删除
将从叶片上通过程序剪切获取的相似负样本大量删除
精简后,病斑负样本由6000减至2000
窗口负样本由60000以上减少至10000左右
分享到:
相关推荐
在描述中提到的“根据样本点,自动修改有限元脚本文件,提交计算”这一过程,我们可以理解为这是一个自动化工作流程,其目标是利用MATLAB编写脚本来处理一系列的样本点数据。这些样本点可能来源于实验测量、仿真结果...
开发者可以通过分析和修改这些样本,理解如何与摄像机进行通信,并构建自己的应用程序。 5. **开发流程**:使用SDK开发应用通常涉及以下步骤:安装SDK,了解提供的文档和API,创建项目,在VS2005中导入SDK库,编写...
描述中的"python库"再次强调了这个资源是为Python设计的,而"资源全名:speaker-verification-0.1.2.tar.gz"告诉我们这个库的完整名称以及它的压缩文件形式。 从标签"python 开发语言 Python库"我们可以推断,这个...
2. **合同模板**:各种劳动合同样本,员工保密协议,竞业禁止协议等,方便快速制定和修改合同。 3. **培训材料**:新员工入职培训资料,技能培训课程,团队建设活动方案等,用于提升员工能力。 4. **绩效考核工具*...
描述中的“样本”再次确认了这一点,它告诉我们这个项目是为了检查或理解某个功能或技术而创建的。标签是“Java”,这意味着项目与Java编程语言紧密相关,可能涉及到Java开发的基础知识、最佳实践或特定技术。 Java...
PCM是数字音频的一种基本格式,它直接编码模拟信号的样本值。SDL是一个开源的跨平台开发库,特别适用于游戏开发、图形界面以及多媒体应用,它提供了音频处理、图像渲染、事件处理等功能。 在描述中提到的“跨平台...
标签"libmikmod"强调了讨论的核心是这个特定的库,而"源代码"再次确认我们关注的是其内部工作原理和可能的修改。这些标签有助于在搜索和分类时快速识别相关内容。 **压缩包子文件的文件名称列表:** "libmikmod-...
【标题】"jxl 导出的小测试模板"涉及到的是使用Java编程语言中的jxl库进行Excel文件操作的知识点。...这些文件可能包含了jxl模板的实例,用于演示如何使用jxl库,或者它们是用于测试jxl库功能的样本数据。
【描述】:“samplerepository:cmsc 100第一周的示例存储库”描述简洁明了,再次确认这是一个与CMSC 100课程第一周相关的代码样本集合。这个存储库可能包含了一些基本的编程练习、作业、或者是教学演示,目的是帮助...
"样本库我们已经编辑了README文件"再次强调了对项目描述的更新。 标签“HTML”表明这个项目可能涉及到HTML(超文本标记语言)的使用。HTML是网页设计的基础,用于创建结构化的网页内容。 考虑到压缩包子文件的名称...
- 样本的填写:检验单上的样本信息包括物料批次、供应商信息、检验结果等,用于追溯和分析质量问题。 五、自定义抽检规则设置 根据产品特性和风险评估,企业可以设置自定义的抽检规则,如随机抽样、分层抽样等,以...
2. "下载更多打包源码~.url":这看起来是一个网址链接,可能是指向其他Android开源项目的资源库或者社区,方便开发者获取更多的学习资料和代码样本。 3. "SmartTabLayout-master":这是一个文件夹,通常在Git仓库中...
描述中的内容与标题相同,再次确认了这是一个包含250首流行歌曲的MIDI文件集合,总大小为1800Kb,意味着每首歌曲的平均大小大约是7.2Kb。这相对于音频文件(如MP3或WAV)来说是非常小的,因为MIDI文件并不记录声音...
通常,这种命名格式(如 samples-1.6.10)可能代表一个软件的样本或者示例代码库,其中“1.6.10”可能是版本号,表示这个样本是该软件1.6.10版本的一部分。 标签 "samples-1.6.10.tar.gz" 与标题相同,再次确认了...
- 如果驱动安装后无法正常启动,可能需要在`/etc/default/grub`中修改`GRUB_CMDLINE_LINUX_DEFAULT`值为`nomodeset`,然后更新grub (`sudo update-grub`),最后重启系统。 3. **CUDA 8.0安装**: - 首先禁用...
【标题解析】:“valuehorizon-datasets”是一个与“valuehorizon”应用程序相关的数据集,它提供了官方和样本数据以支持该应用的功能和分析。这个标题表明这个压缩包包含的是与某个名为Value Horizon的应用程序...
9. **自定义和扩展**:虽然LNCS模板已预设了许多样式,但你还可以通过修改模板文件或引入额外的包来自定义样式。例如,调整字体、页眉页脚、章节样式等。 10. **审阅和提交**:完成论文后,仔细检查拼写、语法和...
默认值(这些值应在local_defaults.h处更改,然后代码应再次交叉编译): 默认的I2C总线:1(Beaglebone的i2c-2)。 默认采样率:10 Hz 默认偏航混合系数:4 #####已发布的主题imu_euler(std_msgs :: String)
描述中的信息与标题相同,再次强调了该程序可以处理8个WAV文件的混音工作。这在音乐制作、音频工程或者声音效果设计中非常有用,因为用户可以将多个音频轨道合并成一个立体声或环绕声输出,实现音效的融合和创新。 ...
描述再次强调了这是一个学习Web报废(Web Scraping)的存储库,意味着它可能包含了示例代码、教程或练习,帮助初学者理解如何使用Beautiful Soup进行Web抓取。 **Beautiful Soup库介绍** Beautiful Soup提供了一种...