`
kofsky
  • 浏览: 201792 次
  • 性别: Icon_minigender_1
  • 来自: 重庆
社区版块
存档分类
最新评论

样本库再次修改

阅读更多

2006.11.6     168个样本,提取27个特征
2006.11.10   样本数604;
                       增加灰度共生矩阵特征及形态学特征
                      使用逐步求精的思路来搜索最优的弱分类器

2006.11.22  样本增加至3600多个
                      修改灰度共生矩阵提取特征的方向
                      增加灰度差分统计特征
                      加入gabor特征
2006.12.5  样本库修正
                        1003个手工切割的病斑样本,425个从程序中获取的较大的非病斑样本

2007.3月左右
            这是到目前为止实现的最稳定的样本库。
            1000个手工剪切的正样本,1000个负样本,其中手工剪切500个左右,程序剪切500个左右
            从2007.3月至2007.9月的所有实验均是基于这个样本库
            所做过的正规实验包括八种特征提取方法、七种特征选择方式、HMax模型以及ColorHMax模型、三种识别方案等等
          张师姐发表的四五篇论文,已经自己的论文的实验数据,均是基于这个样本库

2007.10
            样本库再次扩充
            正样本没有改变,只是对负样本库进行扩充。
          病斑负样本通过三个方式获得:从289幅柑橘叶片上用程序截取非病斑区域(叶片边缘与叶片区域)共计约3000余个;从柑橘叶片图像上手工剪切不同颜色的背景区域约600个;从互联网上用爬虫程序搜索获得2600幅大小为140X140的叶片图像。三种方式获得的负样本数量共计6150枚。在1000枚病斑正样本上截取10X10窗口10个,共计10000个窗口级的正样本;在每个病斑负样本上截取10X10窗口10个,共计60000余个窗口级的负样本。

2007.11.27日起弃用该样本库
原因在于:
1、负样本过于复杂
   从web上搜索获得的图片其特征多样、形式多样,导致负样本库本身差异非常大
   将近7万个样本训练一个500轮的分类器,训练错误率仍然在5%以上

2、实验耗时非常巨大
   将近7万个样本训练一个500轮的分类器,耗时36小时以上,这是无法仍受的

3、重复样本数量巨大
   尤其是负样本,存在大量相似的样本。

基于以上三个原因,我们在11.27以后对负样本库进行了精简

将从web上表现差异非常大的负样本删除
将从叶片上通过程序剪切获取的相似负样本大量删除

精简后,病斑负样本由6000减至2000
窗口负样本由60000以上减少至10000左右

 
 

分享到:
评论

相关推荐

    样本点自动计算版本1.rar_linemut_matlaB nastran_requireoqj

    在描述中提到的“根据样本点,自动修改有限元脚本文件,提交计算”这一过程,我们可以理解为这是一个自动化工作流程,其目标是利用MATLAB编写脚本来处理一系列的样本点数据。这些样本点可能来源于实验测量、仿真结果...

    松下安全监控类摄像机SDK源代码_CGI技术样本软件

    开发者可以通过分析和修改这些样本,理解如何与摄像机进行通信,并构建自己的应用程序。 5. **开发流程**:使用SDK开发应用通常涉及以下步骤:安装SDK,了解提供的文档和API,创建项目,在VS2005中导入SDK库,编写...

    Python库 | speaker-verification-0.1.2.tar.gz

    描述中的"python库"再次强调了这个资源是为Python设计的,而"资源全名:speaker-verification-0.1.2.tar.gz"告诉我们这个库的完整名称以及它的压缩文件形式。 从标签"python 开发语言 Python库"我们可以推断,这个...

    电脑软件HR经理必备【办公文件库】.rar

    2. **合同模板**:各种劳动合同样本,员工保密协议,竞业禁止协议等,方便快速制定和修改合同。 3. **培训材料**:新员工入职培训资料,技能培训课程,团队建设活动方案等,用于提升员工能力。 4. **绩效考核工具*...

    Sample:这是样本项目,仅用于检查

    描述中的“样本”再次确认了这一点,它告诉我们这个项目是为了检查或理解某个功能或技术而创建的。标签是“Java”,这意味着项目与Java编程语言紧密相关,可能涉及到Java开发的基础知识、最佳实践或特定技术。 Java...

    基于SDL同步的PCM播放器,跨平台支持Windows和Linux,内附实例修改音频文件路径后即可直接运行

    PCM是数字音频的一种基本格式,它直接编码模拟信号的样本值。SDL是一个开源的跨平台开发库,特别适用于游戏开发、图形界面以及多媒体应用,它提供了音频处理、图像渲染、事件处理等功能。 在描述中提到的“跨平台...

    libmikmod-3.1.12 源代码

    标签"libmikmod"强调了讨论的核心是这个特定的库,而"源代码"再次确认我们关注的是其内部工作原理和可能的修改。这些标签有助于在搜索和分类时快速识别相关内容。 **压缩包子文件的文件名称列表:** "libmikmod-...

    jxl 导出的小测试模板

    【标题】"jxl 导出的小测试模板"涉及到的是使用Java编程语言中的jxl库进行Excel文件操作的知识点。...这些文件可能包含了jxl模板的实例,用于演示如何使用jxl库,或者它们是用于测试jxl库功能的样本数据。

    samplerepository:cmsc 100第一周的示例存储库

    【描述】:“samplerepository:cmsc 100第一周的示例存储库”描述简洁明了,再次确认这是一个与CMSC 100课程第一周相关的代码样本集合。这个存储库可能包含了一些基本的编程练习、作业、或者是教学演示,目的是帮助...

    sample-repository:这是一个示例存储库

    "样本库我们已经编辑了README文件"再次强调了对项目描述的更新。 标签“HTML”表明这个项目可能涉及到HTML(超文本标记语言)的使用。HTML是网页设计的基础,用于创建结构化的网页内容。 考虑到压缩包子文件的名称...

    质量检验流程与操作指南.doc

    - 样本的填写:检验单上的样本信息包括物料批次、供应商信息、检验结果等,用于追溯和分析质量问题。 五、自定义抽检规则设置 根据产品特性和风险评估,企业可以设置自定义的抽检规则,如随机抽样、分层抽样等,以...

    SmartTabLayout.zip

    2. "下载更多打包源码~.url":这看起来是一个网址链接,可能是指向其他Android开源项目的资源库或者社区,方便开发者获取更多的学习资料和代码样本。 3. "SmartTabLayout-master":这是一个文件夹,通常在Git仓库中...

    精选250首流行歌曲midi格式1800Kb.rar

    描述中的内容与标题相同,再次确认了这是一个包含250首流行歌曲的MIDI文件集合,总大小为1800Kb,意味着每首歌曲的平均大小大约是7.2Kb。这相对于音频文件(如MP3或WAV)来说是非常小的,因为MIDI文件并不记录声音...

    samples-1.6.10.tar.gz

    通常,这种命名格式(如 samples-1.6.10)可能代表一个软件的样本或者示例代码库,其中“1.6.10”可能是版本号,表示这个样本是该软件1.6.10版本的一部分。 标签 "samples-1.6.10.tar.gz" 与标题相同,再次确认了...

    ubuntu14.04+Cuda8.0+caffe安装指南

    - 如果驱动安装后无法正常启动,可能需要在`/etc/default/grub`中修改`GRUB_CMDLINE_LINUX_DEFAULT`值为`nomodeset`,然后更新grub (`sudo update-grub`),最后重启系统。 3. **CUDA 8.0安装**: - 首先禁用...

    valuehorizon-datasets:官方和样本数据,以补充 valuehorizo​​n 应用程序

    【标题解析】:“valuehorizon-datasets”是一个与“valuehorizo​​n”应用程序相关的数据集,它提供了官方和样本数据以支持该应用的功能和分析。这个标题表明这个压缩包包含的是与某个名为Value Horizon的应用程序...

    LNCS Latex模板_官方

    9. **自定义和扩展**:虽然LNCS模板已预设了许多样式,但你还可以通过修改模板文件或引入额外的包来自定义样式。例如,调整字体、页眉页脚、章节样式等。 10. **审阅和提交**:完成论文后,仔细检查拼写、语法和...

    欧拉公式求圆周率的matlab代码-bb_mpu9150:将InvensenseMPU-9150数据发布到主题中的BeagleBoneROS软

    默认值(这些值应在local_defaults.h处更改,然后代码应再次交叉编译): 默认的I2C总线:1(Beaglebone的i2c-2)。 默认采样率:10 Hz 默认偏航混合系数:4 #####已发布的主题imu_euler(std_msgs :: String)

    可同时8个wave文件混音(338KB)

    描述中的信息与标题相同,再次强调了该程序可以处理8个WAV文件的混音工作。这在音乐制作、音频工程或者声音效果设计中非常有用,因为用户可以将多个音频轨道合并成一个立体声或环绕声输出,实现音效的融合和创新。 ...

    web-scrapper:一个使用Beautiful Soup学习Web报废的存储库

    描述再次强调了这是一个学习Web报废(Web Scraping)的存储库,意味着它可能包含了示例代码、教程或练习,帮助初学者理解如何使用Beautiful Soup进行Web抓取。 **Beautiful Soup库介绍** Beautiful Soup提供了一种...

Global site tag (gtag.js) - Google Analytics