`

数据挖掘之复杂类型数据的挖掘学习笔记(2)

阅读更多

多媒体数据挖掘

"什么是多媒体数据库?"多媒体数据库是指存储和管理大量多媒体对象的数据库,如音频数据,图象数据,视频数据,序列数据,以及超文本数据,包含文本,文本标记(text markup),和链接(linkage)

 

由于音频视频设备,CD-ROMs,和因特网的流行和普及,多媒体数据库系统变的日益常见。典型的多媒体数据库系统包括NASA's EOS(地球观测系统),各种图象和音频视频数据库,人类基因数据库,和因特网数据库。

 

"在多媒体数据库中搜索相似数据,既可以基于数据描述,也可以基于数据内容?"此言不错。

对多媒体数据相似搜索,主要考虑两种多媒体标引和检索系统:(1)基于描述的检索系统,主要是在图象描述之上建立标引和执行对象检索,如关键字,标题,尺寸,创建时间等;(2)基于内容的检索系统,它支持基于图象内容的检索,如颜色构成,质地,形状,对象,和小波变换等。基于描述的检索若手工完成是很费力的。若自动完成,检索结果质量通常较差;例如,对图象赋予关键字可以是很灵活随意的事情。基于内容的检索使用视觉的特征标引图象并基于特征相似检索对象,这在很多应用中都是需要的。

 

在基于内容的检索系统中,通常有两种查询:基于图象样本的查询(image sample-based queries

和图象特征描述查询(image feature specification queries)。图象样本查询是指找出所有与给定图象样本相似的图象。其做法是把从样本中提取的特征向量(feature vector)(或特征标识(signature))与已经提取出并在图象数据库中已经索引过的图象特征向量相比较。基于这一比较结果,可以得到与样本图象近似的图象。图象特征描述查询是指给出图象的特征描述或概括,如颜色,结构,或形状,把其转换为特征向量,与数据库中已有的图象特征向量匹配。基于内容的检索的有广泛的用途,包括医疗诊断,气象预报,TV 制作,针对图象的Web 搜索引擎,以及电子商务等。一些系统如QBICQuery By Image Content,按图象内容查询),同时支持样本查询和图象特征描述查询。也有系统同时支持基于内容和基于描述的检索。

 

人们已经提出了几种在图象数据库中基于图象特征标识的相似检索方法:

<基于颜色直方图的特征标识(color histogram-based signature):此方法中,图象的特征标识包括了基于的图象颜色构成的颜色直方图,这其中忽略的图象的尺度(scale)或方位(orientation)。由于此方法中并不包含任何有关形状,位置,或质地的信息,因此具有相似颜色构成的两幅图象可以包含极为不同的形状或质地,这样在语义上可以是完全不相关的。

<多特征构成的特征标识(multifeature composed signature):此方法中,图象的特征标识由多个特征的组成:颜色直方图,形状,位置,和结构。通常,可以对每一个特征定义其距离函数,然后将各结果综合导出总的结果。多维的基于内容的检索通常使用一个或几个探测特征,来搜索包含同样特征的图象。因此它可用于相似图象的搜索。

<基于小波的特征标识(wavelet-based signature):本方法使用了图象的小波系数作为起特征标识。小波可以在一个唯一统一的框架内27表示形状,结构和位置等信息。这将改进效率并减少对多个特征搜索的需要(与第二种方法不同)。然而,由于此方法对整个图象只计算一个特征标识,它可能无法识别出虽包含相同对象但对象位置或尺寸不同的图象。

<带有区域粒度的小波特征标识(wavelet-based signature with region-based granularity):此方法中,特征标识的计算和比较是在区域粒度上进行,而不是在整个图象上。这是基于如下的结论:相同的图象可能包含相同的区域,但一幅图象中一个区域可以是另一幅图象中的匹配区域的变换或伸缩的结果。因此,查询图象Q 和目标图象T 之间的相似计算可定义在由Q T 相匹配的区域所覆盖的两幅图象的面积碎片上进行。这种基于区域相似的搜索可以找出这样的图象,它们包含相似对象,但这些对象可以是经过变换

分享到:
评论

相关推荐

    《数据挖掘技术》课程学习笔记

    本篇学习笔记主要涵盖了数据挖掘的基础概念、常用算法以及实践应用。 首先,我们需要理解数据挖掘的定义:它是从大量数据中通过运用专门的算法和技术,提取出有用信息并进行模式识别的过程。数据挖掘的目标通常分为...

    《数据挖掘概念与技术》-思维导图学习笔记,第一章。

    2. 数据挖掘任务类型:主要分为五类:分类、聚类、关联规则学习、序列模式挖掘和异常检测。分类是根据已知特征将数据划分为预定义类别;聚类则是将相似的数据分组;关联规则用于发现项集之间的频繁模式;序列模式...

    用商业案例学R语言数据挖掘-学习笔记.pdf

    全书分为18章,覆盖了R语言的基础知识、统计学习方法和数据挖掘技术,以及特征工程和文本挖掘等内容。 在R语言的学习中,首先需要理解基本数据类型,包括numeric(数值型)、character(字符型)等,并能熟练判断...

    斯坦福大学CS345A 数据挖掘 课程所有课件(pdf+ppt)

    数据挖掘是信息技术领域的一个核心分支,它涉及到从大量复杂数据中发现有价值信息的过程。斯坦福大学的CS345A课程专门聚焦于这个主题,旨在为学生提供深入的数据挖掘理论和实践技能。在这个课程中,学生可以期待学习...

    基于数据挖掘的网络学习行为分析及其教学策略研究.pdf

    本研究聚焦于如何应用数据挖掘技术分析学生的网络学习行为,并在此基础上制定相应的教学策略,以提升网络教学的水平。研究详细探讨了网络学习行为的属性,以及如何利用数据挖掘技术从这些行为中提取有用信息,进而...

    数据挖掘笔记01-031

    数据挖掘是一种从海量数据中发现有价值信息的过程,它结合了统计学、机器学习、数据库技术等多个领域的知识。在数据挖掘笔记01-031中,主要涉及了数据预处理、SQL查询、在线分析处理(OLAP)以及了解数据等核心概念...

    数据挖掘完整项目/课堂记录笔记/比赛代码

    数据挖掘是信息技术领域中的一个重要分支,它涉及到从大量复杂数据中发现有价值信息的过程。本项目提供了从零基础到精通的数据挖掘全过程,旨在帮助学习者掌握实际操作技能,并通过课堂记录笔记和比赛代码来深化理解...

    机器学习&数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理)1

    在当今这个大数据时代,机器学习与数据挖掘技术的重要性日益凸显,它们为处理海量数据提供了解决方案,能够从复杂的数据集中发现潜在的模式和知识。掌握机器学习和数据挖掘中的各种算法思想,不仅是构建高效预测模型...

    数据挖掘资料(吐血汇总).rar

    "数据挖掘笔记"这部分内容可能是学习者对所学知识的整理,包括关键概念的总结、公式解析、算法实现步骤等,对于初学者来说,这是一份极具价值的参考资料,能帮助他们更好地理解和记忆复杂的知识点。 "习题"则提供了...

    数据挖掘课件(ETL工具)

    通过这些材料,学习者可以深入了解数据挖掘的实际操作,掌握如何利用ETL工具处理复杂数据,并为后续的数据分析和建模打下坚实基础。 总的来说,这个数据挖掘课件着重于数据预处理的ETL流程,结合朱建秋教授的专业...

    数据挖掘学习笔记(一)

    数据挖掘利用各种算法,如分类、聚类、关联规则学习、回归分析等,来发现知识和模式,这些知识可能对决策制定有着重大影响。在现代社会,数据源多样化且增长迅速,涵盖了商业、科学、社会和个人生活的各个层面。数据...

    数据挖掘和大数据处理经验笔记

    在这个经验笔记中,我们将探讨数据挖掘的整体流程,数据库编程技巧,以及处理大数据的关键概念。 首先,数据挖掘的整体流程通常包括数据预处理、数据清洗、数据整合、数据建模和结果评估。数据预处理是获取数据的第...

    海南大学数据挖掘入土笔记.pdf

    数据挖掘是一项涉及到多个学科和领域的复杂技术,它在现代社会中扮演着越来越重要的角色。以下是根据给定文件内容整理出的数据挖掘相关知识点。 首先,数据挖掘的概念指的是在大型数据库中自动发现有用信息的过程。...

    I_数据挖掘与数据挖掘工具[收集].pdf

    3. **数据挖掘算法**:包括统计学、人工智能、机器学习和遗传算法等领域的算法发展,为从数据中提取知识提供了理论基础和实用工具。 数据挖掘的应用广泛,如在零售业,美国的沃尔玛通过分析销售数据发现尿布和啤酒...

    《数据挖掘》读书笔记.pdf

    《数据挖掘》读书笔记主要涵盖了数据可视化、建模方法、数据挖掘技术和预测分析的应用。作者Philipp K. Janer凭借其在物理学和软件工程领域的深厚背景,为读者提供了丰富的数据分析和数学建模知识。 在全书中,作者...

    基于Jupyter Notebook的Python数据挖掘与实战教程设计源码

    以上内容展示了数据挖掘的多样性和复杂性,以及Jupyter Notebook作为交互式学习工具的优势,让学习者可以通过实际编码和分析,加深对数据挖掘理论的理解,并提高解决实际问题的能力。教程旨在帮助初学者快速入门...

    大数据学习笔记_学习《Python数据分析与挖掘实战》关键知识点和心得笔记

    本文将基于《Python数据分析与挖掘实战》这本书的学习笔记,深入探讨几个关键知识点:分类与预测、聚类分析、关联规则以及时序模式。 **一、分类与预测** 分类与预测是数据分析中的核心任务,它通过历史数据来预测...

    数据仓库笔记

    数据仓库笔记的知识点涵盖了数据仓库和数据挖掘的基本概念、数据挖掘的主要任务与方法、学习算法以及搭建数据仓库的相关知识。下面将详细阐述这些知识点。 首先,数据仓库是为了企业决策支持而设计的系统,它主要...

    数据挖掘教学资料PPT视频各种文档

    视频教学则更直观,通过讲师的讲解和操作演示,可以帮助学习者更好地理解复杂的数据挖掘流程和工具使用,例如使用Python的pandas库进行数据清洗,用scikit-learn进行模型训练,或者使用R语言进行统计分析等。...

    《数据挖掘》读书笔记.docx

    通过对《数据挖掘》这本书的学习,我们可以了解到数据挖掘不仅涵盖了数据的观察与分析,还包括了数据挖掘技术及其在实际场景中的应用。本书通过介绍各种分类算法和技术,为我们提供了丰富的工具和方法论,帮助我们在...

Global site tag (gtag.js) - Google Analytics