`
grunt1223
  • 浏览: 422888 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

Pascal VOC Challenge —— 图像识别与物件分类的挑战

阅读更多
在计算视觉的领域中,Pascal VOC Challenge 就好比是数学中的哥德巴赫猜想一样。Pascal的全称是Pattern Analysis, Statical Modeling and Computational Learning。每年,该组织都会提供一系列类别的、带标签的图片,挑战者通过设计各种精妙的算法,仅根据分析图片内容来将其分类,最终通过准确率、召回率、效率来一决高下。

这项活动从2005年开始,每年的样本数据库都有所不同:
YearStatisticsNew developmentsNotes
2005Only 4 classes: bicycles, cars, motorbikes, people. Train/validation/test: 1578 images containing 2209 annotated objects.Two competitions: classification and detectionImages were largely taken from exising public datasets, and were not as challenging as the flickr images subsequently used. This dataset is obsolete.
200610 classes: bicycle, bus, car, cat, cow, dog, horse, motorbike, person, sheep. Train/validation/test: 2618 images containing 4754 annotated objects.Images from flickr and from Microsoft Research Cambridge (MSRC) datasetThe MSRC images were easier than flickr as the photos often concentrated on the object of interest. This dataset is obsolete.
200720 classes:Person: personAnimal: bird, cat, cow, dog, horse, sheepVehicle: aeroplane, bicycle, boat, bus, car, motorbike, trainIndoor: bottle, chair, dining table, potted plant, sofa, tv/monitorTrain/validation/test: 9,963 images containing 24,640 annotated objects.Number of classes increased from 10 to 20Segmentation taster introducedPerson layout taster introducedTruncation flag added to annotationsEvaluation measure for the classification challenge changed to Average Precision. Previously it had been ROC-AUC.This year established the 20 classes, and these have been fixed since then. This was the final year that annotation was released for the testing data.
200820 classes. The data is split (as usual) around 50% train/val and 50% test. The train/val data has 4,340 images containing 10,363 annotated objects.Occlusion flag added to annotationsTest data annotation no longer made public.The segmentation and person layout data sets include images from the corresponding VOC2007 sets.
200920 classes. The train/val data has 7,054 images containing 17,218 ROI annotated objects and 3,211 segmentations.From now on the data for all tasks consists of the previous years' images augmented with new images. In earlier years an entirely new data set was released each year for the classification/detection tasks.Augmenting allows the number of images to grow each year, and means that test results can be compared on the previous years' images.Segmentation becomes a standard challenge (promoted from a taster)No difficult flags were provided for the additional images (an omission).Test data annotation not made public.
201020 classes. The train/val data has 10,103 images containing 23,374 ROI annotated objects and 4,203 segmentations.Action Classification taster introduced.Associated challenge on large scale classification introduced based on ImageNet.Amazon Mechanical Turk used for early stages of the annotation.Method of computing AP changed. Now uses all data points rather than TREC style sampling.Test data annotation not made public.


以一张人物肖像为例,对应的Annotation描述为下:



<annotation>
	<folder>VOC2007</folder>
	<filename>000001.jpg</filename>
	<source>
		<database>The VOC2007 Database</database>
		<annotation>PASCAL VOC2007</annotation>
		<image>flickr</image>
		<flickrid>341012865</flickrid>
	</source>
	<owner>
		<flickrid>Fried Camels</flickrid>
		<name>Jinky the Fruit Bat</name>
	</owner>
	<size>
		<width>353</width>
		<height>500</height>
		<depth>3</depth>
	</size>
	<segmented>0</segmented>
	<object>
		<name>dog</name>
		<pose>Left</pose>
		<truncated>1</truncated>
		<difficult>0</difficult>
		<bndbox>
			<xmin>48</xmin>
			<ymin>240</ymin>
			<xmax>195</xmax>
			<ymax>371</ymax>
		</bndbox>
	</object>
	<object>
		<name>person</name>
		<pose>Left</pose>
		<truncated>1</truncated>
		<difficult>0</difficult>
		<bndbox>
			<xmin>8</xmin>
			<ymin>12</ymin>
			<xmax>352</xmax>
			<ymax>498</ymax>
		</bndbox>
	</object>
</annotation>

  • 大小: 76.9 KB
1
1
分享到:
评论

相关推荐

    NWPU VHR-10的pascal voc格式

    NWPU VHR-10的pascal voc格式NWPU VHR-10的pascal voc格式NWPU VHR-10的pascal voc格式NWPU VHR-10的pascal voc格式NWPU VHR-10的pascal voc格式NWPU VHR-10的pascal voc格式NWPU VHR-10的pascal voc格式NWPU VHR-10...

    行人检测数据集——pascalvoc格式

    PASCAL VOC数据集由一系列图像组成,每个图像都包含了不同数量和位置的行人实例。数据集的结构包括训练集和验证集,有时还有测试集,用于模型的训练和性能评估。每张图片都配有详细的注释,包括边界框信息,这些边界...

    Pascal VOC数据集PPT

    介绍了Pascal VOC Challenge,讲述了一下pascal VOC Challenge的历史,同时讲述了VOC数据集的组织结构。

    用于图像标注的 在线网络工具(图像识别 中使用的 Pascal VOC 格式)_JavaScript_代码_下载

    这个工具的关键功能是生成Pascal VOC格式的XML文件,这是一种广泛用于计算机视觉领域,特别是图像识别和物体检测的数据标注格式。 Pascal VOC(Visual Object Classes)格式是一个标准化的XML结构,用于存储图像中...

    pascalvoc2012数据集下载链接.txt

    pascal voc2012 train 和test 官网数据集下载真的很慢。这里提供百度网盘下载链接,保证可用!

    PASCALVOC制作的训练集

    PASCALVOC数据集包含了多个类别的真实世界图像,每个类别都有大量的实例,使得它成为训练和评估目标检测算法的理想选择。 在这个特定的训练集中,有1000多张图片,涵盖了五种不同的水果类别。这意味着每种水果都有...

    PASCAL VOC2007格式标注工具

    PASCAL VOC2007格式标注工具是针对计算机视觉领域的一个重要辅助工具,主要用于创建和编辑用于训练图像识别和物体检测模型的数据集。在深度学习时代,高质量的标注数据对于模型的训练至关重要,而PASCAL VOC2007格式...

    pascal voc 2012提取某一类的图片

    pascal voc 2012提取某一类的图片,例子中提取的牛这一类,新手上路,请多指教。

    【Demo】对PASCAL VOC 数据集进行数据增强.zip

    PASCAL VOC(Visual Object Classes)是一个广泛使用的计算机视觉数据集,主要应用于物体识别和分割任务。这个数据集包含了多种类别的真实世界物体的图像,每个图像都附带了精确的边界框标注,使得它成为训练和评估...

    Pascal VOC 2007数据集(用于物体检测)

    Pascal VOC 2007数据集(用于物体检测),可用于检验 YOLO、Fast-RCNN 等算法

    Pascal voc 2007 行人数据集

    Pascal VOC(Visual Object Classes)挑战赛是一项国际性的计算机视觉竞赛,旨在推动图像识别、物体检测和语义分割等领域的发展。其中,Pascal VOC 2007 行人数据集是该挑战赛中的一个重要组成部分,它对于研究行人...

    制作 DeepLabV3Plus所需要的训练数据(PASCAL VOC2012数据集格式)

    PASCAL VOC(Visual Object Classes)是一个广泛使用的计算机视觉数据集,特别适合于语义分割任务,即识别图像中的不同对象类别并将其分段。 首先,我们来了解一下PASCAL VOC2012数据集。该数据集包含20个不同的...

    【打印版】Pascal VOC数据集2005-2012的发展改进【官方文档中英文对照】

    9. **影响与后续**:Pascal VOC数据集为后来的图像识别和物体检测研究奠定了基础,许多现代深度学习模型的训练和验证都离不开它。同时,它启发了其他领域的数据集设计,如CVPR、ICCV和ECCV等顶级会议上的相关工作。 ...

    PascalVOC2007

    Pascal VOC2007是一个广泛使用的计算机视觉数据集,主要设计用于图像识别、目标检测和语义分割等任务。这个数据集由9963张图像组成,涵盖了20个不同的类别,如人、车、猫、狗等日常物体。在深度学习领域,Pascal VOC...

    PyPI 官网下载 | pascalvoc_to_image-1.0.0.tar.gz

    《PyPI官网下载:pascalvoc_to_image-1.0.0.tar.gz——Python库解析与应用》 PyPI(Python Package Index)是Python开发者的重要资源库,它提供了丰富的Python库供全球开发者下载和使用。本文将详细介绍PyPI官网...

    水果分类目标检测VOC数据集.zip

    《深度学习中的目标检测:基于VOC数据集的解析与应用》 在计算机视觉领域,目标检测是一项核心任务,它涉及识别图像中的特定对象并确定它们的位置。VOC(PASCAL Visual Object Classes)数据集是这个领域内广泛使用...

    Pascal voc2012数据集的info.json文件

    Pascal voc2012数据集的info.json文件,用于对各类别的mIoU的计算

    pascal voc 2007下载地址.txt

    著名的voc2007数据集,做目标检测的任务时常会用到,但官网下载有时比较慢~所以我把资源传到了我的百度网盘,要下载的朋友可以访问我的网盘地址~

    voc2012数据集下载

    VOC2012数据集是计算机视觉领域中一个非常重要的资源,主要用于图像识别、目标检测和语义分割等任务的训练与评估。这个数据集由PASCAL VOC(Pattern Analysis, Statistical Modelling and Computational Learning, ...

    PASCAL Visual Object Classes Challenge 2010 数据集原始数据(VOC2010)数据集

    PASCAL Visual Object Classes Challenge 2010年的图像数据集。PASCAL Visual Object Classes 是一个图像物体识别竞赛,用来从真实世界的图像中识别特定对象物体,共包括 4 大类 20 小类物体的识别。其类别信息如下...

Global site tag (gtag.js) - Google Analytics