Spark源码分析13-Tuning Spark -

frankfan915

浏览: 357370 次
性别:
来自: 杭州

最近访客更多访客>>

gaojingsong

javacoo

449582981

nick_jian

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

Spark源码分析13-Tuning Spark

博客分类：

源码分析
Spark

We can refer to the link http://spark.incubator.apache.org/docs/latest/tuning.html for detail tuning document.

After tuning, spark can process 200M logs every minutes in one single work with 1G memory. The time for finish process logs is about 35-40 seconds every duration.

There is some points I do the tuning.

I change the logs, every use conation 20KB logs, so 5000 uses will have 100M logs. When the logs of every use is less, the concurrent process speed will have improvement

JavaDStream<String> stringStream = jsc.socketTextStream("0.0.0.0", ConfigUtil.getInt(ConfigUtil.KEY_SPARK_REMOTE_FLUME_LISTENER_PORT), StorageLevel.MEMORY_AND_DISK())

Add StorageLevel.MEMORY_AND_DISK() when create stream, the default is StorageLevel.MEMORY_AND_DISK2(), will use double memory.

Replace code String user = currentLine.substring(start,end); with String user = new String(currentLine.substring(start,end).toCharArray());

Because substring will create a new String, it will use the same char array with currentLine, thus when some object have refer to user object and currentLine is useless, currentLine also can’t be recycle.

update Spark configure. Below is the latest configuration, when the data is different, sometimes we need update it.

sparkConf.setMaster(ConfigUtil.getString(ConfigUtil.KEY_SPARK_REMOTE_MASTER)).setAppName(appName)

.setJars(new String[]{ConfigUtil.getString(ConfigUtil.KEY_SPARK_REMOTE_JAR_LOCATION)})

.set("spark.executor.memory", "1024m")

.set("spark.streaming.unpersist", "true")

.set("spark.rdd.compress", "true")

.set("spark.default.parallelism", "12")

.set("spark.storage.memoryFraction", "0.3")

.set("spark.cleaner.ttl", "1200")

//.set("spark.serializer", "org.apache.spark.serializer.KryoSerializer")

// .set("spark.kryo.registrator", "com.seven.oi.spark.KryoRegistratorEx")

//.setExecutorEnv("SPARK_JAVA_OPTS","-XX:NewRatio=1 -XX:+UseCompressedStrings -verbose:gc -XX:+PrintGCDetails -XX:+PrintGCTimeStamps")

//.setExecutorEnv("SPARK_JAVA_OPTS", "-XX:NewRatio=1 -XX:+UseCompressedStrings")

//use fastutil to store map

.set("spark.shuffle.memoryFraction", "0.3");

set spark.rdd.compress = true, thus can use less memory

when out of memory happen, we can also consider increment spark.default.parallelism.

sometimes we can use org.apache.spark.serializer.KryoSerializer, Kryo is significantly faster and more compact than Java serialization. default is Java serialization. (Need more test, current I can’t find any different in my test).

When there is a lot of young GC, we can consider increment the Young generation. Set -XX:NewRatio

When the JDK is 64 bit, we can use -XX:+UseCompressedStrings to compress String. I found JDK with 64 bit will use more memory then JDK with 32 bit.

We also can consider increment spark.shuffle.memoryFraction when have a lot of shuffle operation

If you want spark submit more tasks every time you can increment SPARK_WORKER_CORES. spark will submit tasks less than SPARK_WORKER_CORES every time

分享到：

Zookeeper 学习 | Spark源码分析12-yarn部署

2014-05-15 17:48
浏览 2571
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

sparklens：用于优化Apache Spark性能的Qubole Sparklens工具: Sparklens是由Qubole开发的一款强大的开源工具，专门用于分析和优化Apache Spark应用程序的性能。这个工具的主要目的是帮助开发者和数据工程师深入了解Spark作业的执行细节，从而更好地理解和调优性能。Sparklens...

学习-hive源码.doc: 通过深入源码，可以进行调试(debuging)、性能调优(tuning)以及应用新的补丁(patch)，这些都是提高Hive性能和稳定性的关键步骤。例如，理解Hive的元数据存储、查询优化器的工作原理，以及如何配置和扩展Hive以适应...

直播项目微信小程序源码(类似于微信视频通话).zip: 《直播项目微信小程序源码简介》本资源是一份极具学习价值的直播项目微信小程序源码，类似于微信视频通话功能。它为开发者提供了一个完整的直播项目框架和实现逻辑，可用于深入研究直播技术在小程序中的应用。该源码涵盖了直播项目的核心功能模块，包括视频采集、推流、播放等关键部分。通过对其代码结构的研究，开发者可以了解到如何利用微信小程序的相关接口和功能来实现流畅、稳定的直播体验。例如，在视频采集方面，源码展示了如何在小程序中调用设备摄像头，并进行实时视频数据的处理；在推流环节，详细阐述了如何将采集到的视频数据推送到服务器，以供其他用户观看；而在播放部分，则清晰地展示了如何在小程序界面上实现视频的流畅播放和控制。这份源码不仅有助于开发者掌握直播技术在小程序中的实际应用，还能为进一步开发和优化直播类小程序提供宝贵的参考和借鉴，是一份不可多得的学习资源。

详细阐述了中国智慧医疗建设的发展历程、现状、挑战及未来趋势以下是文章的主要内容总结：: 内容概要：本文详细探讨了智慧医疗建设的历程、现状、挑战及未来发展趋势。智慧医疗建设经历了信息化、数字化和数智化三个阶段，政策、需求和技术是其发展的三大推动力。文章指出，当前智慧医疗已从数据收集与治理阶段迈向数据价值应用阶段，特别是在高质量数据库建设、云计算、人工智能等技术的推动下，实现了临床科研、药物研发、真实世界研究及数字营销等多个场景的商业化落地。此外，文中还分析了医疗信息化系统同质化、数据孤岛、互联互通等痛点，并提出了云化转型、新产品、新技术和新服务作为突破方向。最后，通过奈特瑞、医渡科技、东软集团三个企业案例，展示了不同企业在智慧医疗领域的创新实践。适合人群：医疗信息化从业者、医疗行业研究人员、医疗机构管理者、医疗科技企业相关人员、政策制定者及对智慧医疗感兴趣的投资者。使用场景及目标：①了解智慧医疗建设的阶段性特征和发展趋势；②掌握医疗信息化建设中的关键技术和应用场景；③探讨解决医疗信息化系统同质化、数据孤岛等问题的策略；④学习企业如何通过新产品、新技术和新服务实现突破，推动智慧医疗发展。其他说明：本文通过对智慧医疗建设的深入剖析，强调了政策导向、技术创新和市场需求的重要性，为企业和政策制定者提供了宝贵的参考。同时，文章也揭示了未来智慧医疗发展的广阔前景，特别是在数据资产化和数智化应用方面的巨大潜力。阅读时应注意结合政策背景和技术发展趋势，关注行业动态和企业创新实践。

电机设计领域中8级48槽永磁同步电机振动噪声分析的Motor CAD应用: 内容概要：本文详细介绍了利用Motor CAD软件对8级48槽永磁同步电机进行振动噪声分析的方法和步骤。主要内容涵盖前期准备工作，如软件环境搭建和基本原理的理解；建立电机模型的具体细节，包括定子和转子部分的参数设置；振动噪声分析的相关设置，特别是电磁力波的计算方法及其重要参数的设定；以及最终分析结果的解读，包括振动模态图和噪声频谱分析结果的应用。通过这些步骤，可以识别出导致较大振动和噪声的问题所在，并提出针对性的优化措施，如调整槽配合、优化永磁体形状等，以改善电机的整体性能。适合人群：从事电机设计与优化的专业人士，尤其是对永磁同步电机振动噪声分析感兴趣的工程师和技术人员。使用场景及目标：适用于希望深入了解和掌握Motor CAD软件在电机振动噪声分析方面应用的技术人员。目标是在实际工作中能够运用所学知识，提高电机的设计质量和性能，减少不必要的振动和噪声。其他说明：文中提供了大量具体的代码片段和操作指南，帮助读者更好地理解和实践。同时强调了电磁-机械-声学耦合的重要性，指出结构设计对于降噪的关键作用。

【计算机教育】计算机专业课后习题高效学习策略：构建知识体系与应对考试重点: 内容概要：本文是一篇面向计算机类专业学生的课后习题学习指南，强调课后习题对于构建专业知识体系的重要性。文章指出，做题不仅是为了完成任务或应付考试，更重要的是理解知识点背后的原理。文中详细介绍了不同课程类型的习题应采用的不同方法，如程序设计类需多动手调试，数据结构与算法类要手动画图并多敲代码等。同时提醒学生注意考试重点往往隐藏在课后题中，并提倡通过迭代学习巩固知识，避免常见错误。适合人群：计算机类专业的学生，特别是那些在课后习题练习中遇到困难或希望提高学习效率的人群。使用场景及目标：①帮助学生掌握正确的课后习题练习方法；②指导学生根据课程特点选择合适的做题策略；③提醒学生关注课后题中的潜在考试重点；④通过迭代学习的方式强化理解和记忆。阅读建议：本文提供了实用的学习技巧和建议，读者应在实际做题过程中尝试运用这些方法，不断调整和优化自己的学习方式，以达到更好的学习效果。

四旋翼无人机轨迹跟踪：PID与自适应滑模控制的Matlab仿真研究: 内容概要：本文详细探讨了四旋翼无人机（UAV）的轨迹跟踪控制技术，重点介绍了两种主流控制方法：PID控制和自适应滑模控制。首先，文章阐述了PID控制的基本原理及其在Simulink中的具体实现步骤，展示了如何通过调节PID参数实现稳定的轨迹跟踪，并提供了详细的Matlab代码示例。接着，文章深入讲解了自适应滑模控制的工作机制，强调了其对系统不确定性的强鲁棒性特点，并给出了相应的Matlab实现代码。此外，文中通过多种图表形式展示了不同控制方法下的仿真结果，直观比较了它们的优缺点。最后，作者总结指出，PID控制适合于系统模型较为确定的情况，而自适应滑模控制则更适合应对复杂的外部环境和不确定性因素。适合人群：对无人机控制系统感兴趣的科研人员、工程技术人员及高校相关专业学生。使用场景及目标：①帮助读者理解并掌握PID和自适应滑模控制的基本原理；②提供具体的Matlab/Simulink实现案例，便于读者进行实际操作练习；③通过对两种控制方法的对比分析，指导读者选择合适的控制策略应用于实际项目中。其他说明：文章不仅提供了详尽的技术细节，还包括了许多实用的小技巧和经验分享，有助于提高读者的实际动手能力和解决问题的能力。

电力电子领域LLC谐振变换器PFM+PSM混合控制仿真及其应用: 内容概要：本文详细探讨了LLC谐振变换器中变频移相（PFM+PSM）混合控制的仿真研究与实现。首先介绍了这种方法可以拓宽输入电压范围，确保MOS管的零电压开通（ZVS）和二极管的零电流关断（ZCS），从而降低开关损耗并提高变换器效率。接着展示了在Matlab/Simulink和Plecs环境下的具体实现步骤，包括关键参数设置、模式切换逻辑以及波形展示。文中还强调了参数整定的重要性，如谐振腔Q值的影响，并给出了具体的解决方案。此外，讨论了仿真过程中需要注意的问题，如仿真步长的选择和软开关条件的检测。适合人群：从事电力电子设计的研究人员和技术工程师。使用场景及目标：适用于需要设计高效、稳定电力转换系统的场合，特别是在输入电压范围较广的应用中，如光伏逆变器。目标是通过合理的控制策略实现更高的效率和平滑的工作状态。阅读建议：读者应重点关注PFM和PSM模式的具体实现细节，尤其是两者之间的平滑切换逻辑，同时也要注意仿真工具的选择和参数调整技巧。

【移动应用开发】VIP学习资源整合：涵盖Android、iOS、React Native及Flutter的开发工具、资源与社区: 内容概要：本文汇总了移动应用开发领域的VIP学习资源，涵盖从基础入门到进阶提高的全方位内容。基础资源方面，推荐了针对Android、iOS、React Native的多本经典书籍及Udemy、Coursera、edX等平台上的在线课程和YouTube视频教程，帮助初学者掌握UI设计、数据存储、前后端交互等基本技能。进阶资源则聚焦于高效编程、性能优化、架构设计等深层次主题，同样提供了书籍、在线课程和视频教程。对于跨平台开发，重点介绍了React Native和Flutter的相关学习资料。此外，还列举了Android Studio、Xcode等常用开发工具及其配套调试工具，以及Flutter Gallery、React Native Showcase等开源项目作为实践参考。最后，提及了Stack Overflow、Reddit - AndroidDev等社区论坛，为开发者提供交流平台。适合人群：对移动应用开发感兴趣的初学者、有一定经验的研发人员及希望深入了解跨平台开发的开发者。使用场景及目标：①初学者可以通过书籍、在线课程和视频教程系统学习移动应用开发的基础知识；②进阶者可利用进阶资源深入研究特定技术领域，如性能优化、架构设计等；③跨平台开发者可以借助React Native和Flutter的学习资料实现多平台应用开发；④使用推荐的开发工具和调试工具提高开发效率，解决实际问题；⑤通过开源项目和社区论坛获取实践经验和技术支持。阅读建议：根据个人技术水平选择合适的资源进行学习，注重理论与实践相结合，积极参与社区交流，不断提升自己的移动应用开发能力。

【深度学习框架】Caffe与Python接口的使用指南：从安装到模型部署的全流程解析: 内容概要：本文详细介绍了深度学习框架Caffe及其Python接口的使用方法。首先概述了Caffe的特点，如速度快、支持多种神经网络类型（CNN、RNN、LSTM），并提供预训练模型库。接着阐述了Caffe的安装步骤，包括系统要求、依赖库安装、源码编译及Python接口的配置。随后，文章通过多个示例展示了如何使用Python接口加载模型、预处理数据、执行前向传播和进行预测。此外，还介绍了模型训练流程，包括配置训练参数、使用Python接口训练模型、动态调整超参数等。最后，讨论了模型部署与应用，涵盖模型定义、训练、转换、加载、预测及性能评估等方面，并提供了常见问题的解决方案。; 适合人群：对深度学习有一定了解并希望使用Caffe框架进行模型开发的研究人员和工程师。; 使用场景及目标：①掌握Caffe框架的安装配置；②学会使用Python接口加载模型、预处理数据、执行前向传播；③理解模型训练流程，包括配置训练参数和动态调整超参数；④熟悉模型部署与应用，如模型定义、训练、转换、加载、预测及性能评估。; 阅读建议：由于Caffe的Python接口涉及较多的技术细节，建议读者在阅读时结合实际操作练习，逐步掌握每个步骤的具体实现方法。同时，可以参考官方文档和社区资源，加深对Caffe的理解和应用。

基于西门子200PLC与组态王6.53的锅炉内胆温度控制系统设计与实现: 内容概要：本文详细介绍了使用西门子200PLC和组态王6.53实现锅炉内胆温度控制系统的全过程。首先，通过PLC采集温度数据并进行控制逻辑编程，确保温度保持在设定范围内。其次，组态王用于创建可视化界面，使用户能够实时监控和调整温度参数。文中还展示了具体的梯形图编程实例，如温度采集、控制逻辑、PID调节等，并讨论了常见的调试技巧和注意事项。此外，提供了运行效果视频，直观展示了系统的实际性能。适合人群：从事工业自动化领域的工程师和技术人员，特别是熟悉PLC编程和HMI软件使用的专业人士。使用场景及目标：适用于需要精确控制温度的工业应用场景，如化工、制药等行业。主要目标是提高温度控制的精度和稳定性，减少能源消耗，提升生产效率。其他说明：文中提到的一些具体技术和参数（如PID参数、定时器设置等）可以根据实际情况进行调整优化。同时，强调了硬件配置和接地处理的重要性，以确保系统的可靠性和抗干扰能力。

微纳光学中COMSOL仿真：铌酸锂和频转换与磁偶极子准BIC反射相位计算: 内容概要：本文详细介绍了COMSOL在微纳光学领域的应用，重点探讨了两个方面：一是基于X切型绝缘体上铌酸锂薄膜（LNOI）进行和频产生（SFG）转化效率的仿真，二是磁偶极子贡献下的准BIC斜入射反射相位计算。文中不仅解释了相关理论背景，还展示了具体的参数设置方法和仿真步骤，如自定义入射基频波长、光强、偏振方向等，并通过实例演示了如何在COMSOL中实现这些仿真的具体操作。此外，文章还讨论了不同参数对SFG转化效率和反射相位的影响，强调了材料性质、入射角度、光强等因素的关键作用。适合人群：从事微纳光学研究的科研人员和技术开发者，尤其是那些希望深入了解COMSOL仿真技术及其在非线性光学和准BIC现象中应用的人群。使用场景及目标：①帮助研究人员更好地理解和优化LNOI材料中的SFG转化效率；②辅助设计高性能的微纳光学器件，如高Q值谐振腔、高效反射镜或滤波器等；③为探索新的光学现象提供理论支持和技术手段。其他说明：文章提供了详细的仿真代码示例和避坑指南，便于读者快速上手并避免常见错误。同时，作者鼓励读者通过参数化扫描等方式挖掘更多潜在的新物理现象。

2025 STM32单片机YT2号-任务2-键控LED【嵌入式系统】基于STM32单片机的按键控制LED设计：洋桃2号开发板任务实现与代码解析: 内容概要：本文档详细介绍了使用STM32CubeIDE开发环境在洋桃2号开发板上实现按键控制LED的功能。首先，指导用户解压并打开任务2的工程文件，然后进行GPIO参数配置，包括4个按键和4个LED的设置。接下来，通过建立BSP文件夹及其内部的C和H文件来组织代码结构，提供了延迟、LED控制以及按键检测的具体代码实现。每个LED都有独立的控制函数，可以单独点亮或熄灭，并支持整体操作。按键检测函数能够识别按键按下事件并返回相应的状态值，同时处理了按键抖动的问题。最后，文档还简述了编译、运行和调试代码的基本步骤。适合人群：具有初步单片机编程基础的学生或工程师，特别是对STM32系列微控制器有一定了解的人士。使用场景及目标：①学习STM32CubeIDE开发环境的使用方法；②掌握GPIO端口配置及基本外设控制；③理解按键去抖动机制和LED驱动程序的设计与实现；④熟悉嵌入式系统的开发流程，包括代码编写、编译、下载和调试。阅读建议：此文档适用于实际动手操作，读者应按照文档步骤逐步进行实验，同时参考提供的代码示例，以便更好地理解和掌握相关知识点。在遇到问题时，可以通过查阅官方文档或在线资源来解决问题。

基于uni-app开发的菜谱小程序新版源码.zip: 《基于 uni-app 开发的菜谱小程序新版源码》简介这是一份极具实用价值的学习资源——基于 uni-app 开发的菜谱小程序新版源码。uni-app 凭借其多端适配的强大特性，一次开发就能在多个平台运行，极大地提升了开发效率与应用覆盖范围。此菜谱小程序源码功能丰富。它拥有精美且简洁直观的界面设计，方便用户快速上手操作。在内容呈现上，涵盖了海量的菜谱资源，无论是家常小菜、地方特色菜肴，还是异国料理，都能在其中找到详细的做法教程，步骤清晰，图文并茂，甚至部分还搭配了视频讲解，让烹饪新手也能轻松学会。对于开发者而言，这份源码是学习 uni-app 开发的绝佳范例。可以深入研究其代码架构、页面布局、数据交互以及各种功能的实现逻辑，从中汲取经验，提升自己在跨平台移动应用开发方面的能力，更好地理解 uni-app 框架的优势与应用场景，为后续的开发项目奠定坚实的基础，助力开发出更多优质且高效的应用程序。

电动汽车永磁同步电机设计：基于Prius 2004的Excel计算、Maxwell仿真与MotorCAD温升分析: 内容概要：本文深入探讨了丰田Prius 2004永磁同步电机的设计过程，涵盖了从Excel设计程序到Maxwell参数化仿真的各个环节。首先介绍了利用Excel进行初步设计计算的方法，通过设定关键参数如功率、转矩等，计算出电机的体积、叠厚、匝数等重要设计指标。接着讨论了Maxwell参数化仿真模型的应用，展示了如何通过调整参数并运行仿真，直观地观察磁场分布和转矩波动等结果。此外，文章还提到了橡树岭实验室提供的拆解和实测数据，强调了这些一手资料对于验证设计和仿真的重要性。最后，介绍了MotorCAD模型在温升仿真分析中的应用，解释了如何设置热学参数并预测温度分布，确保电机的稳定性和可靠性。适合人群：从事电动汽车电机设计的研究人员和技术人员，以及对电机设计感兴趣的工程专业学生。使用场景及目标：适用于需要深入了解永磁同步电机设计原理和方法的人群，旨在提供从理论到实践的全面指导，帮助读者掌握电机设计的关键技术和工具。其他说明：文章不仅提供了详细的理论讲解，还附带了大量的实例和代码片段，便于读者理解和实践。同时，文中提到的多种工具和方法可以相互结合，形成一套完整的电机设计流程。

(源码)基于C语言的TCPIP网络编程.zip: # 基于C语言的TCPIP网络编程 ## 项目简介本项目是一个基于C语言的TCPIP网络编程学习项目，涵盖了从基础的套接字编程到高级的多线程服务器设计。项目内容包括TCP和UDP协议的使用、多线程编程、IO复用、信号量和互斥量的应用等。通过这些内容的学习和实践，开发者可以深入理解网络编程的核心概念和技术。 ## 项目的主要特性和功能 1. TCPIP编程创建TCP服务器和客户端，实现基本的网络通信。使用套接字进行数据的发送和接收。处理TCP连接的建立、数据传输和断开。 2. 多线程编程使用pthread库创建和管理线程。在多线程环境中处理共享资源，如全局变量和文件描述符。通过信号量和互斥量实现线程同步，确保对共享资源的正确访问。 3. IO复用使用select()和epoll实现IO复用，提高服务器的并发处理能力。处理多个客户端的并发连接和数据传输。

财务分析的哈佛框架.ppt: 财务分析的哈佛框架

电磁学领域中Comsol/CST模拟狄拉克半金属BDS超材料的Matlab脚本与模型应用: 内容概要：本文详细介绍了使用Comsol和CST软件模拟狄拉克半金属BDS超材料的方法和技术细节。文中不仅解释了这两种软件在处理电磁、热等多物理场耦合方面的优势，还提供了具体的Matlab脚本用于超材料的数据预处理和后处理，如计算波数、模拟散射图案等。此外，文章分享了多个CST模型实例，包括简单单元结构模型和周期阵列模型，展示了如何通过调整材料参数和结构设计来优化超材料的电磁响应特性。同时，针对BDS超材料在太赫兹波段的独特电磁响应，提出了若干实用的设计和仿真技巧，如交叉偏振设计、时域求解器设置以及边缘场校正等。适合人群：从事电磁学、材料科学领域的研究人员和技术人员，尤其是对超材料设计感兴趣的科学家。使用场景及目标：适用于需要深入理解和掌握超材料电磁响应特性的科研项目，旨在提高超材料设计效率和精度，探索新的电磁调控方法。其他说明：文章提供的Matlab脚本和CST模型能够帮助读者更好地理解和应用狄拉克半金属BDS超材料的相关理论和技术，促进学术交流和技术进步。

电力调度领域基于非合作博弈的居民负荷分层调度模型及其实现方法: 内容概要：本文探讨了基于非合作博弈的居民负荷分层调度模型，旨在解决电力领域中居民用户柔性负荷资源的有效参与需求响应的问题。文中介绍了模型的构建思路，包括日前投标环节和实时调度环节的具体实现方式。日前投标环节通过非合作博弈思想构建以聚合商利润最大化为目标的博弈模型，并证明纳什均衡解的存在性。实时调度环节则以分类柔性负荷各自的用电物理特性为约束条件，以实时调度和日前投标量之间的偏差最小为目标函数。此外，还采用了双层鲸鱼算法来求解整个模型，确保在不影响用户舒适度的前提下提高聚合商的利润。仿真结果显示，该模型能够在提升电网稳定性的同时，兼顾用户舒适度和聚合商利润。适用人群：适用于对电力调度、博弈论以及优化算法感兴趣的科研人员和技术开发者。使用场景及目标：该模型主要用于电力系统的优化调度，特别是在需求响应管理中，帮助电网公司、负荷聚合商和居民用户实现三方共赢。具体应用场景包括电力市场竞价、居民用电负荷调控等。其他说明：文章不仅提供了详细的理论背景介绍，还包括了具体的代码实现示例，有助于读者深入理解和实际应用。

11种水果注释图像数据集: 数据说明：该数据集包含有用的11种水果的限界框注释。含有8624张相关图像。7种水果，如苹果、鳄梨、辣椒、芒果、橙子、西瓜和草莓是从之前的研究中获得的。现在已经更新了限界框的格式，纠正了人为的注释错误，更重要的是，采用了云服务，可以方便地共享和协作注释。该数据集中有3个新的注释，分别是蓝莓、樱桃和猕猴桃，进行了高精度注释。

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Spark源码分析13-Tuning Spark

评论

发表评论

相关推荐

concurrent- LinkedBlockingQueue

flume源码分析-Sink

flume源码分析-SinkProcessor

flume源码分析-ChannelSelector

Spark源码分析12-yarn部署

Spark源码分析11-BlockManager

Spark源码分析10-Schedualer

Spark源码分析9-Excutor

Spark源码分析8-client 如何选择将task提交给那个excutor

Spark源码分析7-Metrics的分析

Spark源码分析6-Worker

Spark源码分析5-Master

Spark源码分析4-RDD computor

Spark源码分析3-The connect between driver,master and excutor

Spark源码分析2-Driver generate jobs and launch task

Spark源码分析1-部署与整体架构

Dubbo源代碼分析-configuration

最近访客更多访客>>