flink 优化小技巧-1 - Hello World - ITeye博客

`

greemranqq

浏览: 980649 次
性别:
来自: 重庆

最近访客更多访客>>

wyj880303

northenwolf

地方疙瘩人

wuzijingaip

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

Carvendy许： 16/11/18 16:21:17 ERROR SparkDe ...
spark 笔记1 -- spark程序连接
谁说长得帅就不爷们：什么情况下会有 p!=t ?
源码分析-ConcurrentLinkedQueue
di1984HIT：
spring +ehcache 持久化数据，重启恢复
lc464297691：给个我实现的代码，需要自己写一个类继承之～ public ab ...
JAVA数据库连接池实现
lc464297691： 100%发生死锁！ if (isValid(conn)) ...
JAVA数据库连接池实现

flink 优化小技巧-1

博客分类：

flink

flink enableObjectReuse 优化

阅读更多

1. 今天源码调试的时候发现：

env.getConfig().enableObjectReuse()

2.参考: https://segmentfault.com/a/1190000019352598

解释： enableObjectReuse 是可以让对象进行浅拷贝(地址拷贝)，从而提速

关于深浅拷贝这里不做太多解释。

3.我们的场景：

3.1 source(表)->filter(过滤)>funcion(维表join)->sink(输出)

这种仅做过滤，或者数据添加的操作，不对原数据进行加工的，完全可以使用（2倍性能）

4.其他介绍

disableOperatorChainning() 不允许Chain 合并，调试的时候用

优化：尽量我们让chain 合并，减少shuffer 之类的，减少序列化开销，这个是常规操作

5.仅简单记录一下小知识点，为更好的性能努力

版本1.10.0

分享到：

线程池回收核心线程 -小知识 | jdbc 大数据量下载

2020-03-31 22:51
浏览 715
评论(0)
分类:互联网
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Flink原理、实战与性能优化-高级进阶培训（小白请勿下载）: Apache Flink是一个强大的开源流处理框架，其设计目标是处理无界和...总的来说，这个高级进阶培训课程旨在让学员全面了解Flink的核心原理，掌握其实际操作和优化技巧，从而能够设计和实施高性能、高可用的流处理系统。

史上最全最详细的flink 中文教程(一千多页pdf).pdf: Apache Flink 是一款开源流处理框架，用于处理和分析数据流。它具有高度的伸缩性、高性能和事件...通过阅读这些文档，开发者可以更加深入地理解 Flink 的架构和原理，更好地掌握使用 Flink 进行数据处理和分析的技巧。

Flink-Study:大数据一期-Flink原始码，资料，课件-源码资源: 5. 性能调优：提供Flink性能优化的策略和技巧，包括参数调整、任务调度等。四、Flink的应用场景 Flink不仅适用于实时流处理，还广泛应用于实时数据分析、复杂事件处理、机器学习等领域。例如，它可以实时计算网站...

FlinkExample.rar: 本篇将深入探讨"FlkinkExample.rar"中的源码，帮助读者更好地理解和掌握Flink的核心概念、API使用以及实际开发中的常见技巧。 1. **Flink基础知识** - **流处理与批处理**：Flink同时支持流处理和批处理，其核心...

大数据领域核心技术解析-spark flink hadoop kafka Hive、Flume、DataX、Redis等组件优化与实践应用: 本文档《大数据学习笔记》涵盖了Hive、Flume、DataX、Redis、Java锁、Spark、Flink、Hadoop以及Kafka等方面的知识点与实战技巧，尤其侧重于如何解决实际遇到的问题如Hive的小文件处理方法、Redis缓存策略的应用、...

05-大数据技术之面试题复习1.6.pdf: ### 1. Linux常用高级命令 - **命令详解**：掌握常用的Linux高级命令如grep、awk、sed等的使用方法及其应用场景。 - **实践操作**：通过具体案例展示如何在实际工作中使用这些命令来解决问题。 ### 2. HDFS读写流程...

2012年数据库技术大会演讲PPT打包: 1. 数据库管理系统（DBMS）基础： - 数据库的概念：数据的组织形式，用于存储、管理、检索和共享数据。 - DBMS的角色：提供数据存储、安全性、并发控制、恢复和查询处理等功能。 - 关系型数据库模型：如SQL，包括...

kafka-2.12-2.8.2: 3. 实时分析：结合流处理引擎（如Spark Streaming或Flink）进行实时数据分析。 4. 数据备份与迁移：Kafka可以作为数据源，用于数据备份或在不同系统间迁移数据。四、性能优化 1. 分区与副本策略：合理设置分区...

最新版linux kafka_2.12-2.6.1.tgz: ### 1. Kafka核心概念 - **生产者（Producer）**: 生产者是数据的来源，负责将消息发送到Kafka的Topic（主题）。 - **消费者（Consumer）**: 消费者从Topic订阅消息，进行处理或存储。 - **Topic（主题）**: ...

2023最新最强大数据面试题汇总: 这些只是面试中可能涉及的一小部分知识点，全面准备大数据面试还需要深入了解每个技术的原理、优化技巧以及实际应用案例。对于Spark、HBase和Flink、Kafka等其他组件，也有类似的深入理解和实践题目需要掌握。

【免费领取】阿里技术资料解密，100 本电子书找全了1: - 《零基础入门：从 0 到 1 学会 Apache Flink》：适合初学者入门流处理框架Flink。 - 《大数据工程师必读手册》：全面讲解大数据工程师所需的技术和实践经验。 - 《领军行业大数据及 AI 实战》：分享了行业领先...

Hadoop开发者必备文档: - Hadoop的优化技巧，包括数据块大小的选择、输入输出格式的优化等。 - Hadoop与其他数据存储系统的交互，如HBase、Cassandra等NoSQL数据库。 3. **Hadoop开发者第三期** 第三期教程可能进一步扩展到高级主题： ...

Hadoop权威指南第2版中文版: #### 七、高级特性与优化技巧 - **动态资源调整**：讲解如何根据任务负载动态调整资源分配。 - **性能调优**：提供一系列提高Hadoop性能的方法，如参数调整、硬件优化等。 - **容错机制**：讨论Hadoop中的故障检测...

分布式快速幂计算框架.pptx: 通过以上对分布式快速幂计算框架的知识点详细阐述，我们可以看出，构建一个高效的分布式计算框架不仅需要考虑如何有效地进行计算任务的分解与分配，还需要深入理解各种算法优化技巧和性能分析方法。这些技术和策略的...

字节跳动应届生大数据面试提，面试时长一小时: - **调优技巧**：通过调整 JVM 参数优化垃圾回收效率，如设置新生代大小、调整垃圾回收器类型等。 #### 数据库引擎详解 - **InnoDB 索引实现**：InnoDB 是 MySQL 默认的存储引擎，支持行级锁定和事务安全。 - **B+...

Pro Hadoop: - **性能优化**：提供优化Hadoop性能的策略和技巧，包括调优HDFS和MapReduce，以及管理集群资源。 - **安全性**：探讨Hadoop的安全性问题，包括数据加密、权限管理和身份验证等。 - **实时数据分析**：介绍如何利用...

MapReduce基础实战.pdf: #### 五、MapReduce优化技巧 - **数据倾斜处理**：通过预分区或自定义分区器等方式解决某些Reducer处理数据量过大的问题。 - **合并小文件**：将多个小文件合并成较大文件，以减少处理时间。 - **使用Combiner**：...

数据库笔记.zip: 这些数据库笔记将深入探讨数据库的基本概念、设计原则、操作技巧以及常见的数据库管理系统。以下是对这些笔记的详细解读： 1. **数据库基本概念**： - 数据库（Database）：是一个有组织、可搜索的数据集合，用于...

IT名企面试资料: - 数据库优化：查询优化、存储优化、索引优化。 6. 架构设计与分布式系统： - 微服务架构：服务发现、负载均衡、API Gateway等概念。 - 分布式一致性：CAP理论，Paxos、Raft共识算法。 - 分布式缓存：Redis、...

JAVA高级面试题包含Dubbo、JVM、Kafka等: 在Java高级面试中，Dubbo、JVM和Kafka是三个关键的技术领域，它们分别代表了服务治理、虚拟机性能优化以及分布式消息处理。以下是对这些主题的详细讲解。首先，JVM（Java Virtual Machine）是Java程序运行的基础，...

Global site tag (gtag.js) - Google Analytics