有许多的办法查询Vertica数据库所占的硬盘空间.
Vertica有两种测量方式,分别是原始数据和压缩数据。你需要知道哪种类型是你需要的。
比如Vertica的许可是基于原始数据的。
1,查询Schema为test的压缩数据大小和原始数据大小。
SELECT /*+(estimated_raw_size)*/
pj.anchor_table_schema,
pj.used_compressed_gb,
pj.used_compressed_gb * la.ratio AS raw_estimate_gb
FROM (SELECT ps.anchor_table_schema,
SUM(used_bytes) / ( 1024^3 ) AS used_compressed_gb
FROM v_catalog.projections p
JOIN v_monitor.projection_storage ps
ON ps.projection_id = p.projection_id
WHERE p.is_super_projection = 't' and anchor_table_schema = 'test'
GROUP BY ps.anchor_table_schema) pj
CROSS JOIN (SELECT (SELECT database_size_bytes
FROM v_catalog.license_audits
ORDER BY audit_start_timestamp DESC
LIMIT 1) / (SELECT SUM(used_bytes)
FROM V_MONITOR.projection_storage) AS ratio) la
ORDER BY pj.used_compressed_gb DESC;
2,查询许可证的信息:
SELECT GET_COMPLIANCE_STATUS();
3,查询每个表的压缩大小, schema为test的,去掉红色则为整个数据库的
SELECT /*+(compressed_table_size)*/
anchor_table_schema,
anchor_table_name,
SUM(used_bytes) / ( 1024^3 ) AS used_compressed_gb
FROM v_monitor.projection_storage
Where anchor_table_schema = 'test'
GROUP BY anchor_table_schema,
anchor_table_name
ORDER BY SUM(used_bytes) DESC;
参考链接:
http://dba.stackexchange.com/questions/65114/how-do-i-get-the-size-of-a-vertica-database
相关推荐
以上概述了Vertica数据库架构的核心知识点,从列式存储的优势、数据压缩和编码机制、查询处理、以及如何在实际数据上应用这些技术等多个方面进行了探讨。Vertica的设计使得它非常适合于数据仓库、大数据分析和商业...
Vertica的运行对硬件的要求包括至少4个核心的CPU,每个核心至少需要8GB的内存,单核磁盘I/O速度为20-40MB/s。这些配置保证了Vertica在处理复杂查询和大数据集时的高性能。 Vertica最初是于2005年由Vertica Systems...
数据库大小受限于硬盘配置,表的大小由每个节点的2^64行或每列的2^33字节决定。单行的大小不能超过2^31-1字节。此外,每个数据库中的表/投影数量、每个函数调用的参数数量、每次加载的最大行数等都有明确的上限。 ...
在集群环境中,VERTICA的Shared Nothing架构允许数据分布到多个节点,每个节点只负责一部分数据,这样可以实现大规模并行处理,适合大数据量的实时分析。 VERTICA还提供了高可用性,通过分布式集群来确保系统的稳定...
安装Vertica是一个严谨的过程,需要仔细遵循每个步骤来保证最终的数据库集群可以稳定高效地运行。由于Vertica是面向大数据的解决方案,因此在安装和配置上也有着对大数据环境的独特要求和优化。
3. **Shared Nothing架构**:VERTICA基于Shared Nothing架构,这意味着每个节点都拥有自己的内存和磁盘资源,节点间无共享资源,增强了系统的可扩展性和容错性。 4. **分布式集群**:VERTICA支持集群部署,能够通过...
- **Shared-nothing架构**:采用最易于扩展的架构形式,每个节点都拥有独立的操作系统、数据库和硬件资源,节点间通过网络通信。 - **基于gNet Software Interconnect的内部通信**:通过一种类似于超级计算机中的...
Greenplum是一款基于Hadoop的分布式数据库,其核心特点是Shared-nothing架构,每个节点独立拥有操作系统、数据库和硬件资源,通过网络进行通信。Greenplum的架构由Master Servers和Segment Servers构成,Master主要...
每种分析型数据库都有其独特的技术特点和适用场景,例如Sybase IQ的列存储和高并发处理能力适合于传统数据仓库应用,而HANA的内存计算和实时分析则适用于需要快速响应的应用场景。 在数据处理架构方面,随着大数据...
- **Shared-nothing架构**:每个节点独立拥有操作系统、数据库和硬件资源,易于扩展。 - **并行加载技术**:利用数据流引擎实现数据并行加载,加载速率可达4.5TB/小时,并支持SQL对外部表的操作。 - **行/列压缩存储...
* 共享无架构(Shared-nothing Architecture),每个节点都有自己的操作系统、数据库和硬件资源,节点之间通过网络来通信。 * 高扩展性,支持扩展到1000个以上节点。 * 并行加载技术,数据加载完全并行,加载数据可...
Greenplum是一款基于Hadoop的分布式数据库,其共享无状态架构使得每个节点都能独立处理数据,减轻了中心节点的压力。Master Server负责SQL解析、执行计划制定和结果收集,而Segment Server则承担实际的数据存储和...
* Shared-nothing 架构:每个节点都有自己的操作系统、数据库、硬件资源,节点之间通过网络来通信。 * 基于 gNet Software Interconnect:数据库的内部通信通过基于超级计算的“软件 Switch”内部连接层,基于通用的...
Greenplum基于Hadoop,其核心特点是Shared-nothing架构,意味着每个节点都拥有独立的操作系统、数据库实例和硬件资源,节点间通过网络进行通信。Master服务器负责客户端连接、SQL解析、执行计划生成以及向Segment...
- **Shared-nothing 架构**:每个节点拥有独立的硬件资源,通过网络通信,易于扩展。 - **gNet Software Interconnect**:高速通信层,支持大规模节点扩展。 - **并行加载技术**:高效的数据加载速度,支持行和列...
1. Oracle RAC:Oracle Real Application Clusters,是一种集群数据库技术,允许多个实例共享物理磁盘上的数据库,以提高可用性和性能。 2. MySQL Cluster:MySQL的分布式事务处理系统,使用数据分区和冗余来实现高...
例如,一个典型的数据仓库查询可能是要求“统计每个广告平台的记录数量”,此时只需要读取包含“广告平台ID”的那一列。如果列式数据库只需要读取100列中的5列,那么I/O消耗可减少20倍,大大提高了查询效率。 数据...