0 0

大文件的快速分析5

    大家好,最近需要对线上的nginx的访问情况进行分析,也就是access.log文件进行分析,日志的增长大约是3M/10s,这样每个小时的数据量差不多是1G,需要对access.log文件进行一些分析统计。
   我的实现思路是在linux下面crontab中配置一个时间的调度,然后用shell脚本来抽取每半分钟的文件部分进行分析,这样做会存在一个问题,随着文件的不断增加,sed获取从指定行开始的文件内容开始变慢,我想有没有别的方法可以快速的获取文件的新增部分内容,用java的RandomAccessFile操作的话会不会锁死文件造成access.log无法访问,请叫各位大牛有没有遇到类似的情况的?请求一下解决问题的方案。
2012年11月15日 19:57

3个答案 按时间排序 按投票排序

0 0

写shell脚本,用awk 统计和分析,crontab 定时处理,每读一次log就记录一下行数并存到另一个文档里头,下次读的时候先去取行数,然后从这个行数再读。我们之前项目做数据分析是这样搞的。

2012年11月16日 10:22
0 0

直接写2份?一份用来写一份用来分析?分析的那一份一小时一个文件?

2012年11月16日 09:37
0 0

mapreduce

2012年11月16日 02:29

相关推荐

    超大文件快速打开(csv TXT等文件均可)

    标题 "超大文件快速打开(csv TXT等文件均可)" 描述了如何高效处理和查看超过2GB的大文件,特别是csv和txt格式的文本文件。这些文件类型在数据分析、日志记录、数据交换等方面非常常见,但随着数据量的增长,传统...

    logview大文件查看利器,非常快速查看大文件

    在分析大文件时,时间线视图是LogView的另一项实用功能。它允许用户按时间顺序查看事件,帮助识别出问题发生的时间点,便于回溯和追踪问题的起源。配合其强大的日志分析功能,如统计、排序和聚合,LogView能帮助用户...

    map文件分析工具map文件分析工具

    - **符号查找**:快速定位到特定函数或变量在Map文件中的位置。 - **大小分析**:统计各部分的大小,如代码、数据、未初始化数据等。 - **内存分布图**:可视化地展示内存分配,便于理解和分析。 - **比较分析**:...

    SpaceSniffer v1.1.2.0@文件大小分析.rar

    2. **可视化界面**:软件以网格布局显示文件系统,较大的文件或文件夹用较大的方块表示,而较小的文件则用小方块表示。这种视觉化方式使用户能快速定位占用空间大的对象。 3. **深度递归**:SpaceSniffer能够深入到...

    快速删除大文件的软件

    例如,它们可能支持批量复制、断点续传,甚至提供智能分析和筛选功能,帮助用户快速选择和操作多个大文件。这样的设计使得用户在进行文件转移或者备份时也能提高效率。 除了基本的删除和复制功能,一些高级的快速...

    内存映射文件实现大数据量快速存储

    内存映射文件(Memory-Mapped File)是一种在操作系统层面实现高效大数据处理的技术,它允许将文件的内容直接映射到进程的虚拟内存空间中,使得应用程序可以像操作普通内存一样读写文件,从而实现快速的数据存取。...

    FileAnalysis文件分析软件

    总结来说,FileAnalysis文件分析软件凭借其快速准确的文件类型识别和MD5码计算,为用户提供了便捷的文件管理手段,尤其是在信息安全和大数据处理等领域,其作用不容忽视。了解并掌握这款工具的使用,无疑将提升我们...

    文件分析工具besnew.rar

    在文件分析方面,Besnew能够详细列出每个文件的大小、创建时间、修改时间等基本信息,帮助用户快速查找和定位大文件,从而进行清理或归档。此外,它还支持按类型、日期、大小等多种条件进行排序和筛选,以便用户更...

    windows文件分析器

    Windows文件分析器如WizTree,能够快速扫描并显示硬盘上所有文件和文件夹的大小信息,帮助用户找出占用空间最多的文件和文件夹。WizTree这类工具通常具有以下功能: 1. **快速扫描**:与Windows内置的资源管理器...

    文件分析工具.rar

    《文件分析工具——高效管理与查找的利器》 在日常工作中,我们经常需要处理大量的文件,尤其是在项目开发、数据管理或是文件整理时,快速定位到特定的文件变得尤为重要。这时,一款高效的文件分析工具就显得至关...

    Mp4视频文件格式分析工具

    mp4info是一款轻量级的命令行工具,它能够快速地提供MP4文件的详细信息。通过运行mp4info命令,用户可以获取到文件的总体信息,包括视频流、音频流、时间码、以及各种元数据等。它可以帮助我们识别视频的编码类型、...

    csv大文件打开器

    “csv大文件打开器”是一种专门设计用于处理大型CSV文件的工具,它可以快速、高效地浏览和分析大量数据,而不会使系统资源耗尽。这些工具通常具有以下特性: 1. **流式读取**:不将整个文件加载到内存中,而是逐行...

    PE文件分析器

    总之,"PE文件分析器"是一个强大的工具,它揭示了PE文件的内在工作原理,对软件开发、调试、逆向工程和安全分析具有极大的价值。通过深入学习和使用这款工具,用户可以提升自己在Windows系统层面的编程和分析能力。

    打开大文件TXT文件工具

    3. **搜索功能**: 针对大文件的搜索功能是必不可少的,这个工具可能支持全文搜索,并且能快速定位到特定关键字,这对于数据查找和分析非常有用。 4. **标记与书签**: 对于需要多次回溯查阅的文本,标记和书签功能能...

    大文件分析和重复文件杀手V1.2.3

    它专注于帮助用户有效地管理和优化磁盘空间,通过智能分析,快速定位并处理那些占用空间的大文件和冗余的重复文件。 大文件分析是这款工具的核心功能之一。用户可以指定一个或多个文件夹,程序会深度扫描其中的文件...

    多平台恶意文件行为分析技巧.pdf

    多平台恶意文件行为分析技巧主要关注在不同操作系统环境下恶意软件的行为特征及其分析方法。...安全人员通过搭建合适的分析环境,利用各种监控和分析工具,可以快速定位恶意软件的恶意行为,并采取相应措施进行处理。

    logView windows查看大日志文件工具(数G的文件都可以快速打开,并支持设置编码和检索)

    `logView`是一款专为Windows平台打造的日志查看软件,其核心特性在于能够快速打开和浏览大容量的日志文件,无论是几百MB还是数GB,都能在短时间内加载完成,极大地提升了工作效率。这得益于其优化的文件读取机制,...

    UltraFileSplitter 大文件切割工具

    2. 超大日志文件处理:针对日志文件的特殊性,UltraFileSplitter提供了专门的处理模式,能快速、有效地分割那些记录了大量信息的日志文件,使分析和检索工作更加高效。 3. 自动合并:切割后的文件可以使用...

    快速文件搜索器 快速文件搜索器

    在建立索引的过程中,软件会智能地分析文件内容,以便进行全文搜索。一旦索引完成,用户只需输入关键词或短语,搜索器就能迅速从索引中筛选出匹配的文件。 搜索功能的效率是快速文件搜索器的关键。通常,它会支持...

    超大文件阅读器

    "超大文件阅读器"是一个专门设计用于高效浏览和分析大型数据文件的工具,它解决了传统文本编辑器无法处理超过其内存限制的大文件的问题。下面将详细阐述这种工具的重要性和功能。 一、大文件阅读器的核心功能 1. ...

Global site tag (gtag.js) - Google Analytics