`
totoxian
  • 浏览: 1074711 次
  • 性别: Icon_minigender_2
  • 来自: 西安
文章分类
社区版块
存档分类
最新评论

基于SEO的Log 日志分析软件应该提供那些功能?

阅读更多
基于SEO的Log 日志分析软件应该提供那些功能?



今天是连续第3个要过了12点才睡的日子了,希望今天可以告一个段落.

最近在考虑如何做基于 SEO 的日志分析工具, 每天都熬夜, 还真吃不消啊.


当用户在浏览器地址栏输入一个网址的时候,web服务器在返回用户需要页面的同时也记录用户的其他数据,比如用户的浏览器是什么牌子的,用户使用的IP地址,操作系统甚至记录了用户是输入的网址还是从其他链接跳转过来的等等。(好罗嗦)这部分记录无疑是最基础也是最重要的数据,很多web数据挖掘工作都是从这里作为起点进行的。

看过web服务器(比如apache , iis )日志的朋友们都知道,当用户访问一个页面产生的日志并不是只有一行,而是有很多行。稍加注意就会发现,web服务器为当前访问页面中包含的每个文件(图片、javascript脚本等)都生成了一行记录。这一行行的记录就组成了原始日志文件。

对SEO工作来说,分析日志是一项必不可少的基本功。与SEO最相关的信息莫过于搜索引擎的来访记录和从搜索引擎带来的流量2个指标。目前国内网站用户使用的web log 日志分析工具大多使用 awstats 一类的开源工具。可以说awstats的流行,与日志分析爱好者的引荐是有很大关系的比如车东等人。

虽然我也使用awstats等工具,但毫无疑问现在市场上专门针对seo的log日志分析工具还很少见。同时由于awstats采用perl编写,加上使用awstats自有的文件格式,这就导致了在awstats的基础上加以修改提供基于seo的日志分析功能也非容易之事。

那么基于SEO的日志分析应该提供那些功能呢,这就是我这几天想的问题.

目前已经实现了以下三个部分:

1.从原始日志文件中提取 页面访问 的记录 .(去掉 .js , .css , .jpg 等记录)见:"原始Log -> 页面 Log "

2.针对提取出的 页面访问记录 进行派重 (bloom filter), 提取唯一的访问记录.见:"页面Log -> sitemap "

3.针对提取出的 页面访问记录 ,提取从 google 和 baidu 过来的搜索关键词 记录.
见:"页面Log-> 搜索关键字分析"

准备提供的功能:
通用功能: 除去没有意义的请求(如JPG,GIF等), 分析真实的访问请求
多日日志: 蜘蛛的图表
单日日志: 蜘蛛的来访数字, 蜘蛛的来访时间段(这个很重要,可以判定搜索引擎更新频率)



alpha 下载地址





基于SEO的日志分析


分享到:
评论

相关推荐

    iis日志分析源码

    本项目是一个基于WinForm的IIS日志分析工具,旨在帮助用户快速统计和理解这些日志数据。 首先,这个程序的核心功能是对IIS日志进行解析。IIS日志通常遵循一种标准格式,称为W3C扩展日志格式,它包含多个字段,如...

    网站日志分析工具 爬虫分析

    网站日志分析是IT行业中一项重要的任务,尤其对于网站管理员和SEO专家来说,它能提供宝贵的洞察力。本文将深入探讨“网站日志分析工具”和“爬虫分析”,并结合标签“log”、“bot”、“IIS”、“w3svc”以及...

    iis.rar_日志分析

    除了ASP版本的分析工具,还有许多第三方软件和在线服务,如LogParser、WebLog Expert等,它们提供了更强大的功能和更友好的界面,适用于大规模或复杂环境的日志分析。 六、注意事项 在进行日志分析时,应尊重用户...

    M-LOG 博客系统 v1.3

    M-LOG是一个遵循Apache License Version 2.0协议的开源软件。 M-LOG是一个用Java搭建的博客程序。该程序使用JDK1.5+、Spring MVC、Hibernate、Freemarker、Lucene搭建。 应用功能: 支持mateweblog离线写作协议 支持...

    基于logs2intrusions与Web Log Explorer的综合取证分析研究

    Web Log Explorer则是一个更全面的日志分析软件,除了基本的日志分析功能外,还提供了数据挖掘、日志归档、生成报告等高级功能。光年SEO日志分析系统和逆火网站分析器则更多地被用于网站优化和流量分析,帮助网站...

    基于ASP的搜索引擎蜘蛛访问日志查看器.zip

    【标题】:“基于ASP的搜索引擎蜘蛛访问日志查看器”是指一个使用Active Server Pages (ASP)技术开发的工具,主要用于分析和查看搜索引擎爬虫(也称为蜘蛛或机器人)对网站的访问记录。ASP是一种服务器端脚本语言,...

    基于PHP的博客系统 Simple-Log.zip

    7. **SEO优化**:为了提高搜索引擎可见性,系统可能包含了URL重写功能,使URL更友好且易于理解。 8. **错误处理与日志记录**:PHP提供了错误报告和异常处理机制,保证了系统的稳定运行。同时,日志记录可以帮助...

    Bo-Blog dblog

    "Bo-Blog dblog"是一个基于PHP开发的个人博客系统,专为喜欢写作和技术分享的用户提供了一个简单易用、功能齐全的平台。这个系统的核心特点在于其轻量级设计和良好的可扩展性,使得用户可以快速搭建自己的博客站点,...

    WebTrendsLogAnalyzer

    WebTrendsLogAnalyzer是一款专为网站分析而设计的工具,主要功能是对Web服务器的日志文件进行深入解析,以便提供有关网站访问者行为、流量来源、搜索引擎优化效果等关键信息的详细报告。这款软件在IT行业内被广泛...

    藏经阁-沪江基于Node.js大规模应用实践.pdf

    Aconite是一个基于Koa的MVC框架,提供了一个灵活的架构模式,支持同构渲染、路由机制、日志记录、权限控制等功能。Aconite的架构模式包括Controller、Model、View、Middleware、Auth、Log、Render、Router、Proxy等...

    linux的Apache用户认证、域名跳转、Apache访问日志介绍1

    分析这些日志数据可以帮助管理员监控网站性能、识别攻击行为、优化SEO策略,甚至可以用于故障排查和安全审计。常见的日志分析工具有Awstats、Webalizer和Logwatch。 总结来说,Linux上的Apache服务器通过用户认证、...

    ASP实例开发源码—58天搜索引擎蜘蛛爬行访问记录日志插件 asp版.zip

    在实际的ASP编程中,要实现这样的功能,开发者通常会利用IIS(Internet Information Services)服务器提供的日志功能。IIS会自动记录所有HTTP请求,包括搜索引擎蜘蛛的访问。开发者可以通过解析这些日志文件(通常是...

    基于nginx access日志格式详解

    Nginx提供了自定义日志格式的功能,允许管理员根据需求调整日志内容。本文将详细解析Nginx Access日志的格式,帮助你更好地理解和利用这些日志数据。 首先,我们要了解`log_format`指令。在Nginx的配置文件`nginx....

    基于PHP的企业官网系统.zip

    8. **错误日志和调试**:通过PHP的error_reporting和error_log设置,收集并分析运行时错误,便于问题定位和修复。 9. **缓存技术**:使用如APC、Memcached或Redis等缓存技术,提高网站性能,降低数据库压力。 10. ...

    基于java的酒商城.zip

    - **日志收集**: 通过Log4j或ELK栈收集系统日志,便于问题排查。 - **数据分析**: 利用数据挖掘技术分析用户行为,为运营决策提供依据。 综上所述,基于Java的酒商城系统是一个集成了前端展示、后端处理、数据库...

    大型网站用户行为记录的一个实现--基于clickStream(第二部分)

    【标题】:“大型网站用户行为记录的一个实现--基于clickStream(第二部分)” 在这个主题中,我们将深入探讨如何在大型网站环境中实现用户行为记录,特别是利用clickStream技术。clickStream是指用户在网站上的点击...

    n@log analyzer v5.0.4

    总结起来,n@log analyzer v5.0.4凭借其强大的统计分析功能、多语言支持和灵活的PHP源码,成为了一款高效且实用的网站数据分析工具。无论你是要提升网站性能,还是需要深入理解用户行为,这款软件都能提供有力的支持...

    PHP实例开发源码—Mylog逍遥坊 博客日志系统.zip

    6. 错误处理与日志记录:为了追踪和解决可能出现的问题,系统可能有错误处理机制和日志记录功能。PHP的`error_reporting()`和`error_log()`函数可用于此目的。 7. 模板引擎:为了提高代码的复用性和分离业务逻辑与...

Global site tag (gtag.js) - Google Analytics