`
shuai1234
  • 浏览: 977736 次
  • 性别: Icon_minigender_1
  • 来自: 山西
社区版块
存档分类
最新评论

(转)利用clickstream跟踪用户(点击量)

    博客分类:
  • java
 
阅读更多
自己翻译的,不正确的地方大家别笑话,请帮着指出来啊,谢谢。Sleepy

项目主页:http://www.opensymphony.com/clickstream/
具体的例子可以看clickstream-1.0.2.war

Clickstream 概述

一个用来跟踪正在你的站点上访问的用户所到达位置细节的工具。它允许你跟踪访问你的站点的“点击流”或者“传输路径”。请访问JIRA的更新日志 来了解Clickstream最近的发展。

特性

" 当用户会话产生时,开始跟踪点击流。(通过一个监听器)
" 跟踪用户产生的每次点击信息。(通过一个过滤器)
" 当用户会话终止时,将完整的点击流记录到文件或者PrintStream中。
" 设法发现用户是不是机器人,并进行适当的过滤(目前可以检测252种机器人)

安装

clickstream-1.0.2.jar and commons-logging.jar放到[web应用程序根目录]/WEB-INF/lib里,把下面的代码加到[web应用程序根目录]/WEB-INF/web.xml里面:


 <filter>
<filter-name>clickstream</filter-name>
<filter-class>com.opensymphony.clickstream.ClickstreamFilter</filter-class>
</filter>
 
<filter-mapping>
<filter-name>clickstream</filter-name>
<url-pattern>*.jsp</url-pattern>
</filter-mapping>
 
<filter-mapping>
<filter-name>clickstream</filter-name>
<url-pattern>*.html</url-pattern>
</filter-mapping>
 
<listener>
<listener-class>com.opensymphony.clickstream.ClickstreamListener</listener-class>
</listener>
 


根据上面的配置,Clickstream会跟踪所有对jsp或者html文件的请求.无论什么时候,只要一个HttpSession失效了,对那个会话的完整点击流就会被记录。如果你想跟踪对其他类型的点击(例如.txt或者pdf文件),只需要添加更多的filter-mapping就可以了。

下面是一个完整的web.xml的例子

 <?xml version="1.0" encoding="ISO-8859-1" ?> 
<!DOCTYPE web-app (View Source for full doctype...)> 
<web-app>
<display-name>Opensymphony Clickstream Example</display-name> 
<filter>
<filter-name>clickstream</filter-name> 
<filter-class>com.opensymphony.clickstream.ClickstreamFilter</filter-class> 
</filter>
<filter-mapping>
<filter-name>clickstream</filter-name> 
<url-pattern>/*</url-pattern> 
</filter-mapping>
 
<listener>
<listener-class>com.opensymphony.clickstream.ClickstreamListener</listener-class>
</listener>
</web-app>


你可以利用clickstreams.jsp
 <%@ page import="java.util.*,
com.opensymphony.clickstream.Clickstream" %>
 
<%
Map clickstreams = (Map) application.getAttribute("clickstreams");
 
String showbots = "false";
if ("true".equalsIgnoreCase(request.getParameter("showbots")))
showbots = "true";
else if ("both".equalsIgnoreCase(request.getParameter("showbots")))
showbots = "both";
%>
<html>
<head>
<title>All Clickstreams</title>
</head>
 
<body>
<h1>All Clickstreams</h1>
 
<a href="?showbots=false">No Bots</a> |
<a href="?showbots=true">All Bots</a> |
<a href="?showbots=both">Both</a>
 
<p> 
<% if (clickstreams.isEmpty()) { %>
  No clickstreams in progress.
<% } else {
synchronized(clickstreams) {
Iterator it = clickstreams.keySet().iterator();
int count = 0;
while (it.hasNext())
{
String key = (String)it.next();
Clickstream stream = (Clickstream)clickstreams.get(key);
 
if (showbots.equals("false") && stream.isBot())
{
continue;
}
else if (showbots.equals("true") && !stream.isBot())
{
continue;
}
 
count++;
try {
%>
<%= count %>. <a href="viewstream.jsp?sid=<%= key %>"><b><%= (stream.getHostname() != null && 
!stream.getHostname().equals("") ? stream.getHostname() : "Stream") %></b></a> <font size="-1">[<%= stream.getStream().size() 
%> reqs]</font><br>
<%
}
catch (Exception e)
{
%>
An error occurred - <%= e %><br>
<%
}
}
}
}
%>
</p>
</body>
</html>
 

和viewstream.jsp来显示系统当前的Clickstream活动。
 <%@ page import="java.util.*,
com.opensymphony.clickstream.Clickstream,
com.opensymphony.clickstream.ClickstreamRequest" %>
 
<%
if (request.getParameter("sid") == null)
{
  response.sendRedirect("clickstreams.jsp");
  return;
}
 
Map clickstreams = (Map)application.getAttribute("clickstreams");
 
Clickstream stream = null;
 
if (clickstreams.get(request.getParameter("sid")) != null)
{
  stream = (Clickstream)clickstreams.get(request.getParameter("sid"));
}
 
if (stream == null)
{
  response.sendRedirect("clickstreams.jsp");
  return;
}
%>
 
<html>
<head>
<title>Clickstream for <%= stream.getHostname() %></title>
</head>
 
<body>
<div align="right"><a href="clickstreams.jsp">All streams</a></div>
 
<h1>Clickstream for <%= stream.getHostname() %></h1>
 
<b>Initial Referrer</b>: <a href="<%= stream.getInitialReferrer() %>"><%= stream.getInitialReferrer() %></a><br>
<b>Hostname</b>: <%= stream.getHostname() %><br>
<b>Session ID</b>: <%= request.getParameter("sid") %><br>
<b>Bot</b>: <%= stream.isBot() ? "Yes" : "No" %><br>
<b>Stream Start</b>: <%= stream.getStart() %><br>
<b>Last Request</b>: <%= stream.getLastRequest() %><br>
 
<% long streamLength = stream.getLastRequest().getTime() - stream.getStart().getTime(); %>
<b>Session Length</b>:
  <%= (streamLength > 3600000 ?
    " " + (streamLength / 3600000) + " hours" : "") +
  (streamLength > 60000 ?
    " " + ((streamLength / 60000) % 60) + " minutes" : "") +
  (streamLength > 1000 ?
    " " + ((streamLength / 1000) % 60) + " seconds" : "") %><br>
 
<b># of Requests</b>: <%= stream.getStream().size() %>
 
<p><b>Click stream</b>:</p>
 
<table border="0" cellpadding="2">
<%
synchronized(stream) {
Iterator clickstreamIt = stream.getStream().iterator();
 
int count = 0;
while (clickstreamIt.hasNext())
{
count++;
String click = ((ClickstreamRequest)clickstreamIt.next()).toString();
%>
<tr><td><%= count %>:</td><td><a href="http://<%= click %>"><%= click %></a></td></tr>
<%
}
}
%>
</table>
</body>
</html>
 


配置

日志功能是非常基本的(你可以与log4j集成)。如果你需要更多更高级的日志功能,那就需要实现com.opensymphony.clickstream.logger.ClickstreamLogger接口并且提供任何你所希望的持久化方法。

默认情况下,Clickstream使用com.opensymphony.clickstream.logger.SimpleClickstreamLogger这个类来处理日志。这个logger只能向Jakarta的Commons Logging工具发送一个INFO日志声明,Commons Logging可以依次通知多个日志provider,包括log4j

可以通过创建一个clickstream.xml配置文件并且把它放在你应用程序的类路径中(通常是[web应用程序根目录]/WEB-INF/classes)来改变这种默认的行为。配置文件可能是如下的形式:

 <clickstream>
<!-- there can only be one logger -->
<logger class="com.opensymphony.clickstream.logger.SimpleClickstreamLogger"/>
 
<!-- there can be zero or more bot-hosts -->
<bot-host name="someBotHost"/>
 
<!-- there can be zero or more bot-agents -->
<bot-agent name="someBotAgent"/>
</clickstream>
 


如果你希望提供你自己的logger,请查看Clickstream 的javadoc文档

和容器有关的特定问题

当从控制台停止Clickstream应用程序时,BEA WebLogic 8.1 (SP2)会抛出NullPointerException异常(when setting the attribute NULL for the clickstreams in the ServletContext on contextDestroyed—这句话不会翻译,谁能帮帮忙),需要应用CR133558这个补丁(已经包含在weblogic的sp3中)。

外部文档
" 使用EAServer跟踪你的用户—Berndt Hamboeck所著的Sybase白皮书
" Servlet2.3 模型的过滤器代码—Jason Hunter所著的“谁在你的站点上,他们正在干什么”的一段。

http://blog.sina.com.cn/s/blog_4ae2ef25010006rc.html
分享到:
评论

相关推荐

    大型网站用户行为记录的一个实现--基于clickStream(第二部分)

    clickStream是指用户在网站上的点击流数据,它记录了用户在页面间跳转、交互的详细路径。这种数据对于理解用户习惯、优化用户体验以及进行精准营销至关重要。 【描述】虽然没有提供具体的描述,但通常在这一部分中...

    大型网站用户行为记录的一个实现--基于clickStream(第一部分)

    "大型网站用户行为记录的一个实现--基于clickStream(第一部分)"这篇博客探讨了如何利用clickStream技术来实现这一目标。clickStream是一种追踪用户在网站上点击行为的技术,它能够捕获用户从一个页面到另一个页面的...

    clickstream-1.0.2.jar

    clickstream-1.0.2.jar

    myoa.rar_基于clickstream

    1. **Clickstream数据收集**:通过JavaScript或者服务器端的日志记录,捕获用户的每一次点击、页面加载、滚动等事件,形成一系列的点击序列,即clickstream数据。 2. **数据预处理**:收集到的原始clickstream数据...

    电子商务点击流和交易数据集 E-commerce Clickstream and Transaction 70K+ 记录 CSV

    它包括一系列事件,例如页面浏览量、点击量、产品浏览量和购买量。每条记录都捕获会话中的用户活动,因此适用于分析点击流路径和事务序列。 特征: 用户 ID:每个用户的唯一标识符。 SessionID:每个会话的唯一...

    Python库 | streammachine-schemas-clickstream-avro-0.2.0.tar.gz

    这个库专注于处理clickstream数据,clickstream是指用户在浏览网站时产生的连续点击行为的记录。Avro是Apache Hadoop项目的一部分,是一种数据序列化系统,常用于大数据处理。在这里,Avro被用作数据格式,使得数据...

    大数据Spark技术 使用Apache Spark预测Messy Clickstream数据中的安装程序保留共34页.pdf

    Clickstream数据指的是用户在浏览网站或应用程序时所产生的一系列点击流信息,它记录了用户的行为路径,例如用户点击链接的时间、位置、操作类型等。这类数据对于分析用户行为和预测用户留存非常重要。 4. 特征工程...

    clickstream-rest-proxy

    Clickstream数据是指用户在浏览网站时产生的点击行为序列,这些数据对于理解用户行为、优化用户体验以及进行数据分析至关重要。这个项目的核心是构建一个中间层,它可以接收来自客户端的clickstream事件,通过REST...

    clickstream_analyzer:一个基于决策树分析和预测网站点击活动的机器学习项目

    《clickstream_analyzer:利用决策树深度解析与预测网站点击行为》 在现代互联网时代,网站用户的行为数据,特别是点击流(clickstream)数据,已成为评估用户体验、优化网站设计和进行精准营销的重要依据。`...

    clickstream:学士论文项目

    点击流分析平台,用于用户活动数据目录1.11.22.12.2 2.32.4代2.52.62.7服务沟通API网关使用REST-API服务客户端请求使用gRPC客户端与微服务通信微服务使用gRPC与不同的服务进行通信API服务职责范围REST API 满足所有...

    elasticsearch-clickstream-demo

    **Elasticsearch点击流分析演示** 本项目"elasticsearch-clickstream-...通过深入学习和实践"elasticsearch-clickstream-demo"项目,你可以掌握如何利用Elasticsearch处理和分析点击流数据,为业务决策提供有力支持。

    ClickstreamAnalysis:使用马尔可夫链和数据挖掘SPACE算法分析Clickstream数据

    点击流分析 此R代码是使用Markov链和数据挖掘SPADE算法分析Clickstream数据的示例。 您可以在此处找到整个分析: : 用法 我使用了R版本3.3.3(2017-03-06)-“另一个独木舟” 代码中提到了所有需要的软件包。 您...

    StatViz: graphical clickstream analysis-开源

    - **优化SEO策略**:通过分析用户访问路径,找出排名较低但访问量大的页面,进行针对性的优化。 - **提升用户体验**:根据会话跟踪,找出用户常停留或频繁跳转的页面,优化内容布局和导航结构。 - **评估营销活动...

    2013年中国数据库大会-44-云端漫步——利用Amazon AWS构建可伸缩的数据分析平台

    数据来源方面,主要来自于Web服务器的点击流(Clickstream)和定制的收集服务器(CollectServer)跟踪信息。兰亭集势对于数据处理的需求特点包括集群规模不大,集群使用不饱和,以及需要较大的计算弹性,这些特点...

    clickstreamresultoutput.zip

    Clickstream数据记录了用户在网站上的每一次点击行为,包括访问的页面URL、停留时间、跳转路径等。这些数据对于分析用户行为模式、网站性能优化和个性化推荐具有重要意义。 在这个压缩包中,有三个子文件:...

    click_stream

    点击流 了解 Elixir 中的 。 您可以阅读有关博客文章的。 该项目创建一个 wXwidget 窗口,并通过移动鼠标,发出鼠标坐标。 玩弄 在iex启动项目: % iex -S mix 在此示例中,创建了两个流: ClickStream.create_...

    Solr-ctf-query-parser:使用Clickstream数据重新排名和扩展Solr查询返回

    增加和注入选定的项目类型,并利用点击点击量的选定组成部分增加和注入 这些元素可以单独使用,也可以组合使用,以提高搜索回报,当前意识,识别相关材料,提出个人建议等(请参见下面的示例CTF查询)。 为了最大...

    quickstart-ct-clickstream-analytics:AWS快速入门团队

    quickstart-clickstream-analytics-ct AWS云上的Clickstream Analytics 此《快速入门》会在大约30分钟内自动在Amazon Web Services(AWS)上构建点击流分析解决方案。 它集成了AWS服务,例如Amazon Kinesis Data ...

Global site tag (gtag.js) - Google Analytics