网站用户的识别 -

caodaoxi

浏览: 553213 次
性别:
来自: 北京

最近访客更多访客>>

justsomebody126

m635674608

ATOIN

xiezhiyong1996

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

网站用户的识别

博客分类：

技术杂谈

用户分析是网站分析中一个重要的组成部分，在分析用户之前我们必须首先能够识别每个用户，分辨哪些是”New Customer”，哪些是”Repeat Customer”。这样不但能够更加清晰地了解到底有多少用户访问了你的网站，分辨他们是谁（用户ID、邮箱、性别年龄等）；同时也能够帮助你更好地跟踪你的用户，发现它们的行为特征、兴趣爱好及个性化的设置等，以便于更好地把握用户需求，提升用户体验。

通常当你的网站提供了注册服务，而用户注册并登陆过你的网站，那么用户可以更容易地被识别，因为网站一般都会保存注册用户的详细信息；但是你的网站并不需要注册，而用户的行为以浏览为主，这是用户识别就会显得较为困难，下面提供了几种常用的用户识别的方法：

识别用户的几种方法

当用户并未注册登录的情况下，识别用户的唯一途径就只剩下用户浏览行为的点击流数据，通常情况下它们会保存在WEB日志里面。

1、基于IP的用户识别

IP地址是最容易获取的信息，任何的WEB日志中均会包含，但其局限性也较为明显：伪IP、代理、动态IP、局域网共享同一公网IP出口……这些情况都会影响基于IP来识别用户的准确性，所以IP识别用户的准确性比较低，目前一般不会直接采用IP来识别用户。

获取难度：★

准确度：★

2、基于IP+Agent的用户识别

同样基于最简单形式的WEB日志，我们可以增加一项——Agent，来提高单一IP方式识别用户的准确性。Agent也是WEB日志中一般都会包含的信息，通过IP+Agent的方式可以适当提高IP代理、公用IP这类情况下用户的分辨度，同时通过Agent还可以识别网络爬虫等特殊“用户”，但同样准确度也欠高。

获取难度：★

准确度：★★

3、基于cookie的用户识别

当你通过自定义Apache日志格式或者JavaScript的方法获得用户cookie的时候，其实你已经找到了一个更有效的用户识别的手段。cookie在未被清除的其前提下可以认为是跟某个访问客户端电脑绑定的（一个客户端有可能包含多个cookie），所以用cookie来标识用户其实指的是用户使用的客户端电脑，而并非用户本身。

用cookie识别用户的方法当然也存在缺陷：最常见的就是cookie被清除而导致用户无法与原先记录实现对应；同时由于客户端电脑会被共用，或者用户会在不同的电脑上访问你的网站，这个时候cookie就无法直接对应到该用户了。

获取难度：★☆

准确度：★★☆

4、基于用户ID的用户识别

基于用户ID的用户识别是最为准确，因为一般情况下用户不同共享他的用户ID，所以我们可以认为数据中的userid唯一地指向该用户，几乎不存在偏差。当然要使用用户ID来识别用户是需要一定的前提条件的：网站必须是提供用户注册登录服务的，并且可以通过一些手段在点击流数据中记录userid。

获取难度：★★

准确度：★★★

所以对于一个需要用户ID注册登录的网站来说，用户唯一标识符的选择可以遵从以下顺序：当用户注册登录时以userid为准，当用户在未登录状态浏览时以用户的cookie为准，当用户未登录且cookie无法获取的情况下以IP+Agent为准；这样就能从最大程度上识别唯一用户。

这里推荐一个网站日志中cookie项的自定义设置方法，以便更好地识别用户。cookie是从用户端存放的cookie文件记录中获取的，这个文件里面一般在包含一个cookieid的同时也会记下用户在该网站的userid（如果你的网站需要注册登陆并且该用户曾经登录过你的网站且cookie未被删除），所以在记录日志文件中cookie项的时候可以优先去查询cookie中是否含有用户ID类的信息，如果存在则将用户ID写到日志的cookie项，如果不存在则查找是否有cookieid，如果有则记录，没有则记为”-”，这样日志中的cookie就可以直接作为最有效的用户唯一标识符被用作统计。当然这里需要注意该方法只有网站本身才能够实现，因为用户ID作为用户隐私信息只有该网站才知道其在cookie的设置及存放位置，第三方统计工具一般很难获取。

获取用户信息的途径

通过以上的方法实现用户身份的唯一标识后，我们可以通过一些途径来采集用户的基础信息、特征信息及行为信息，然后为每位用户建立起详细的Profile：

1）　用户注册时填写的用户注册信息及基本资料；

2）　从网站日志中得到的用户浏览行为数据；

3）　从数据库中获取的用户网站业务应用数据；

4）　基于用户历史数据的推导和预测；

5）　通过直接联系用户或者用户调研的途径获得的用户数据；

6）　有第三方服务机构提供的用户数据。

识别并获取用户信息的价值

通过用户身份识别及用户基本信息的采集，我们可以通过网站分析的各种方法在网站是实现一些有价值的应用：

基于用户特征信息的用户细分；

基于用户的个性化页面设置；

基于用户行为数据的关联推荐；

基于用户兴趣的定向营销；

……

文章来源：http://webdataanalysis.net/personal-view/web-user-identification/

分享到：

Apsalar：重视用户行为分析才能赚到钱 | python学习过程中遇到问题汇总

2012-09-03 00:00
浏览 658
评论(0)
分类:非技术
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

网站用户的识别

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

网站用户的识别

评论

发表评论

相关推荐

JavaScript跨域总结与解决办法

Flash cookie

浅析opera的ua伪装识别功能

搜索引擎如何抓取互联网页面

数据挖掘在广告中的应用

扩展RBAC用户角色权限设计方案

游戏中的消费行为分析

Apsalar：重视用户行为分析才能赚到钱

网络广告收付费的形式

浏览器是如何工作的？（工作原理）

从输入网址到显示页面：浏览器工作原理拆解分析

保险、财务基本知识

贷款利息计算

解读Schema

如何使Aptana支持gbk编码 .

关于RBAC权限的说明

JNDI带给了我们什么

最近访客更多访客>>