`
endual
  • 浏览: 3558324 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

Taste/Thoth:开源的推荐系统引擎

 
阅读更多


推荐者:草根帮主 (积分 188515) |
Taste(http://taste.sourceforge.net/)是非常棒的一个推荐系统核心引擎,sf 上可以下载到 Taste 的最新版本。Taste 同时也是 2007 Google Summer of Code 里的一个项目。当初学习推荐系统开发的时候,遍搜网络,这个是我个人找到的最全面最完整的一个开源包。细读代码之后,虽然没有 Lucene 曾经带给我的那种震撼,但也绝对可以称得上是开源世界里的上佳之作!经常有朋友发 Email 希望我介绍一些推荐系统相关的资料,这个是我必然推荐给大家的一个。 下面翻译自 Taste 文档的 Overview 部分。 Taste 是使用 Java 语言开发的一套灵活、快速的协同过滤引擎。他根据用户(Users)对某些项(Items)的偏好(Preferences),来推断用户对其他一些项的 偏好程度。举个例子,一个出售书籍或CD的在线零售商(比如amazon/dangdang/joyo),使用 Taste 引擎,可以方便地依据已有的购物篮数据,为用户推荐他可能感兴趣的书籍或CD。 Taste 提供了丰富的组件集,基于其中的算法,你可以定制出自己的推荐系统。Taste 从设计上就力求能够满足于企业级的要求,效率、可扩展性与灵活性是它的设计目标。它为基于 J2EE 的应用提供了一个标准的 EJB 接口。但 Taste 并不是仅限于 Java 平台。它能够以独立 Server 的形式运行,通过 Web Services 和 HTTP 方式向其它(语言开发的)应用程序提供推荐逻辑。 Taste 的顶级包里抽象出了下面这些核心接口。 DataModel PreferenceTransform UserCorrelation and ItemCorrelation UserNeighborhood Recommender 在 comp.planetj.taste.impl 命名空间下,有这些接口的实现代码。从这些核心接口开始,你就可以搭建你自己的推荐引擎了。简而言之,这就是 Taste!倾向于学术的,Taste 可以支持 Memory-based(即我之前 blog 里提到的 User-based) 和 Item-based 两种推荐形式,提供了包括 Slope One 在内的一些算法的实验性实现。Taste 目前尚不支持 Model-based 推荐。 2007年6月30日,Taste 发布了其最新的一个版本 1.5.5。在这个版本里面,甚至还包含了针对 Netflix 数据的一个实验包。不得不说,Netflix Prize [1] [2], 真的是一个双赢的活动!本来,推荐领域已经冷清了有些日子,其中一个很大的原因就是大家做实验的基础只有 GroupLens/EachMovie 这两个数据源,搞来搞去想突破也不容易了。Netflix 公开他的数据,使做 Research 的学者们拿到了宝贵的 big data,终于可以跳出 GroupLens/EachMovie 的框框了。随着基于 Netflix 数据所取得的 最新研究成果不 断出现,无疑会不断促进着推荐技术下一个热潮的到来。与此同时,学者们的积极参与,也使得 Netflix 越来越接近于其追求的推荐准确率,并且,通过媒体的广泛报道,Netflix 也赢得了高知名度和好的口碑。说实在的,用 1M$ 买到如此多最新的技术成果,同时又获得了不小的商业收益,这个买卖真是值了! 去年,我试着给 Taste 的作者发过几次 Email,希望能加入到 Taste 的开发 Team 里,可一直没有收到任何答复。今年年初,在 Google Summer of Code 上又申请了一次,仍然没有回应。始终入不了高人的法眼,说明自己差距还很大啊。要说开源的推荐引擎,Java 下最多,PHP 有个 Vogoo,Python 下零零散散的也能找到一些,唯独 .Net 下基本没有。基于上两方面的原因,我和一个好朋友商量,准备把 Taste 移植到 .Net 平台下。一来通过移植代码,加深自己的理解;二来也算是为 .Net 社区做点儿贡献,哈哈。 我们的项目暂时命名为 Beyond.Thoth,之所以没有叫 Taste.Net,主要是因为我们打算逐步加入自己的一些实现。改名这事儿对 Taste 可能有些不敬,但我们会在代码里面,明显标出对 Taste 的引用。目前核心代码已经移植完毕,正在进行算法的准确性验证和性能调优。资源在这里,目前还是空的,有发布后我会第一时间在 blog 里通知各位朋友。 Beyond.Thoth on sf.net,http://sourceforge.net/projects/beyondthoth/ Beyond Thoth Group on google,http://groups.google.com/group/BeyondThoth/
分享到:
评论

相关推荐

    thOth:thOth 是一个开源的 C++ 高频交易库

    thOth 是一个开源的 C++ 高频交易库。 它是一个跨平台的库,具有插件支持、数据库连接和单独的 MFC GUI。 最终,thOth 旨在支持 C++11 多线程以及 GPGPU 编程。 核心库强烈依赖 Boost,但也可能会考虑其他依赖项...

    hogmatlab源码-deepmatching:https://thoth.inrialpes.fr/src/deepmatching/的叉

    标签“系统开源”表明这个压缩包可能包含了实现HOG特征提取和DeepMatching算法的MATLAB源代码。MATLAB是一种强大的编程环境,特别适合于数值计算和科学可视化,因此很适合用于开发和测试这种图像处理算法。用户可以...

    thoth-demo:透特的演示

    透特演示 开始 克隆演示项目 ... Thoth 将在端口 8081 上运行 功能演示 让我们执行一些查询并从模拟一些异常 # Standard query *:* curl 'http://localhost:8900/solr/collection1/select?q=*:*&wt=json&ind

    matlablm算法代码-deepmatching:稍作修改的https://thoth.inrialpes.fr/src/deepmatch

    在IT领域,MATLAB是一种广泛使用的编程环境,尤其在科学计算、...通过学习和实践这样的开源项目,不仅可以提升你的MATLAB编程技能,还能增强你对非线性优化和计算机视觉的理解,为你的IT职业生涯增添宝贵的实践经验。

    Thoth:条件翻译语言

    透特 一种条件翻译语言。 这是为了什么? 该语言首先针对希望本地化... 这样,您便告诉Thoth该函数调用的结果是一个中性的表达式/单词。 您还可以通过以下方式定义不带参数的函数: def functionName:n 如果类型是

    PyPI 官网下载 | thoth-python-0.3.0.tar.gz

    标题中的"PyPI 官网下载 | thoth-python-0.3.0.tar.gz"指出,这是一个在Python的包索引平台PyPI上发布的软件包。PyPI是Python程序员分享和下载自己创建的库和模块的地方,使得其他开发者能够轻松地在他们的项目中...

    thoth:Thoth 是一个实时 solr 监视器和搜索分析引擎。 这是一组工具,可帮助您收集、可视化和利用来自 solr 搜索基础架构的数据

    Thoth是一个实时 solr 监视器和搜索分析引擎。 它是一组工具,可帮助您收集、可视化和利用来自 solr 搜索基础架构的数据。 想了解更多? 有什么建议或问题吗? 在上讨论并关注我们 Thoth Core(索引) Thoth Core是...

    thoth:阅读时间太长。 使用在Heroku上托管的ReactJS

    Thoth是一种快速阅读工具,使您可以比其他方式更快地阅读PDF和文本选择。 它包含一系列用于自定义您的体验的设置和功能。 请参阅我的演示文稿以获取演练: : Thoth是在线托管的, 该项目是实施Thoth的概念证明...

    Go的错误记录器-Golang开发

    Go Thoth的错误记录仪什么是Thoth? 在埃及神话中,透特是埃及宜必思领导的知识,魔法和智慧之神。 在这种情况下,Thoth是golang的错误记录器。 它有助于将错误记录到日志文件中,因此您可以回头查找生产中出现问题...

    thoth-api:Thoth API 是提供对包含在 Thoth 索引上的数据的抽象的模块

    Thoth是一个实时 solr 监视器和搜索分析引擎。 它是一组工具,可帮助您收集、可视化和利用来自 solr 搜索基础架构的数据。 想了解更多? 透特API Thoth API模块为包含在 Thoth 索引中的数据提供了一个抽象。 有关...

    thoth-server

    通过插件系统的不同身份验证方法(本地、LDAP ...) 以tar.gz格式导出资源,默认使用个人密码加密 通过命令行界面管理 REST API 网络客户端(可选) 命令行客户端 - 请参阅 依赖关系 - 在 0.10.22 版本中测试 -...

    thoth-gateway:索特盖特威

    索特网关Thoth网关:用于Microsoft IIS的PL / SQL网关模块,类似于mod_plsql和Apex侦听器(ORDS)Thoth网关:用于Microsoft IIS的PL / SQL网关模块什么是Thoth网关? 在古埃及神话中,透特是一位宜必思元首的神,在...

    thoth-application:Thoth-Station ArgoCD应用程序

    应用Thoth应用程序用作单点存储库,其中包含部署Thoth工作站应用程序所需的所有详细信息。应用的想法此存储库是一项测试,可以与将部署目标环境表示为git分支的建议解决方案一起使用。 该提案有两个主要方面: Dev /...

    Python库 | thoth_messaging-0.10.3-py3-none-any.whl

    2. **消息队列**:Thoth Messaging可能内置了消息队列服务,允许应用程序异步处理任务,提高系统的响应速度和可扩展性。消息队列可以确保消息的可靠传输,即使在发送者和接收者之间发生故障也能恢复。 3. **事件...

    Python库 | thoth_solver-1.5.2-py3-none-any.whl

    Thoth Solver是Python生态系统中的一个重要组成部分,它以Python语言编写,兼容Python 3.x版本。该库的名字来源于古埃及神话中的智慧之神Thoth,寓意着它能够在解决复杂问题时提供智慧和洞察力。1.5.2版本的发布意味...

    PyPI 官网下载 | thoth-adviser-0.9.5.tar.gz

    描述中的"资源来自pypi官网,资源全名:thoth-adviser-0.9.5.tar.gz"进一步确认了该文件的来源,并表明它是一个tarball格式的压缩文件,通常用于存储和分发开源软件。".tar.gz"是Unix/Linux系统中常见的压缩格式,由...

    python:Python相关代码库

    Thoth Python 该库为提供了Python特定操作的例程。 该库中存在的例程的示例: 处理项目(请参阅Project抽象) 在requirements.txt文件和/或Pipfile和Pipfile.lock文件Pipfile.lock操作 使用Python包源索引进行...

    Python库 | thoth-lab-0.0.0.tar.gz

    资源分类:Python库 所属语言:Python 资源全名:thoth-lab-0.0.0.tar.gz 资源来源:官方 安装方法:https://lanzao.blog.csdn.net/article/details/101784059

    Python库 | thoth-adviser-0.15.1.tar.gz

    资源分类:Python库 所属语言:Python 资源全名:thoth-adviser-0.15.1.tar.gz 资源来源:官方 安装方法:https://lanzao.blog.csdn.net/article/details/101784059

    thoth-dashboard:Thoth Dashboard 是负责可视化包含在 Thoth 中的数据的模块

    Thoth是一个实时 solr 监视器和搜索分析引擎。 它是一组工具,可帮助您收集、可视化和利用来自 solr 搜索基础架构的数据。 想了解更多?透特仪表板Thoth 仪表板是负责可视化包含在 Thoth 中的数据的模块。 它提供...

Global site tag (gtag.js) - Google Analytics