`
dengkane
  • 浏览: 42407 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论
文章列表
转载自:http://bigdata.51cto.com/art/201801/562716.htm   不是有词典匹配的方法了吗?怎么还搞多个机器学习方法。 因为词典方法和机器学习方法各有千秋。 机器学习的方法精确度更高,因为词典匹配会由于语义表达的丰富性而出现很大误差,而机器学习方法不会。而且它可使用的场景更多样。无论是主客观分类还是正负面情感分类,机器学习都可以完成任务。而无需像词典匹配那样要深入到词语、句子、语法这些层面。 而词典方法适用的语料范围更广,无论是手机、电脑这些商品,还是书评、影评这些语料,都可以适用。但机器学习则极度依赖语料,把手机语料训练出来的的分类器拿去给书 ...
转载自国外网站的一个页面内容:  
  0 “所有的代码都是垃圾,除了我的以外 (图片来源于网络) 哥们儿,我有一个坏消息要告诉你,你的代码很垃圾。不管你花费了多少精力,总是有很多程序员认为你的代码是垃圾,他们可以比你做的10倍更好。
一、关于高并发 高并发是指在同一个时间点,有很多用户同时访问URL地址,比如:淘宝的双11、双12,就会产生高并发。又如贴吧的爆吧,就是恶意的高并发请求,也就是DDOS攻击,再屌丝点的说法就像玩LOL被ADC暴击了一样,那伤害你懂的。 来源:SFLYQ的博客 原文:http://blog.thankbabe.com/2016/09/14/high-concurrency-scheme/
响应ITEye的号召,计划把博客同步到CSDN。
作者:崔秋,PingCAP 联合创始人,重度开源爱好者,曾任职于搜狗、豌豆荚,长期从事广告系统基础组件相关的研究,现主要从事开源NewSQL 数据库 TiDB/TiKV 相关的设计和研发工作。 责编:郭芮(guorui@csdn.net),关注大数据领域。 本文为 《程序员》 原创文章,未经允许不得转载,更多精彩文章请 订阅2017年《程序员》 。  近几年,随着移动互联网的发展、云计算的普及和各种新业务的出现,数据呈现爆发式增长,给整个业务系统带来了越来越大的挑战,
作为一名在前端死缠烂打6年并且懒到不行的攻城士,这几年阅过很多从知名到很知名的前端框架,本来想拿15-20个框架来分享一下,但在跟几个前辈讨教写文章的技巧时果断被无情的打击了,所以这里我还是低调的只拿出10个框架来个大锅乱炖,凑够字数也就全剧终了。下面的框架也没有什么先后顺序之分,我想到啥就写啥啦(作为前端,我一向都这么的任性^_^ )。   Bootstrap 首先说Bootstrap,估计你也猜到会先说或者一定会有这个(呵呵了),这是说明它的强大之处,拥有框架一壁江山的势气。自己刚入道的时候本着代码任何一个字母都得自己敲出来挡我者废的决心,来让自己成长。结果受到周围各种基友的引诱开 ...
一直在寻找分布式数据库解决方案,有看过MyCat,MyCat是一个数据库中间层产品,通过数据库分区技术能提供一个理论上无限扩展的大数据库,背后核心还是MySQL,我感觉不是终极解决方案,但可以算作是过度方案。   Tidb进入我的视野,觉得思路比较有趣,对外以MySQL 协议提供关系数据库存储服务,而核心是NoSQL技术实现分布式存储和分布式计算。先不看其核心部分,单从对外提供兼容 MySQL服务这个角度看,这是很聪明的选择,可以吸引庞大的MySQL用户群来尝试使用。   我们已经基于MySQL开发了很多项目,目前面临的一个瓶颈是随着数据量越来越大,存储空间扩展方面和查询性能方面都面 ...
1. 用Jython调用Java类库 第一步、创建Java类 写一个简单的Java类,用Point来示例:  Java代码   import org.python.core.*;     
虽说消息队列的用法很简单:PUB/SUB, PRODUCER/CONSUMER,不过真做起来还真麻烦。 先说下原始需求: Web前端发送命令消息,后端Consumer处理,然后前端得到结果 需要支持Windows服务 很快,下图就出来了: 先来分析分析: 前端怎么知道后端已经处理完成? 前端如何在处理完后的第一时间被触发去执行某些callback呢? Web前端很可能会通过ajax来定时查看某消息的处理状态
JSON 是适用于 Ajax 应用程序的一种有效格式,原因是它使 JavaScript 对象和字符串值之间得以快速转换。由于 Ajax 应用程序非常适合将纯文本发送给服务器端程序并对应地接收纯文本,相比不能生成文本的 API,能生成文本的 API 自然更可取;而且,JSON 让您能够处理本地 JavaScript 对象,而无需为如何表示这些对象多费心思。 XML 也可以提供文本方面的类似益处,但用于将 JavaScript 对象转换成 XML 的几个现有 API 没有 JSON API 成熟;有时,您必须在创建和处理 JavaScript 对象时格外谨慎以确保所进行的处理能与所选用的 XML ...
RabbitMQ 是一个消息代理。这主要的原理十分简单,就是通过接受和转发消息。你可以把它想象成邮局:当你将一个包裹送到邮局,你会相信邮递员先生最终会将邮件送到接件人手上。RabbitMQ就好比一个邮箱,邮局或邮递员。 邮局和RabbitMQ两种主要的不同之处在于,RabbitMQ不处理文件,而是接受,并存储和以二进制形式将消息转发。 RabbitMQ,在消息的传送过程中,我们使用一些标准称呼。 生产过程就像发送过程,发送消息的程序就是一个生产者,我们使用“P”来描述它。
  第4回 EC2 m1.large单请求数据库访问测试(峰值)
         PostgreSQL9.4 新增 JSONB 数据类型, JSONB 同时属于 JSON (JavaScript Object Notation) 数据类型,jsonb 和 json 的输入数据几乎完全通用,最大的差别体现在效率上,json 存储的数据几乎和输入数据一样,存储的是未解析的数据,调用函数时使用效率较低; 而 jsonb 存储的是分解的 binary 格式数据,使用时不需要再解析了,因此使用上效率较高; 另一方面 json 在写入时较快,而 jsonb 写入时由于需要转换导致写入较慢。下面通过些简单的例子了解两者的差异。    --1 这个例子两者没啥差异 ...
haproxy 介绍   1 工作在ISO 七层 根据http协议(或者工作在ISO四层 根据tcp协议) 提供web服务的负载均衡调度器     01.
Global site tag (gtag.js) - Google Analytics