- 浏览: 248648 次
- 性别:
- 来自: 深圳
最新评论
-
bit1129:
huanjia27 写道楼主, //数字小,优先级高 ...
PriorityBlockingQueue优先级规则 -
huanjia27:
楼主, //数字小,优先级高 public in ...
PriorityBlockingQueue优先级规则 -
bit1129:
优先级队列有点坑。。。对于返回的数组或者Iterator,对它 ...
PriorityBlockingQueue优先级规则 -
sun_2008:
再加一个参数cachePrepStmts=true才行,好像预 ...
Mysql是支持预编译的,只是默认没开启 -
hooray520:
nice~~
ThreadPoolExecutor线程池实现逻辑
文章列表
Python机器学习快速入门系列4: 线性回归
- 博客分类:
- 机器学习
网上找的机器学习的资料对于新手来说往往很难, 经常一上来就甩你一堆像外星文一样的公式方程,然后就把你满腔的学习热情给无情浇灭, 让你觉得是不是该回去学下数学再好好做人。笔者也是一样屡屡被虐,才略有领悟, 回过头来看,发现其实机器学习入门本来可以不这么艰难。 Python机器学习快速入门系列文章,希望能够以简单易懂、通俗而有趣的方式,把大家带入Machine Learning的世界。
1.猜数游戏
在正式进入线性回归之前,先玩一个猜数的游戏:
x= 1 , 3, 8, 9, 15 16
y= 2, ...
机器学习算法中,对矩阵的操作非常频繁,如果不熟悉矩阵的数学知识, 或者不太理解Python中对于矩阵操作的方法, 学习起来会寸步难行, 因此这篇笔记用于整理Python和数学相关的基础知识点,方便查阅。
1. Array创建矩阵 ...
想要开始玩机器学习, 敲个hello world第一关就是环境问题, 而python环境下,有3个包必须要装: numpy, pandas 和sklearn。 numpy和pandas都是负责数据计算处理的, 而sklearn封装了机器学习算法, 因此尤其重要。
一般的流程, 我们会先安装一个python环境, 然后用pip或者easy_install把这几个包装上。 但实际操作时, 随后会发现,这些包还依赖其他一群包, 每种依赖都有一定的版本条件限制, 装错一个就跑不起来。 笔者在这里也是兜了一大圈,最后放弃了。
所幸,我们也不是第一个遇到这种困难, 前辈们早就有解决办法了, 那就 ...
Python机器学习快速入门系列4: 线性回归
- 博客分类:
- 机器学习
网上找的机器学习的资料对于新手来说往往很难, 经常一上来就甩你一堆像外星文一样的公式方程,然后就把你满腔的学习热情给无情浇灭, 让你觉得是不是该回去学下数学再好好做人。笔者也是一样屡屡被虐,才略有领悟, ...
常用大数据技术名词通俗解释
Hadoop:
最早出现的大数据的概念就是体现在Hadoop上面,简单理解就是虚拟了一个存储系统,一个文件在多台机器上保存多份,丢失几率很小。由于机器集群可以横向扩充,因此能保存理论上无穷多的文件,因此称为大数据平台。
MapReduce:
在Hadoop存文件的基础上,MapReduce担任处理文件的角色,它读到文件,并把处理文件的任务分成很多子任务,让它们在多台机器上执行,然后汇总结果。因此,只要机器足够多,处理文件的能力可以无限扩充。但它的一个缺点是每个任务的衔接,都是通过中间文件来完成,因此,除了CPU外,有很多磁盘读写的操作。
...
又到了看报表炒股的时候了,总结一下之前的笔记,用来作选股依据,5分钟看一股。满足下列条件的股票,虽然可能不会大涨,但是绝对不可能大跌。
1. 经营现金流量/收入>0.5 参数可配置,越大股票越好
2. 资产负债 ...
虚拟机下载,以及序列号准备
VMware Workstation v11.1.0 https://download3.vmware.com/software/wkst/file/VMware-workstation-full-11.1.0-2496824.exe
key :1F04Z-6D111-7Z029-AV0Q4-3AEH8
Linux操作系统Centos 6.6
CentOS-6.6-i386-minimal.iso
虚拟机网络 参数: 网络选择NAT,
vi /etc/sysconfig/network-scripts/ifcfg-eth0
DEV ...
架构师的自我修养(一)
- 博客分类:
- 管理
1. 架构师既是技术专家,同时也是业务领域的专家,能够预见业务领域风险,并提供解决的办法。技术上经验丰富的人会有很多,只要在技术的道路上,总是会沉淀各种各样的技术。而对于业务的把握,则是一个缘分。需要有额 ...
堆表 -- 普通表
99%的应用在使用到表的时候,都是使用堆表。Heap,这是一个无序的空间,插入的数据会找到一个合适的位置来存储,带有随机性,而不是按插入的顺序来存储。所以,在全表扫描的时候,返回的数据是按照空间 ...
Oracle的Redo和Undo
- 博客分类:
- DB
延迟段创建:
create table的时候,并没有真正分配段,而已等真正需要insert的时候才进行分配空间。
Update+ Commit所做的工作: update:
生成undo信息
修改数据块
给数据块加锁标记,得到锁
生成Redo信息
commit:
为事务生成SCN,计数
LGWR把Redo日志写入到磁盘 -- IO最花时间, PLSQL中的Commit不会等LGWR写入磁盘,立刻返回。而其他的调用则需等待
V$Transaction中删除事务记录
V$Lock中记录的锁释放
清除块上的锁信息
所以commit过程的工作确实 ...
显式调用
编写Oracle程序的时候,一个比较好的习惯就是要显示地执行Commit或者Rollback. 一些工具如Sqlplus在退出的时候,会自动commit,而另外一些则会rollback。 如果过分的依赖这些隐式地调用,那么有可能造成不可预估的后果。
...
Oracle的锁是行锁,实现方式是在块上进行标识锁状态,因此几乎没有相关的开销,锁定1行和锁定1百万行的开销几乎是一样的。
由于Oracle的并发和多版本的实现,存在丢失更新的文件,需要代码手工去避免,这也是出于性能的考虑,让Oracle天然具有读写分离的特性。
悲观锁: select for update nowait.
nowait的区别在于其他线程对于相同资源的访问并不会进行等待,而是立刻返回。
乐观锁: 表里面加上versionID来控制不同线程的修改。
或者使用虚拟列,这个虚拟列是Hash值,基本不会带来任何开销
select name, lo ...
Oracle的并发和多版本控制
- 博客分类:
- DB
写不会阻塞读,这是Oracle和其他数据库的一个根本的区别。Oracle能够同时物化多个版本的数据,每次写入数据,都会另外生成一个版本,并附上时间戳,而当一个读操作发起时,它只能读到这个时间戳以内的版本,超过这个时间戳所更新的数据,是不会返回在结果集里面。所以一个程序如果只是读操作,那么它永远也不会被阻塞,也不会发生死锁。从某种意义上看,Oracle天然就具备了读写分离的特性。不像Mysql,需要采用主备集群的方式来实现读写分离。
支持的事务的隔离级别是Read Commited和Serializable。 对于Read Commit, 他允许“不可重复读”和“幻读”
不 ...
Data Model设计的Tip
1. 以三个范式为基础,业务的独立性和原子性拆分要合适,杜绝Key的冗余和不充分依赖
2. 对于有NULL值的时候,说明可以拆分为子类, 如果有互斥值,比如两个字段,如果A有值,那么B就不能有值
3. 隐藏的约束,某个Column为A值,那么另外一个Column就必须为B值,或者某个Column只能是1~20的值
4. 对于Boolean值,比如某个Flag Column, Y/N, 其实可以考虑用更有意义的值来替代,比如Complete Date. 当然如果处于性能考虑的话不在此列。
高效访问DB的Tip
1. jav ...
从言必称“云”看近十年的技术概念炒作
- 博客分类:
- SOA架构
任何一家科技企业,推出自己的新产品的时候,不管怎么样,总得在里面加上一个云字,仿佛不加上这个帽子就是土鳖,一加上立马就成了“高大上”,连股票都能涨停。Oracle CEO拉里几年前曾经对这种现象异常反感,但后来 ...