使用Weka对股票数据进行分析

热带翎羽

浏览: 66339 次
性别:
来自: 福州

最近访客更多访客>>

jianfeng

wujt

assWecan

popfei3707

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

数据挖掘
Groovy

测试目标：
1) 对数据挖掘的步骤进行实践：生成、分析、验证
2) 熟悉对WEKA的使用

测试步骤：
1) 通达信导出股票复权数据
2) 通过程序生成: *.arff，包括：训练集和测试集合
3) 对结果进行评估

生成ARFF的代码如下：

File arffTrainingFile=new File("D:/ARFF/${name}Training.arff")

        arffTrainingFile.delete()
        arffTrainingFile.createNewFile()

        arffTrainingFile.withWriter {Writer writer->
            writer.println("% @author bruce.lin.chn")
            writer.println("% @date ${new Date().toLocaleString()}")
            writer.println("@relation \"${name}决策树分析训练\"")

            List keyList=metrics[0].keySet().toList().sort()

            keyList.each{String key->
                if (key !="date")
                {
                    writer.println("@attribute ${key} numeric")
                }
            }

            writer.println("@attribute class { \"Yes\", \"No\"}")
            writer.println("@data")

            for(int i=-360; i<-90;i++)
            {
                Map metric=metrics[i]
                keyList.each{ String key->
                    if (key !="date")
                    {
                        print "${metric[key]}, "
                        writer.print "${metric[key]}, "
                    }
                }

                println "${IsSuccessfulInvestment(i)}"
                if (IsSuccessfulInvestment(i)>0)
                    writer.println '"Yes"'
                else
                    writer.println '"No"'
            }
        }

        File arffTestingFile=new File("D:/ARFF/${name}Testing.arff")

        arffTestingFile.delete()
        arffTestingFile.createNewFile()

        arffTestingFile.withWriter {Writer writer->
            writer.println("% @author bruce.lin.chn")
            writer.println("% @date ${new Date().toLocaleString()}")
            writer.println("@relation \"${name}决策树分析测试\"")

            List keyList=metrics[0].keySet().toList().sort()

            keyList.each{String key->
                if (key !="date")
                {
                    writer.println("@attribute ${key} numeric")
                }
            }

            writer.println("@attribute class { \"Yes\", \"No\"}")
            writer.println("@data")

            for(int i=-90; i<-1;i++)
            {
                Map metric=metrics[i]
                keyList.each{ String key->
                    if (key !="date")
                    {
                        print "${metric[key]}, "
                        writer.print "${metric[key]}, "
                    }
                }

                println "${IsSuccessfulInvestment(i)}"
                if (IsSuccessfulInvestment(i)>0)
                    writer.println '"Yes"'
                else
                    writer.println '"No"'
            }
        }

生成的文件如下：

% @author bruce.lin.chn
% @date 2013-2-4 11:00:55
@relation "SZ002250决策树分析训练"
@attribute amplitude05 numeric
@attribute amplitude10 numeric
@attribute amplitude30 numeric
@attribute amplitude90 numeric
@attribute averageAmplitude05 numeric
@attribute averageAmplitude10 numeric
@attribute averageAmplitude30 numeric
@attribute averageAmplitude90 numeric
@attribute layoutBullAlignment numeric
@attribute layoutUpUpDown numeric
@attribute ma05 numeric
@attribute ma10 numeric
@attribute ma30 numeric
@attribute ma90 numeric
@attribute class { "Yes", "No"}
@data
0.78, 3.06, 9.47, 3.02, 1.4, 2.39, 4.47, 5.07, -1, -1, 97.88, 95.72, 90.11, 95.76, "No"
0.78, 3.13, 10.1, 4.03, 0.66, 2.34, 4.76, 5.01, -1, -1, 98.75, 96.49, 90.39, 95.66, "No"
-0.5, 1.23, 8.1, 2.6, 0.74, 2.17, 4.94, 4.94, -1, -1, 98.53, 96.86, 90.7, 95.56, "No"
-3.07, -1.97, 4.67, -0.36, 1.26, 1.98, 5.09, 4.85, -1, -1, 98.09, 96.98, 90.83, 95.42, "No"
-2.04, -1.95, 4.79, -0.06, 1.73, 1.72, 5.21, 4.79, -1, -1, 97.25, 97.15, 90.91, 95.31, "No"
-0.69, -1.2, 5.49, 0.85, 1.61, 1.6, 5.38, 4.77, -1, -1, 96.74, 97.25, 91.07, 95.27, "No"
1.66, 0.53, 7.34, 2.96, 1.28, 1.39, 5.54, 4.76, -1, -1, 96.46, 97.54, 91.35, 95.24, "No"
-2.44, -3.92, 1.81, -2.1, 1.3, 1.74, 5.46, 4.75, -1, -1, 95.52, 96.98, 91.52, 95.18, "No"
-3.05, -4.62, 0.44, -3.24, 1.95, 2.24, 5.38, 4.75, -1, -1, 94.94, 96.49, 91.64, 95.12, "No"
-0.36, -1.65, 2.78, -0.66, 1.96, 2.1, 5.25, 4.71, -1, -1, 94.78, 96.02, 91.88, 95.07, "No"
0.08, -1.12, 2.47, -0.51, 1.57, 1.91, 4.92, 4.68, -1, -1, 94.49, 95.65, 92.29, 95.06, "No"
-0.54, -2.14, 0.25, -2.14, 0.9, 1.61, 4.34, 4.68, -1, -1, 93.49, 95.03, 92.76, 95.03, "No"
-0.29, -1.41, 0.09, -1.86, 0.91, 1.41, 3.83, 4.68, -1, -1, 93.53, 94.59, 93.18, 95.03, "No"
-0.28, -0.94, -0.01, -1.51, 0.67, 1.45, 3.38, 4.66, -1, -1, 93.86, 94.49, 93.61, 95.03, "No"
-0.45, -1.17, -0.82, -1.9, 0.49, 1.45, 3.02, 4.63, -1, -1, 93.65, 94.34, 94.0, 95.03, "No"
-0.98, -1.81, -2.18, -2.84, 0.39, 1.29, 2.72, 4.59, -1, -1, 93.21, 93.99, 94.35, 95.0, "No"
-0.68, -1.06, -2.27, -2.63, 0.59, 0.72, 2.51, 4.56, -1, -1, 93.09, 93.44, 94.6, 94.95, "No"
-2.63, -3.37, -4.99, -5.17, 1.07, 1.11, 2.44, 4.57, -1, -1, 92.44, 93.15, 94.74, 94.92, "Yes"
-0.59, -1.76, -3.53, -3.59, 1.08, 1.25, 2.43, 4.55, -1, -1, 92.02, 93.11, 94.81, 94.88, "No"
... ... ...

分析的代码如下：

Classifier classifier= new J48()
ArffLoader arffLoader=new ArffLoader()
arffLoader.setFile(new File("D:/ARFF/SZ002250Training.arff"))

Instances instancesTraining=arffLoader.getDataSet()
instancesTraining.setClassIndex(14)

println "共加载:"+instancesTraining.numInstances().toString()
classifier.buildClassifier(instancesTraining)

println "训练完毕!"

println "classifier.graph()********************************************"
println classifier.graph()


arffLoader.setFile(new File("D:/ARFF/SZ002250Testing.arff"))

Instances instancesTesting=arffLoader.getDataSet()
instancesTesting.setClassIndex(14)

int sum=instancesTesting.numInstances()
int successful=0
for(int i=0;i<sum; i++)
{
    //分析结果与实际结果相同?
    if (classifier.classifyInstance(instancesTesting.instance(i))==instancesTesting.instance(i).classValue())
    {
        successful++
    }
}

println "正确率:"+(successful*100.0/sum).toString()+"%"

生成的决策树:

输出的结果：
正确率:86.5168539326%

ARFF201302041127.zip (11.6 KB)
下载次数: 85

查看图片附件

分享到：

2013-02-04 11:29
浏览 3682
评论(0)
论坛回复 / 浏览 (0 / 3999)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

win7修复本地系统工具: win7修复本地系统工具

《自动化专业英语》04-Automatic-Detection-Block(自动检测模块).ppt: 《自动化专业英语》04-Automatic-Detection-Block(自动检测模块).ppt

《计算机专业英语》chapter12-Intelligent-Transportation.ppt: 《计算机专业英语》chapter12-Intelligent-Transportation.ppt

西门子S7-1200博图平台下3轴伺服螺丝机程序解析与应用: 内容概要：本文详细介绍了基于西门子S7-1200博图平台的3轴伺服螺丝机程序。该程序使用SCL语言编写，结合KTP700组态和TIA V14及以上版本，实现了对X、Y、Z三个轴的精密控制。文章首先概述了程序的整体架构，强调了其在自动化控制领域的高参考价值。接着深入探讨了关键代码片段，如轴初始化、运动控制以及主程序的设计思路。此外，还展示了如何通过KTP700组态实现人机交互，并分享了一些实用的操作技巧和技术细节，如状态机设计、HMI交互、异常处理等。适用人群：从事自动化控制系统开发的技术人员，尤其是对西门子PLC编程感兴趣的工程师。使用场景及目标：适用于希望深入了解西门子S7-1200博图平台及其SCL语言编程特点的学习者；旨在帮助读者掌握3轴伺服系统的具体实现方法，提高实际项目中的编程能力。其他说明：文中提供的代码示例和设计理念不仅有助于理解和学习，还能直接应用于类似的实际工程项目中。

MATLAB仿真：非线性滤波器在水下长基线定位(LBL)系统的应用与比较: 内容概要：本文详细探讨了五种非线性滤波器（卡尔曼滤波(KF)、扩展卡尔曼滤波(EKF)、无迹卡尔曼滤波(UKF)、粒子滤波(PF)和变维卡尔曼滤波(VDKF)）在水下长基线定位（LBL）系统中的应用。通过对每种滤波器的具体实现进行MATLAB代码展示，分析了它们在不同条件下的优缺点。例如，KF适用于线性系统但在非线性环境中失效；EKF通过雅可比矩阵线性化处理非线性问题，但在剧烈机动时表现不佳；UKF利用sigma点处理非线性，精度较高但计算量大；PF采用蒙特卡罗方法，鲁棒性强但计算耗时；VDKF能够动态调整状态维度，适合信标数量变化的场景。适合人群：从事水下机器人(AUV)导航研究的技术人员、研究生以及对非线性滤波感兴趣的科研工作者。使用场景及目标：①理解各种非线性滤波器的工作原理及其在水下定位中的具体应用；②评估不同滤波器在特定条件下的性能，以便为实际项目选择合适的滤波器；③掌握MATLAB实现非线性滤波器的方法和技术。其他说明：文中提供了详细的MATLAB代码片段，帮助读者更好地理解和实现这些滤波器。此外，还讨论了数值稳定性问题和一些实用技巧，如Cholesky分解失败的处理方法。

VMware-workstation-full-14.1.3-9474260: VMware-workstation-full-14.1.3-9474260

DeepSeek系列-提示词工程和落地场景.pdf: DeepSeek系列-提示词工程和落地场景.pdf

javaSE阶段面试题: javaSE阶段面试题

《综合布线施工技术》第5章-综合布线工程测试.ppt: 《综合布线施工技术》第5章-综合布线工程测试.ppt

安川机器人NX100使用说明书.pdf: 安川机器人NX100使用说明书.pdf

S7-1200 PLC改造M7120平面磨床电气控制系统：IO分配、梯形图设计及组态画面实现: 内容概要：本文详细介绍了将M7120型平面磨床的传统继电器控制系统升级为基于西门子S7-1200 PLC的自动化控制系统的过程。主要内容涵盖IO分配、梯形图设计和组态画面实现。通过合理的IO分配，确保了系统的可靠性和可维护性；梯形图设计实现了主控制逻辑、砂轮升降控制和报警逻辑等功能；组态画面则提供了友好的人机交互界面，便于操作和监控。此次改造显著提高了设备的自动化水平、运行效率和可靠性，降低了维护成本。适合人群：从事工业自动化领域的工程师和技术人员，尤其是熟悉PLC编程和控制系统设计的专业人士。使用场景及目标：适用于需要进行老旧设备升级改造的企业，旨在提高生产设备的自动化水平和可靠性，降低故障率和维护成本。具体应用场景包括但不限于金属加工行业中的平面磨床等设备的控制系统改造。其他说明：文中还分享了一些实际调试中的经验和技巧，如急停逻辑的设计、信号抖动的处理方法等，有助于读者在类似项目中借鉴和应用。

chromedriver-linux64-136.0.7103.48.zip: chromedriver-linux64-136.0.7103.48.zip

IMG_20250421_180507.jpg: IMG_20250421_180507.jpg

《网络营销策划实务》项目一-网络营销策划认知.ppt: 《网络营销策划实务》项目一-网络营销策划认知.ppt

Lianantech_Security-Vulnerabil_1744433229.zip: Lianantech_Security-Vulnerabil_1744433229

MybatisCodeHelperNew2019.1-2023.1-3.4.1.zip: MybatisCodeHelperNew2019.1-2023.1-3.4.1

《Approaching(Almost)any machine learning problem》中文版第13章（最后一章）: 【深度学习部署】基于Docker的BERT模型训练与API服务部署：实现代码复用与模型共享

火车票订票系统设计与实现(代码+数据库+LW): 摘要传统办法管理信息首先需要花费的时间比较多，其次数据出错率比较高，而且对错误的数据进行更改也比较困难，最后，检索数据费事费力。因此，在计算机上安装火车票订票系统软件来发挥其高效地信息处理的作用，可以规范信息管理流程，让管理工作可以系统化和程序化，同时，火车票订票系统的有效运用可以帮助管理人员准确快速地处理信息。火车票订票系统在对开发工具的选择上也很慎重，为了便于开发实现，选择的开发工具为Eclipse，选择的数据库工具为Mysql。以此搭建开发环境实现火车票订票系统的功能。其中管理员管理用户，新闻公告。火车票订票系统是一款运用软件开发技术设计实现的应用系统，在信息处理上可以达到快速的目的，不管是针对数据添加，数据维护和统计，以及数据查询等处理要求，火车票订票系统都可以轻松应对。关键词：火车票订票系统；SpringBoot框架，系统分析，数据库设计

【ABB机器人】-00标准保养简介.pdf: 【ABB机器人】-00标准保养简介.pdf

最新校园跑腿小程序源码多校版本多模块适合跑腿外卖表白二手快递等校园服务.zip: 最新校园跑腿小程序源码多校版本，多模块，适合跑腿，外卖，表白，二手，快递等校园服务此版本为独立版本，不需要微擎直接放入就可以需要自己准备好后台的服务器，已认证的小程序，备案的域名!

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

使用Weka对股票数据进行分析

评论

发表评论

相关推荐

招！招！招！

基于Grails 2.3.4的多模板Scaffolding实现

2013.05的Grails新书: Programming Grails下载

Groovy调用Weka生成决策树

Groovy 生产项目的一些应用心得

借助动态Closure实现规则引擎

一个容易犯的Groovy小错误

如何在Grails插件中更新主项目的配置

基于Grails 1.3.7和extjs 3.4.0的模板框架(附源代码)

Grails 1.3.7文档(chm)

创建Grails的中文拼音转换服务

小试Orange的数据挖掘-"决策树生成"功能

小试Orange的数据挖掘功能

股价分析程序(纯DEMO)

最近访客更多访客>>