1、准备数据
0 1:59 2:2 3:43.4 4:2 5:1 0 1:36 2:1 3:57.2 4:1 5:1 0 1:61 2:2 3:190 4:2 5:1 1 1:58 2:3 3:128 4:4 5:3 1 1:55 2:3 3:80 4:3 5:4 0 1:61 2:1 3:94.4 4:2 0 1:38 2:1 3:76 4:1 5:1 0 1:42 2:1 3:240 4:3 5:2 0 1:50 2:1 3:74 4:1 5:1 0 1:58 2:3 3:68.6 4:2 5:2 0 1:68 2:3 3:132.8 4:4 5:2 1 1:25 2:2 3:94.6 4:4 5:3 0 1:52 2:1 3:56 4:1 5:1 0 1:31 2:1 3:47.8 4:2 5:1 1 1:36 2:3 3:31.6 4:3 5:1 0 1:42 2:1 3:66.2 4:2 5:1 1 1:14 2:3 3:138.6 4:3 5:3 0 1:32 2:1 3:114 4:2 5:3 0 1:35 2:1 3:40.2 4:2 5:1 1 1:70 2:3 3:177.2 4:4 5:3 1 1:65 2:2 3:51.6 4:4 5:4 0 1:45 2:2 3:124 4:2 5:4 1 1:68 2:3 3:127.2 4:3 5:3 0 1:31 2:2 3:124.8 4:2 5:3
2、python算法
from sklearn import datasets # 读取文件 data = datasets.load_svmlight_file("../../wa.txt") x = data[0] y = data[1] # 切分数据 from sklearn.model_selection import train_test_split X_train, X_test, Y_train, Y_test =train_test_split(x,y, test_size=0.33, random_state=0) # 标准化数据 from sklearn.preprocessing import StandardScaler sc = StandardScaler(copy=False, with_mean=False, with_std=True) X_train = sc.fit_transform(X_train) X_test = sc.transform(X_test) # 训练模型 from sklearn.linear_model import LogisticRegression classifier = LogisticRegression() classifier.fit(X_train, Y_train) # 测试数据 Y_pred = classifier.predict(X_test) from sklearn.metrics import confusion_matrix from sklearn.metrics import classification_report cm = confusion_matrix(Y_test, Y_pred) print(cm) # print confusion_matrix print(classification_report(Y_test, Y_pred)) # print classification report
3、spark算法
package com.sunbin import org.apache.spark.ml.classification.LogisticRegression import org.apache.spark.mllib.classification.LogisticRegressionWithLBFGS import org.apache.spark.mllib.regression.LabeledPoint import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.mllib.util.MLUtils import org.apache.spark.rdd.RDD import org.apache.spark.sql.{SQLContext, SparkSession} import org.apache.log4j.{ Level, Logger } /** * 使用逻辑回归做胃癌 转移 分类 */ object LogisticRegressionTest { def main(args: Array[String]): Unit = { Logger.getRootLogger.setLevel(Level.WARN) val conf = new SparkConf().setMaster("local").setAppName("logistic") val sc = SparkSession.builder().config(conf).getOrCreate() /** * 标注点LabeledPoint是一种带有标签(Label/Response)的本地向量,它可以是稠密或者是稀疏的。 * 在MLlib中,标注点在监督学习算法中被使用。由于标签是用双精度浮点型来存储的,故标注点类型在回归 * (Regression)和分类(Classification)问题上均可使用。例如,对于二分类问题,则正样本的标签为1, * 负样本的标签为0,而对于多类别的分类问题来说,标签则应是一个以0开始的索引序列:0, 1, 2 ... */ val data:RDD[LabeledPoint] = MLUtils.loadLibSVMFile(sc.sparkContext,"wa.txt") //测试集和训练集并不一定按2:8的比例分 val splitData = data.randomSplit(Array(0.8,0.2),2L) val training=splitData(0).cache() val test=splitData(1) //建立LogisticRegressionWithLBFGS对象,设置分类数 3 ,run传入训练集开始训练,返回训练后的模型 val model = new LogisticRegressionWithLBFGS().setNumClasses(2).run(training) //使用训练后的模型对测试集进行测试,同时打印标签和测试结果 val predictionAndLabels = test.map { case LabeledPoint(label, features) => val prediction = model.predict(features) (prediction, label) } predictionAndLabels.foreach(println) } }
相关推荐
**Java实现逻辑回归算法(Logistic Regression)对Iris数据集分类** 在机器学习领域,逻辑回归是一种广泛应用的分类算法,尤其适用于二分类问题。它的基本思想是通过拟合一个Sigmoid函数来预测事件发生的概率。这里,...
机器学习应用-使用逻辑回归算法Logistic Regression实现信用卡欺诈检测项目源码+文档说明含有代码注释,新手也可看懂,个人手打98分项目,导师非常认可的高分项目,毕业设计、期末大作业和课程设计高分必看,下载...
基于逻辑回归算法对胃癌病人数据进行预测分类_代码+数据.基于逻辑回归算法对胃癌病人数据进行预测分类_代码+数据.基于逻辑回归算法对胃癌病人数据进行预测分类_代码+数据.基于逻辑回归算法对胃癌病人数据进行预测...
本资源使用基于Sklearn实现逻辑回归算法,同时提供了用于模型训练的数据集(信用卡数据集合),实现对是否存在信用卡欺诈行为进行检测。资源包括以下内容: 1、jupyter notebook程序源码 2、用于模型训练的数据集...
在电商大数据推荐系统的应用研究中,逻辑回归算法和关联规则推荐算法是比较重要的两种推荐算法。下面将从多个角度详细阐述这两种算法在电商推荐系统中的应用,以及各自的优势和局限性。 首先,逻辑回归算法是一种...
**深度学习逻辑回归算法** 深度学习中的逻辑回归(Logistic Regression)是一种广泛应用的二分类算法。它虽然名字中带有“回归”二字,但实际上是一种分类方法,尤其适合处理那些输出为离散值(如0或1)的问题。在...
这是搜狗做资深的机器学习工程师2014年自己写的逻辑回归,认识很到位,算法很清晰,实际运用讲解的很棒
逻辑回归是一种广泛应用于...总之,逻辑回归算法是一个强大的工具,尤其适用于处理二分类问题。通过本案例,我们可以深入理解逻辑回归的工作原理,学习如何在实际问题中运用这一方法,以及如何评估和改进模型的性能。
文章首先介绍了数据挖掘的一般流程,然后重点阐述了逻辑回归算法,并通过RapidMiner平台进行仿真实验,使用逻辑回归算法建模,并引入贝叶斯算法进行对比实验,最终应用于测试数据集以成功预测贫困生。 2. 数据挖掘...
**逻辑回归算法原理推导** 逻辑回归是一种广泛应用的统计学分类方法,它的全名是逻辑函数回归,因为其预测结果是通过一个S型的逻辑函数(sigmoid函数)来实现的。在机器学习领域,逻辑回归常用于二分类问题,比如...
**逻辑回归** 逻辑回归是一种广泛应用于分类问题的统计学习方法,尤其在二分类问题中表现突出。尽管其名称中包含“回归”,但实际上它用于解决离散的分类问题,而非连续的回归问题。逻辑回归通过一个非线性的...
《机器学习》算法实例——逻辑回归与梯度上升算法 逻辑回归(Logistic Regression)是机器学习中一种广泛应用的分类算法。它虽然名字中含有“回归”,但实际上是一种分类方法,尤其适用于处理二分类问题。在本实例...
logistic/sigmoid函数作用:把取值范围从负无穷到正无穷的公式计算结果,...逻辑回归算法用于估计预测目标的可能性,它属于软分类算法,即最终得到的是一个具体的概率,而不仅仅是“是”或“不是”这样的二分类结果;
标题中的“机器学习 LR逻辑回归算法”指的是在机器学习领域广泛应用的一种分类算法——逻辑回归(Logistic Regression)。逻辑回归虽然名字中含有“回归”,但实际上它是一种二分类或多元分类的模型,尤其适合处理...
逻辑回归算法是被广泛应用的分类算法之一。但是,传统的逻辑回归算法没有考虑预测错误代价,将不同的预测视为同等成本代价,会一定程度上影响算法的预测精度。文章提出了基于成本代价的逻辑回归算法,该算法考虑了预测...
机器学习应用实例-使用逻辑回归算法(Logistic Regression)实现信用卡欺诈检测项目源码+文档说明,含有代码注释,新手也可看懂,个人手打98分项目,导师非常认可的高分项目,毕业设计、期末大作业和课程设计高分必...
### 逻辑回归算法的核心知识点 #### 一、逻辑回归算法概览 逻辑回归(Logistic Regression)虽然名字中带有“回归”二字,但实际上它是一种常用的分类算法,主要用于解决二分类问题,即输出结果只有两类(通常标记...
基于机器学习逻辑回归算法的乳腺癌预测python源码+数据集+详细注释.zip基于机器学习逻辑回归算法的乳腺癌预测python源码+数据集+详细注释.zip基于机器学习逻辑回归算法的乳腺癌预测python源码+数据集+详细注释.zip...
回归算法是机器学习领域中的基础方法,用于预测连续数值型数据。C++作为一门强大的编程语言,被广泛应用于科学计算和高性能计算,因此在实现回归算法时,C++提供了高效和灵活的选择。本主题主要围绕两个核心概念展开...