`

利用Python四步掌握机器学习

 
阅读更多

转载:http://python.jobbole.com/84326/

 

为了理解和应用机器学习技术,你需要学习 Python 或者 R。这两者都是与 C、Java、PHP 相类似的编程语言。但是,因为 Python 与 R 都比较年轻,而且更加“远离”CPU,所以它们显得简单一些。相对于R 只用于处理数据,使用例如机器学习、统计算法和漂亮的绘图分析数据, Pthon 的优势在于它适用于许多其他的问题。因为 Python 拥有更广阔的分布(使用 Jango 托管网站,自然语言处理 NLP,访问 Twitter、Linkedin 等网站的 API),同时类似于更多的传统语言,比如 C python 就比较流行。

在Python中学习机器学习的四个步骤

1、首先你要使用书籍、课程、视频来学习 Python 的基础知识

2、然后你必需掌握不同的模块,比如 Pandas、Numpy、Matplotlib、NLP (自然语言处理),来处理、清理、绘图和理解数据。

3、接着你必需能够从网页抓取数据,无论是通过网站API,还是网页抓取模块Beautiful Soap。通过网页抓取可以收集数据,应用于机器学习算法。

4、最后一步,你必需学习机器学习工具,比如 Scikit-Learn,或者在抓取的数据中执行机器学习算法(ML-algorithm)。

1.Python入门指南:

有一个简单而快速学习Python的方法,是在 codecademy.com  注册,然后开始编程,并学习 Python 基础知识。另一个学习Python的经典方法是通过 learnpythonthehardway ,一个为广大 Python 编程者所推荐的网站。然后还有一个优秀的 PDF, byte of python 。python社团还为初学者准备了一个Python资源列表list of python resources。同时,还有来自 O’Reilley 的书籍 《Think Python》,也可以从这里免费下载 。最后一个资源是 Python 用于计量经济学、统计学和数据分析的介绍:《Introduction to Python for Econometrics, Statistics and Data Analysis 》,其中也包含了 Python 的基础知识。

2.机器学习的重要模块

关于机器学习最重要的模块是:NumPyPandasMatplotlib 和 IPython 。有一本书涵盖了其中一些模块:《Data Analysis with Open Source Tools》 。然后来自于1.的免费书籍《Introduction to Python for Econometrics, Statistics and Data Analysis》,同时也包括 Numpy,Pandas,Matplotlib 和 IPython这几个模块。还有一个资源是 Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython,也包含了一些很重要的模块。以下是其他免费模块的相关链接: Numpy (Numerical PythonNumpy UserguideGuide to NumPy),  Pandas (Pandas, Powerful Python Data Analysis ToolkitPractical Business PythonIntros to Pandas Data Structure)  和  Matplotlib books

其它资源:

3.从网站通过API挖掘和抓取数据

一旦理解了Python的基础知识和最重要的模块,你必需要学习如何从不同的源收集数据。这个技术也被称作网页抓取。传统的源是网站文本,通过API进入twitter或linkedin一类网站得到的文本数据。网页抓取方面的优秀书籍包括:《 Mining the Social Web》 (免费书籍),《Web Scraping with Python》 和《 Web Scraping with Python: Collecting Data from the Modern Web》。

最后这个文本数据必须要转换为数值数据,通过自然语言处理(NLP)技术完成, Natural language processing with Python 和 Natural Language Annotation for Machine Learning 上面有相应的资料。其它的数据包括图片和视频,可以使用计算机图像技术分析: Programming Computer Vision with PythonProgramming Computer Vision with Python: Tools and algorithms for analyzing images  和  Practical Python and OpenCV ,这些是图片分析方面的典型资源。

以下例子中包括可以用基本的Python命令行实现,有教育意义,而且有趣的例子,以及网页抓取技术。

4. Python 中的机器学习

机器学习可以分为四组:分类,聚类,回归和降维。


分类”也可以称作监督学习,有助于分类图片,用来识别图片中的特征或脸型,或者通过用户外形来分类用户,并给他赋不同的分数值。“聚类”发生在无监督学习的情况,允许用户在数据中识别组/集群。“回归”允许通过参数集估算一个值,可以应用于预测住宅、公寓或汽车的最优价格。

modules, packages and techniques 罗列了 Python、C、Scala、Java、Julia、MATLAB、Go、R 和 Ruby等语言中所有学习机器学习的重要模块、包和技巧。有关Python机器学习的书籍,我特别推荐《Machine learning in action》。尽管有点短,但它很可能是机器学习中的经典,因为它提到了“集体智慧编程时代”:Programming Collective Intelligence。这两本书帮助你通过抓取数据建立机器学习。最近关于机器学习的出版物大多都是基于模块 scikit-learn 。由于所有的算法在模块中都已实现,使得机器学习非常简单。你唯一要做的事就是告诉 Python ,应该使用哪一个机器学习技巧 (ML-technique) 来分析数据。

免费的 scikit-learn教程 可以在 scikit-learn 官方网站上找到。其他的帖子可以通过以下链接获取:

关于机器学习和 Python 中模块 scikit-learn 的书籍:

接下来数月将要发行的书籍包括:

机器学习相关的课程和博客

你想要得到一个学位,加入在线课程,或者参加线下讲习班、大本营或大学课程么?这里有一些关于逻辑分析、大数据、数据挖掘和数据科学的在线教育站点链接:Collection of links 。另外推荐一些在线课程–来自Udacity的Coursera 课程:machine learning  和 Data Analyst Nanodegree。还有一些关于机器学习的博客列表:List of frequently updated blogs

最后是来自 Jake Vanderplas 和 Olivier Grisel,关于探索机器学习的优秀 youtube 视频课程

机器学习理论

想要学习机器学习的理论?那么,《The Elements of statistical Learning》和《 Introduction to Statistical Learning》 是常常被引用的经典。然后还有另外两本书籍:《Introduction to machine learning 》和《 A Course in Machine Learning》。这些链接包括免费的PDF,你不需要付费!如果不想阅读这些书籍,请观看视频:15 hours theory of machine learning

 


 

  • 大小: 116 KB
分享到:
评论

相关推荐

    python机器学习教程-从零开始掌握Python机器学习:十四步教程.pdf

    在开始机器学习之旅之前,首先需要掌握Python的基础编程技能。这包括理解变量、数据类型、控制结构(如if-else,for,while循环)、函数、类和对象等概念。对于初学者,可以通过"Learn Python the Hard Way"这样的...

    Python3数据分析与机器学习实战——随书PPT

    第11章《网络爬虫》则讲解了如何利用Python抓取互联网上的数据,这对于获取大规模数据集进行分析具有重要意义。 第16章《回归分析问题》讨论了回归模型,如线性回归和岭回归,这些模型常用于预测连续变量,是数据...

    Python-利用TensorFlow学习机器学习

    本教程“Python-利用TensorFlow学习机器学习”旨在帮助初学者掌握如何使用Python和TensorFlow进行机器学习实践。 首先,了解Python基础是必要的,包括数据类型、控制结构、函数和类等概念。Python以其简洁的语法和...

    Python3机器学习实战教程.zip

    《Python3机器学习实战教程》是一份深度剖析...通过这些教程,读者不仅能够掌握机器学习的基础知识,还能在Python3环境下进行实战操作,从而提升自己的机器学习技能,无论是入门学习还是进阶提升,都是极好的参考资料。

    手把手教你使用Python实现机器学习算法.pdf

    本文“手把手教你使用Python实现机器学习算法”将引导初学者逐步掌握如何利用Python进行机器学习实践。 首先,我们关注的库是`scikit-learn`(简称sklearn),这是一个强大的机器学习库,提供了各种预处理、模型...

    吴恩达机器学习作业Python

    总之,“吴恩达机器学习作业Python”资源包是一个全面的实践平台,它将理论与实践相结合,使学习者能够在实际操作中掌握机器学习的关键技术。无论你是初学者还是有一定基础的开发者,这个资源都能帮助你提升技能,更...

    深入浅出Python机器学习.pdf

    在机器学习领域,了解和掌握有监督学习与无监督学习是至关重要的。有监督学习是建立在已知训练数据集的基础上,通过学习样本的特征变量和对应的分类标签来构建模型。这些模型可以用于对新的、未知数据进行分类或回归...

    Python机器学习编程与实战_PPT课件.rar

    《Python机器学习编程与实战》课程的PPT课件涵盖了从Python基础知识到机器学习实践的广泛内容,旨在帮助学习者掌握Python在数据处理和机器学习领域的应用。以下是对每个章节主要内容的详细阐述: 1. **第1章 Python...

    Python数据分析与机器学习-Pandas

    "Python数据分析与机器学习-Pandas"的主题着重于利用Pandas进行数据清洗、预处理以及构建机器学习模型的基础。 Pandas的核心数据结构包括Series(一维数组)和DataFrame(二维表格型数据结构)。Series类似于带标签...

    Python与机器学习实战

    通过学习《Python与机器学习实战》,无论是初学者还是有一定经验的数据科学家,都能掌握如何利用Python进行有效的机器学习实践,进一步提升数据分析和预测的能力。通过实际动手操作,可以加深对机器学习算法的理解,...

    Python机器学习基础教程.docx

    Python 机器学习基础教程 本教程主要涵盖机器学习的基础概念、Python 语言基础和机器学习...本教程旨在帮助读者快速入门机器学习领域,掌握 Python 语言基础和机器学习算法的实现,提高自己的技术能力和实践应用能力。

    python 机器学习实验报告

    总的来说,这个实验报告提供了丰富的实践经验,帮助学生深入理解机器学习的基础模型,并掌握其在实际问题中的应用。通过这样的实验,学生不仅可以提升编程技能,还能提高数据分析和模型选择的能力。

    Python-Python在线机器学习库

    在Python编程语言中,机器学习库的丰富多样是其在数据科学领域广泛应用的重要原因。"Python-Python在线机器学习库"这一主题聚焦于那些支持在线(或流式)机器学习的Python库。在线机器学习是一种处理数据流的方法,...

    Python机器学习教程.docx

    在深入探讨Python机器学习之前...总之,Python机器学习是一个涵盖广泛领域的实践过程,需要不断学习和实践,才能掌握其中的精髓。通过上述步骤,你可以逐步建立起对Python机器学习的理解,并逐步成为一名熟练的实践者。

    人工智能实践教程-从Python入门到机器学习邵一川-教学大纲-8页.doc

    《人工智能实践教程——从Python入门到机器学习》是一门针对通信工程、计算机、大数据、人工智能相关专业设计的专业基础课程,旨在让学生掌握Python编程基础知识,并具备独立开发Python简单项目的能力。课程涵盖...

    Python 机器学习代码

    对于初学者,理解这些基本概念和代码实现将有助于深入掌握机器学习。对于经验丰富的开发者,这些脚本可以作为快速实现特定任务的基础,或用于进一步优化和改进现有模型。总之,Python机器学习代码是数据科学项目中不...

    Python机器学习编程与实战教学教案01Python概述.pdf

    【Python机器学习编程与实战教学教案01Python概述】 Python是一种高级编程语言,...通过这个教案,学习者不仅会掌握Python语言的基本技能,还能了解到如何利用Python进行机器学习项目,为进一步深入学习打下坚实基础。

    ml.zip_ml python_python机器学习_机器学习 python_深度学习_深度学习 python

    本文将深入探讨基于Python的机器学习和深度学习基础知识,以及如何利用这些技术进行实际操作。 首先,我们来看"nnet.py",这可能是神经网络(Neural Network)的实现。神经网络是深度学习的核心组成部分,模仿人脑...

    用python实现几种机器学习算法.zip

    这个压缩包“用python实现几种机器学习算法.zip”很可能包含了几个示例项目,展示了如何利用Python来实现不同的机器学习模型。尽管没有具体的标签来指示这些算法的类型,我们可以根据通常在机器学习中使用的库和方法...

Global site tag (gtag.js) - Google Analytics