Numpy、Pandas、SciPy、Scikit-Learn、Matplotlib的关系以及学习资料

1. Numpy、Pandas、SciPy、Scikit-Learn、Matplotlib的关系

在这里插入图片描述

2. 安装方法

2.1 下载anaconda

官方网站在国外,所以我们下载安装文件速度很慢。
推荐到清华镜像下载anaconda,网速很快。
清华大学开源软件镜像站:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/

具体安装操作可以参考下面这个博客:
Google机器学习(一) 安装Anaconda以及Scikit-learn等必备库
https://blog.csdn.net/tz_zs/article/details/73459800)

对于没有安装过 NumPy、 SciPy等各种库的新手来说,最简单的方法是使用Anaconda软件(强烈推荐)
Anaconda软件中包含了Numpy、Scipy、pandas、Scikit-learn等常用的数据分析包。

2.2 配置anaconda仓库的镜像

清华大学开源软件镜像站提供了 Anaconda 仓库的镜像,貌似还就只有这一家

地址:http://mirrors.tuna.tsinghua.edu.cn/help/anaconda/

打开Anaconda Prompt,输入以下命令即可添加

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes

3. 学习资料

3.1. Python的学习资料

a.廖雪峰python学习笔记
https://blog.csdn.net/datawhale/article/category/7779959

b.python入门笔记
作者李金,这个是jupyter notebook文件,把python的主要语法演示了一次,值得推荐。下载链接:
https://pan.baidu.com/s/1IPZI5rygbIh5R5OuTHajzA 提取码: 2bzh

c.代码规范:
https://zhuanlan.zhihu.com/p/59763076

3.2. Numpy的学习资料

a. NumPy 教程 | 菜鸟教程
https://www.runoob.com/numpy/numpy-tutorial.html

b. numpy练习题:
https://zhuanlan.zhihu.com/p/57872490

c. 实战经验:from-python-to-numpy
http://www.labri.fr/perso/nrougier/from-python-to-numpy/

d. Numpy中文文档
https://www.numpy.org.cn/index.html

3.3. Pandas的学习资料

a. Pandas教程
https://www.yiibai.com/pandas

b. Pandas练习题:
https://zhuanlan.zhihu.com/p/56644669

c. Pandas官网:
http://pandas.pydata.org/

3.4. scikit-learn 的学习资料

a.sklearn库的学习:
https://blog.csdn.net/u014248127/article/details/78885180
推荐理由:用一篇文章讲清楚了整个sklearn库的概貌,主要包括:
(1)sklearn官方文档的类容和结构;
(2)从机器学习重要步骤出发讲清楚sklearn的使用方法。

b. scikit-learn (sklearn) 官方文档中文版
http://sklearn.apachecn.org/#/

c. 官方网站:
https://scikit-learn.org/stable/
在这里插入图片描述

3.5. Matplotlib的学习资料

a. 简单入门
有这5小段代码在手,轻松实现数据可视化(Python+Matplotlib)
http://baijiahao.baidu.com/s?id=1598516679213415904&wfr=spider&for=pc
这张地图能指引你根据不同情况选择正确的可视化方法:
在这里插入图片描述

b. 对Numpy格式的数据进行可视化
https://www.runoob.com/numpy/numpy-matplotlib.html

c. Matplotlib的详细实例
中文版本:https://liam.page/2014/09/11/matplotlib-tutorial-zh-cn/
英文版本:https://github.com/rougier/matplotlib-tutorial

d. Ten Simple Rules for Better Figures
https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1003833

4.学习路径

4.1 确定学习目的–>搜索相关资源–>制定学习计划

4.2 制定学习路径的原则:

(1)自顶向下,以实现某个机器学习算法为目的。
(2)从简单的算法入手,从模仿前辈的代码入手。
(3)动手,动手,动手写代码。

4.3 我的学习计划

学习目的:Scikit-Learn 实现快速实现某个简单的机器学习算法。
例如:使用Scikit-Learn 实现《机器学习实战》中第二章的K近邻算法,并用Matplotlib进行数据可视化。
关于《机器学习实战》,可以参考如下博客:
https://blog.csdn.net/u014410989/article/details/89182869

步骤1. 搭建环境
下载软件、
安装软件、
配置环境、
下载文档、
下载示例代码

步骤2. 理解《机器学习实战》中给出的算法原理和Python程序

步骤3. 选择Scikit教程中一个类似的示例
阅读3.4.a.sklearn库的学习
找到K近邻算法的示例。

步骤4. 模仿Scikit示例和《机器学习实战》,使用Scikit-Learn 编写程序

步骤5. 使用Matplotlib进行数据可视化

步骤6. 尝试使用Scikit实现《机器学习实战》中的其它算法,例如决策树算法。

步骤7. 尝试3.5.a中的5种Matplotlib绘图方法

步骤8. 详细阅读 3.5.d Ten Simple Rules for Better Figures

步骤9. 快速浏览 3.2.a NumPy 教程 | 菜鸟教程,认真完成 3.2.b numpy练习题

步骤10. 参考3.1.b,在jupyter notebook中通过修改代码,掌握Python的主要语法

版权声明:本文为u014410989原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/u014410989/article/details/89947128

智能推荐

python数据分析相关扩展库用法(包括Numpy、Scipy、Matplotlib、Pandas)

实验二、python数据分析相关扩展库 一、实验目的 1. 掌握python的数据分析相关的主要扩展库的用法,包括Numpy、Scipy、Matplotlib、Pandas等。 二、实验工具: 1. Anaconda 2. Numpy,matplotlib,scipy,pandas 三、能力图谱 四、内容简介 四、实验内容 1. 数组的创建(创建全0数组,全1数组,随机数数组) 2. 数组的属性(...

Python实训Day04-初识Pandas以及与Numpy的关系

Pandas库的引用 Pandas:Python的第三方库,提供高性能易用数据类型和分析工具,有Series 、DataFrame 和Panel三种对象。 经常使用的包括Siries和DataFrame两种操作对象: 操作对象 介绍 Siries 索引+一维数据 DataFrame 行列索引+二维数据 Siries是一维数据,其索引可以是用户自定义的字符或数字,也可以没有索引,默认使用从零开始的序...

Numpy、Pandas、Matplotlib的简单使用

1.Numpy Numpy:提供了一个在Python中做科学计算的基础库,重在数值计算,主要用于多维数组(矩阵)处理的库。用来存储和处理大型矩阵,比Python自身的嵌套列表结构要高效的多。本身是由C语言开发,是个很基础的扩展,Python其余的科学计算扩展大部分都是以此为基础。 1.1 创建数组 NumPy数组是一个多维的数组对象(矩阵),称为ndarray,具有矢量算术运算能力和复杂的广播能力...

python中numpy、pandas、matplotlib的使用

python中numpy、pandas、matplotlib的使用 文章目录 python中numpy、pandas、matplotlib的使用 numpy 生成数组(矩阵) 基本运算操作 索引操作 array合并 array分割 numpy copy & deep copy 补充 pandas 了解Series DataFrame DataFrame描述信息 统计方法和字符串离散化 数据...

机器学习python环境安装(Pycharm,python,pip,scipy,numpy,matplotlib,scikit-learning)

机器学习准备工作 第一步、安装PyCharm pyCharm是一款IDE,这是博主初学所用软件。 下载地址:http://www.jetbrains.com/pycharm/ (社区版够用) 第二步:安装python python是机器学习方面最主要语言。 下载地址:http://www.python.org 安装环境时候需要添加环境变量。 安装结束cmd查看版本 第三步:安装scipy,nump...

猜你喜欢

layer弹出层的简单使用

一、layer的icon样式 以上样式测试代码: [javascript] view plain copy layer.confirm(‘icon测试’, {icon: 1, title:‘提示’}, function(index){     //do...

Nginx 解析漏洞复现

漏洞环境搭建 时间有限,漏洞环境搭建教程简单,在此不再赘述。 具体项目地址:https://github.com/vulhub/vulhub 搭建教程及说明可参考:https://vulhub.org/ -还是挺简单的- Nginx 解析漏洞复现步骤如下: 靶机环境 由此可知,该漏洞与Nginx、php版本无关,属于用户配置不当造成的解析漏洞。 启动环境 复现 1). 访问 http://IP/u...

ArrayList 源码解析(JDK1.7)

ArrayList 源码解析(JDK1.7) ps: 我思考了一下…想要不要发这篇博客… 感觉作为一个初学者…发这种源码解析… 尤其当做学习记录这样的东西来做…感觉没有任何的重点可言… 不过思考了一下…反正估计也没人看 (狗头) 就发了吧 纯属个人 … emmm 萌新的学习经历- - 大...

GDB随笔(一)

在编译的时候必须加上-g,生成的目标文件才能够进行调试。(我们调试的是目标文件) -g选项的作用是在目标文件中加入源代码的信息,保证gdb能找到源文件。 -o选项,相当于指定一个文件作为目标文件。 可以做一个实验:由main.c生成main(-g),然后将m**在目标文件中加入源代码的信息,保证gdb能找到源文件。ain.c改成其他名字,然后调用gdb main,就会发现对gdb使用命令(list...

tensorboard报No dashboards are active for the current data set

遇到这个错误,通过两步可以解决这个问题 一、检查所指定的目录下是否存在event文件 类似于上面箭头所指的文件,并不需要所指定的目录为event的上一级目录,比如像下面这种情况 在启动tensorboard的时候,指定到log目录就行了,命令如下 二、确定logdir的路径是否正确 我们在确定event文件确实存在之后,还需要确定logdir的路径是否正确,因为logdir的路径中不能包含中文、空...