使用scikit-learn生成训练数据刘立博的代码

import matplotlib.pyplot as plt
import numpy as np
from sklearn.datasets.samples_generator import make_blobs
from sklearn.datasets.samples_generator import make_blobs

#定义4个质点的位置

centers = [(-2, -2), (-2, 1.5), (1.5, -2), (2, 1.5)]

#传入质点,生成训练数据

data, features = make_blobs (n_samples=200, centers=centers, n_features = 2, cluster_std=0.8, shuffle=False, random_state=42)
 
 
sklearn.datasets.make_blobs(n_samples=100, n_features=2,centers=3, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None)[source]

其中：

n_samples是待生成的样本的总数。

n_features是每个样本的特征数。

centers表示类别数。

cluster_std表示每个类别的方差，例如我们希望生成2类数据，其中一类比另一类具有更大的方差，可以将cluster_std设置为[1.0,3.0]。

print(data)

#使用matplotlib画出质点和训练数据

fig, ax = plt.subplots()
ax.scatter(np.asarray(centers).transpose()[0], np.asarray(centers).transpose()[1], marker = 'o', s = 250)
ax.scatter(data.transpose()[0], data.transpose()[1], marker = 'o', s = 100, c = features, cmap=plt.cm.coolwarm )
plt.show()

matplotlib.pyplot.subplots(nrows=1, ncols=1, sharex=False, sharey=False, squeeze=True, subplot_kw=None, gridspec_kw=None, **fig_kw)

创建一个画像(figure)和一组子图(subplots)。

这个实用程序包装器可以方便地在单个调用中创建子图的公共布局，包括封闭的图形对象。

输入参数说明：

nrows,ncols：整型，可选参数，默认为1。表示子图网格(grid)的行数与列数。

sharex,sharey：布尔值或者{‘none’,’all’,’row’,’col’}，默认：False

控制x(sharex)或y(sharey)轴之间的属性共享：

1.True或者’all’：x或y轴属性将在所有子图(subplots)中共享.

2.False或’none’：每个子图的x或y轴都是独立的部分

3.’row’：每个子图在一个x或y轴共享行(row)

4.’col’:每个子图在一个x或y轴共享列(column)

当子图在x轴有一个共享列时(‘col’),只有底部子图的x tick标记是可视的。

同理，当子图在y轴有一个共享行时(‘row’),只有第一列子图的y tick标记是可视的。

squeeze：布尔类型，可选参数，默认：True。

* 如果是True，额外的维度从返回的Axes(轴)对象中挤出。

》如果只有一个子图被构建(nrows=ncols=1)，结果是单个Axes对象作为标量被返回。

》对于N*1或1*N个子图，返回一个1维数组。

》对于N*M，N>1和M>1返回一个2维数组。

*如果是False，不进行挤压操作：返回一个元素为Axes实例的2维数组，即使它最终是1×1。

subplot_kw:字典类型，可选参数。把字典的关键字传递给add_subplot()来创建每个子图。

gridspec_kw字典类型，可选参数。把字典的关键字传递给GridSpec构造函数创建子图放在网格里(grid)。

**fig_kw：把所有详细的关键字参数传给figure()函数

返回结果：

fig：matplotlib.figure.Figure对象

ax：Axes(轴)对象或Axes(轴)对象数组。