使用scikit-learn生成训练数据

import matplotlib.pyplot as plt
import numpy as np
from sklearn.datasets.samples_generator import make_blobs
from sklearn.datasets.samples_generator import make_blobs
#定义4个质点的位置

centers = [(-2, -2), (-2, 1.5), (1.5, -2), (2, 1.5)]
#传入质点,生成训练数据

data, features = make_blobs (n_samples=200, centers=centers, n_features = 2, cluster_std=0.8, shuffle=False, random_state=42)
 
 
sklearn.datasets.make_blobs(n_samples=100, n_features=2,centers=3, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None)[source]
其中:
n_samples是待生成的样本的总数。
n_features是每个样本的特征数。
centers表示类别数。
        cluster_std表示每个类别的方差,例如我们希望生成2类数据,其中一类比另一类具有更大的方差,可以将cluster_std设置为[1.0,3.0]。

print(data)
#使用matplotlib画出质点和训练数据

fig, ax = plt.subplots()
ax.scatter(np.asarray(centers).transpose()[0], np.asarray(centers).transpose()[1], marker = 'o', s = 250)
ax.scatter(data.transpose()[0], data.transpose()[1], marker = 'o', s = 100, c = features, cmap=plt.cm.coolwarm )
plt.show()
matplotlib.pyplot.subplots(nrows=1, ncols=1, sharex=False, sharey=False, squeeze=True, subplot_kw=None, gridspec_kw=None, **fig_kw)
创建一个画像(figure)和一组子图(subplots)。
这个实用程序包装器可以方便地在单个调用中创建子图的公共布局,包括封闭的图形对象。
输入参数说明:
nrows,ncols:整型,可选参数,默认为1。表示子图网格(grid)的行数与列数。
sharex,sharey:布尔值或者{‘none’,’all’,’row’,’col’},默认:False
控制x(sharex)或y(sharey)轴之间的属性共享:
1.True或者’all’:x或y轴属性将在所有子图(subplots)中共享.
2.False或’none’:每个子图的x或y轴都是独立的部分
3.’row’:每个子图在一个x或y轴共享行(row)
4.’col’:每个子图在一个x或y轴共享列(column)
当子图在x轴有一个共享列时(‘col’),只有底部子图的x tick标记是可视的。
同理,当子图在y轴有一个共享行时(‘row’),只有第一列子图的y tick标记是可视的。
squeeze:布尔类型,可选参数,默认:True。
* 如果是True,额外的维度从返回的Axes(轴)对象中挤出。
》如果只有一个子图被构建(nrows=ncols=1),结果是单个Axes对象作为标量被返回。
》对于N*1或1*N个子图,返回一个1维数组。
》对于N*M,N>1和M>1返回一个2维数组。
*如果是False,不进行挤压操作:返回一个元素为Axes实例的2维数组,即使它最终是1×1。
subplot_kw:字典类型,可选参数。把字典的关键字传递给add_subplot()来创建每个子图。
gridspec_kw字典类型,可选参数。把字典的关键字传递给GridSpec构造函数创建子图放在网格里(grid)。
**fig_kw:把所有详细的关键字参数传给figure()函数
返回结果:
fig:matplotlib.figure.Figure对象
ax:Axes(轴)对象或Axes(轴)对象数组。