|
|
@ -0,0 +1,63 @@ |
|
|
|
import os |
|
|
|
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2' |
|
|
|
|
|
|
|
import tensorflow as tf |
|
|
|
|
|
|
|
from numpy.random import RandomState |
|
|
|
|
|
|
|
#定义训练数据的batch的大小 |
|
|
|
batch_size = 8 |
|
|
|
|
|
|
|
#定义神经网络的参数 |
|
|
|
w1 = tf.Variable(tf.random_normal([2, 3], stddev=1, seed=1)) |
|
|
|
w2 = tf.Variable(tf.random_normal([3, 1], stddev=1, seed=1)) |
|
|
|
|
|
|
|
#在shape的一个维度上使用None可以方便的使用不同的batch大小,在训练时需要把数据分成较小的batch, 但是在测试时,可以一次性使用全部的数据, |
|
|
|
# 但数据集比较小时,这样比较方便测试,但数据集比较大时,将大量的数据放入一个batch可能会导致内存溢出 |
|
|
|
x = tf.placeholder(tf.float32, shape=(None, 2), name="x-input") |
|
|
|
y_ = tf.placeholder(tf.float32, shape=(None, 1), name="y-input") |
|
|
|
|
|
|
|
#定义神经网络的前向传播算法 |
|
|
|
a = tf.matmul(x, w1) |
|
|
|
y = tf.matmul(a, w2) |
|
|
|
|
|
|
|
#定义损失函数和反向传播算法 |
|
|
|
y = tf.sigmoid(y) |
|
|
|
cross_entropy = -tf.reduce_mean(y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0)) + (1-y_) * tf.log(tf.clip_by_value(1-y, 1e-10, 1.0))) |
|
|
|
train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy) |
|
|
|
|
|
|
|
#通过一个随机数生成一个模拟数据集 |
|
|
|
rdm = RandomState(1) |
|
|
|
dataset_size = 128 |
|
|
|
X = rdm.rand(dataset_size, 2) |
|
|
|
##定义规则来给出样本的标签,在这里所有x1 + x2 < 1 的样例都被认为是正样本(比如零件合格),而其他则为负样本(比如零件不合格) |
|
|
|
##和TensorFlow游乐场中的表示法不一样的地方是,在这里使用0来表示负样本,1来表示正样本,大部分解决分类问题的神经网络都会采用0和1的表示方法 |
|
|
|
Y = [[int(x1+x2 < 1)] for (x1, x2) in X] |
|
|
|
|
|
|
|
#创建一个回话来运行TensorFlow 程序 |
|
|
|
with tf.Session() as sess: |
|
|
|
init_op = tf.global_variables_initializer() |
|
|
|
#初始化变量 |
|
|
|
sess.run(init_op) |
|
|
|
|
|
|
|
print("weights before training:") |
|
|
|
print(sess.run(w1)) |
|
|
|
print(sess.run(w2)) |
|
|
|
|
|
|
|
#设定训练的轮数 |
|
|
|
STEPS = 5000 |
|
|
|
for i in range(STEPS): |
|
|
|
#每次选取batch_size个样本进行训练 |
|
|
|
start = (i * batch_size) % dataset_size |
|
|
|
end = min(start+batch_size, dataset_size) |
|
|
|
|
|
|
|
#通过选取的样本量训练神经网络并更新参数 |
|
|
|
sess.run(train_step, feed_dict={x: X[start:end], y_: Y[start:end]}) |
|
|
|
if i % 1000 == 0: |
|
|
|
total_cross_entropy = sess.run(cross_entropy, feed_dict={x: X, y_: Y}) |
|
|
|
print("After %d training step(s), cross entropy on all data is %g" % (i, total_cross_entropy)) |
|
|
|
|
|
|
|
#训练之后神经网络的参数 |
|
|
|
print("weights after training:") |
|
|
|
print(sess.run(w1)) |
|
|
|
print(sess.run(w2)) |