텐써플로우 첫걸음 이라는 책을 사놓고..
보지도 않고 있다가
오늘에서야 조금씩 보기 시작했다.
DBA로써 내 분야에 대해 공부와 더불어 스트레스를 풀기 위해 데이터 분석도 진행하려고 샀다.
1.변수 간의 관계에 대한 모델
장점 : 알고리즘의 개념이 복잡하지 않고 다양한 문제에 폭넓게 적용할 수 있음
- 독립변수 X, 상수항 b와 종속변수 y 사이의 관계를 모델링하는 방법
- 두 변수 사이의 관계일 경우 단순회귀라고 하며, 여러 개의 변수를 다루는 다중회귀
# Tensorflow
# 선형회귀분석
# python 2.7
import numpy as np
num_points = 1000
vectors_set = []
for i in xrange(num_points):
x1 = np.random.normal(0.0, 0.55)
y1 = x1 * 0.1 + 0.3 + np.random.normal(0.0, 0.03)
vectors_set.append([x1, y1])
x_data = [v[0] for v in vectors_set]
y_data = [v[1] for v in vectors_set]
%matplotlib inline
import matplotlib.pyplot as plt
plt.plot(x_data, y_data, 'ro')
plt.show()
- 비용함수와 경사 하강법 알고리즘
- 비용함수(오차함수) : 반복이 일어날 때마다 개선되고 있는지 확인하기 위해 얼마나 좋고 나쁜 직선인지를 측정
- 평균제곱오차 : 실제 값과 알고리즘이 반복마다 추정한 값 사이의 거리를 오차로 하는 값의 평균
- 경사하강법 : 일련의 매개변수로 된 함수가 주어지면 초기 시작점에서 함수의 값이 최소화되는 방향으로 매개변수를 변경하는 것을 반복적으로 수행하는 알고리즘
함수의 기울기를 음의 방향 쪽으로 진행하면서 반복적으로 최적화를 수행
보통 양의 값을 만들기 위해 거리 값을 제곱하며, 기울기를 계산해야 하므로 오차함수는 미분 가능해야 함
#비용 함수와 경사 하강법 알고리즘
import tensorflow as tf
W = tf.Variable(tf.random_uniform([1], -1.0, 1.0))
b = tf.Variable(tf.zeros([1]))
y = W*x_data+b
loss = tf.reduce_mean(tf.square(y-y_data))
optimzer = tf.train.GradienDescenOptimizer(0.5)
train = optimizer.minimize(loass)
#알고리즘 실행
init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)
for step in xrange(8):
sess.run(train)
print sess.run(W), sess.run(b)
plt.plot(x_data, y_data, 'ro')
plt.plot(x_data, sess.run(W) * x_data + sess.run(b))
plt.xlabel('x')
plt.ylabel('y')
plt.show()
* 사실 이해를 제대로 못했다...하지만 한번 훑고 넘어 가고 다시 한번 보도록 해야겠다.