레플리
글 수 203

텐서플로우에서 소프트맥스로 숫자 인식 구현

조회 수 1373 추천 수 0 2017.03.09 12:16:27


http://bcho.tistory.com/1154

 

 

 

Screen_Shot_2016-12-28_at_1.58.24_PM.png

 

MNIST는 텐서플로우에 기본으로 내장된 숫자 이미지 데이터입니다. 28x28 사이즈의 숫자가 0~1의 값으로 저장되어 있습니다. 이 데이터를 사용하여 소프트맥스 회귀(Softmax Regression) 방법으로 학습을 해보겠습니다.

 

 

 

softmax-regression-scalargraph.png

 

소프트맥스 회귀는 로지스틱 회귀을 확장한 것입니다. 로지스틱은 두가지로만 구분이 가능하지만 소프트맥스는 n개로 분류할 수 있습니다. 아래 링크는 로지스틱 회귀에 대한 설명입니다.

 

http://cafe.naver.com/aidreaming/483

 

소프트맥스는 위의 그림을 보시면 아시겠지만 신경망의 단층 퍼셉트론과 거의 유사합니다. 딥러닝 CNN에서 마지막 단계가 fully-connected layer인데 보통 히든 레이어와 소프트맥스를 연결해서 구현하는 것 같습니다.

 

 

 

텐서플로우 코드는 아래와 같습니다.

 

---------------------------------------------------------------------

from tensorflow.examples.tutorials.mnist import input_data

import tensorflow as tf

 

 

# MNIST 데이터를 해당 폴더에 다운받아 압축을 해제하고 변수에 저장

mnist = input_data.read_data_sets('mnist/input_data', one_hot=True)

 

# 입력값 플레이스홀더 설정

x = tf.placeholder(tf.float32, [None, 784])

 

# 가중치 변수

W = tf.Variable(tf.zeros([784, 10]))

 

# 편향값 변수

b = tf.Variable(tf.zeros([10]))

 

# 소프트맥스 설정

k = tf.matmul(x, W) + b

y = tf.nn.softmax(k)

 

 

# 이미지의 실제 숫자값 플레이스홀더 설정 (10개의 열은 각각 0~9 숫자를 나타냄)

y_ = tf.placeholder(tf.float32, [None, 10])             

 

# 학습률 설정                                                                  

learning_rate = 0.5

 

# 출력값 y와 실제 숫자값 y_ 사이의 크로스 엔트로피로 코스트 설정

# softmax_cross_entropy_with_logits()가 softmax()를 포함하기 때문에 y대신 k 입력

cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(k, y_))

 

# 코스트가 낮게 되도록 경사 하강법 실행

train_step = tf.train.GradientDescentOptimizer(learning_rate).minimize(cost)

 

 

# 세션 초기화

print ("Training")

sess = tf.Session()

init = tf.global_variables_initializer()

sess.run(init)

 

# 1000번씩, 전체 데이타에서 100개씩 뽑아서 트레이닝을 함.  

for _ in range(1000):

    batch_xs, batch_ys = mnist.train.next_batch(100)

    sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})

 

# 학습된 가중치와 편향값 출력

print('W is',sess.run(W))

print ('b is ',sess.run(b))

---------------------------------------------------------------------

List of Articles
제목 글쓴이 날짜 조회 수sort
사진을 디즈니 만화로 바뀌주는 딥러닝 모델 - Toonify 깊은바다 2020-09-21 1341
오픈소스로 공개된 Text-to-Image 모델 - Stable Diffusion 깊은바다 2022-09-07 1350
텐서플로우로 선형 회귀 구현 file 깊은바다 2017-03-09 1360
텐서플로우에서 소프트맥스로 숫자 인식 구현 file 깊은바다 2017-03-09 1373
목소리와 입모양을 변경할 수 있는 GAN 모델 깊은바다 2019-06-13 1386
딥페이크로 일론 머스크인 척 친구들을 속이는 영상 깊은바다 2020-04-19 1389
R-CNN 에서 부터 Mask R-CNN 까지 깊은바다 2019-09-03 1407
Transformer와 동급의 성능에 속도는 훨씬 빨라진 MLP-Mixer file 깊은바다 2021-06-11 1439
CNN 시각화 사이트 - CNN Explainer 깊은바다 2020-05-10 1457
스탠포드 딥러닝 강의 한글화 프로젝트 깊은바다 2017-02-28 1555
이미지 생성모델에서 특징 벡터를 추출하여 사진을 조작하는 방법 file 깊은바다 2020-10-09 1569
쉽게 풀어쓴 딥 러닝의 거의 모든 것 file 깊은바다 2016-03-21 1612
Spiking Neural Networks: 생물학적 신경망을 모방한 차세대 신경망 [2] 깊은바다 2018-08-27 1642
미국에서 Dalle Mini로 짤(Meme)을 만드는게 유행 file 깊은바다 2022-06-19 1642
생성 모델이 일반 인공지능(AGI)으로 가는 열쇠 file 깊은바다 2020-06-29 1688