게시판 - 안녕하십니까. 강화학습을 통한 장애물 탐지

AI Dev - 인공지능 개발자 모임
게시판

글 수 222

안녕하십니까. 강화학습을 통한 장애물 탐지

조회 수 157 추천 수 0 2018.03.29 05:38:49

yu *.107.208.184 http://aidev.co.kr/4273

안녕하십니까. 강화학습을 공부하고 있는 학생입니다.

많은 예시들을 보면, 장애물이 있는 위치를 인지하고 그 장애물과 부딪치면 -1, 목적지에 안전하게 잘 도착하면 +1 이라고 하는 경우가 다수였습니다.

그런데, 이와 달리 장애물이 어디 지점에 위치해있지만 현재 컴퓨터는 모르고 이를 강화학습을 통해 장애물을 탐지 할 수 있나요?

그 위치에 장애물이 있다/ 없다 정도를 알고 싶은데, 이를 강화학습을 통해 구현이 가능한가요?

이 게시물을

엮인글 :

2018.03.29 06:00:21
*.68.247.188

정확히 어떤 문제인지 잘 모르겠네요. 만약 지뢰 장애물을 찾는 로봇이라고 생각해보겠습니다. 로봇의 입력으로는 현재 자신의 주변 10x10의 지뢰 존재를 입력으로 받습니다. 그리고 새로운 지뢰를 찾을 가능성이 높은 곳으로 이동하는 액션을 출력합니다. 만약 지뢰를 찾았으면 다음번 입력에서 찾은 지뢰가 추가됩니다.

이런식이 아니라 10x10 영역에서 지뢰의 유무 입력이 주어졌을때 특정 (x, y) 좌표에서 지뢰가 존재하는지 여부를 판단하는 것이라면 강화학습보다는 지도학습이 더 나을 것 같습니다.

2018.03.29 18:22:00
*.107.208.184

아. 설명이 부족했네요ㅠㅠ 죄송합니다.

제가 이해하고 있는 것으로는 현재 지뢰 장애물을 피해 목적지로 가는 로봇이 있다고 가정했을 때

강화학습은 로봇을 무작위로 보내보면서 지뢰를 지나갈 경우에는 벌점을, 지뢰를 지나가지 않고 목적지에 도착한 경우에는 상점을 주는데,

벌점을 받은 경로들이 있다면 다음 행동시에는 그 경로로 가는 확률을 줄여줌으로써 벌점을 덜 받게하고 안전하게 목적지로 가는 경로를 찾는 것인거죠?

현재 행동이 잘못되었을 경우 다음 행동시 현재 행동을 할 확률을 줄여줌으로써 최적의 행동을 찾아가는 것 맞나요?

2018.03.29 22:06:29
*.68.247.188

보내주신 쪽지의 답장 확인해 주기기 바랍니다.

List of Articles

제목	글쓴이	날짜	조회 수
카톡 대화를 학습하는 AI 아바타 챗봇 - 레플리	깊은바다	2024-01-17	371
안녕하세요 seq2seq에 대한 질문 있습니다... [2]	jjdh	2018-05-31	204
데이터 종류에 대해서 궁금합니다. [2]	노력하는돌	2021-03-22	204
경사하강법 질문있습니다! [3]	평범한공대생	2020-04-29	217
영화 패신저스의 대화 인터페이스	깊은바다	2018-10-03	219
ai(인공지능)개발자 찾습니다	바요	2017-08-04	220
(주)레플리에서 일상대화 AI에 도전하실 분을 찾습니다	깊은바다	2023-01-19	220
딥러닝에 대한 질문드려용 [1]	병쥐	2021-05-17	222
MS, AI 채팅봇 개발도구 공개	깊은바다	2016-04-01	223
감성 AI 챗봇 문의드립니다. [2]	아임둥	2020-09-06	223
사지방컴입니다. 신경망 라이브러리 깃헙링크입니다. [1]	사지방컴	2020-01-01	224
안녕하세요. 사지방컴입니다. 정말 오랜만에 글 작성합니다. [2]	사지방컴	2019-12-19	231
안녕하세요 챗봇 관련해서 질문있습니다. [3]	된장찌개	2020-01-02	232
제가 만든 ai fitness 사이트 어떤 가요? 처음 만듬 [1]	sdfsdf	2020-09-28	233
스타트업에 관심있는분들 계실까요?ㅎ [3]	마이클	2017-07-06	234
정규표현식이 어려워서 제가 자주사용하는 기능만 만들어놨습니다.	Nike	2021-02-05	236

쓰기

첫 페이지 4 5 6 7 8 9 10 11 12 13 끝 페이지

안녕하십니까. 강화학습을 통한 장애물 탐지

깊은바다

yu

깊은바다