[게임프로그래밍] MLAgent

수업/게임프로그래밍(MLAgent)

[게임프로그래밍] MLAgent - 1. 이론

이름?없음 2024. 3. 5. 14:18

인공 지능이란? : 인간의 학습능력, 추론능력, 지각능력을 인공적으로 구현하려는 컴퓨터 과학의 세부분야 중 하나이다

인공 지능은 아래의 카테고리로 크게 구분이 가능하다고 한다

MLAgent는 머신러닝(기계학습)을 사용한다고 한다

기계학습에는 여러 종류가 있는데 MLAgent는 강화학습 기반의 심층 강화학습을 사용한다고 한다

MLAgent : 강화학습 + 딥러닝 = 심층 강화학습

기계학습의 종류 : 지도학습, 비지도학습, 강화학습

MLAgent란? : 지능형 에이전트를 훈련키는 환경을 제공하는 오픈 소스 프로젝트 PyTorch기반으로 제작되었다

학습된 에이전트는 NPC행동 제어, 게임 빌드 테스트 자동화, 출시 전 게임 설계(밸런스)검증 등 다양한 부분에 응용 가능하다

용어

에이전트 : 강화학습에서 의사결정을 하는 대상

환경 : 에이전트에게 정보를 주는 역할

상태 : 에이전트는 상태를 기반으로 의사 결정을 한다

관측 : 환경에서 에이전트에게 제공되는 정보

백터 관측 : 값으로 데이터를 넣에주는거

시각적 관측 : 시각적으로 데이터를 넣어주는거

행동 : 에이전트가 의사결정을 통해 행동을 취하게 됨

스텝 : 에이전트가 한번 행동을 취했을 때가 1스텝 (EX 에이전트가 1칸 움직인다)

에피소드 : 에이전트가 여러 스텝동안 행동을 취하다가 게임 한 판이 끝났을 때가 1 에피소드(EX 에이전트가 게임을 1판 끝냈다)

저작자표시

'수업 > 게임프로그래밍(MLAgent)' 카테고리의 다른 글

[게임프로그래밍] MLAgent - 2. 사용 준비 (0)	2024.03.05

현재글[게임프로그래밍] MLAgent - 1. 이론

티스토리챌린지, 플랫포머, vivox, 터레인, 3d, c#, Mathf, 오블완, 유니티, 랜덤 지형, 랜덤 맵, LootLocker, 서버, 멀티플레이, 인벤토리, 음성 채팅, 클라우드, 개발, 2D, Unity,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

개발 블로그