수업/게임프로그래밍(MLAgent)

[게임프로그래밍] MLAgent - 1. 이론

이름?없음 2024. 3. 5. 14:18
반응형
반응형

인공 지능이란? :  인간의 학습능력, 추론능력, 지각능력을 인공적으로 구현하려는 컴퓨터 과학의 세부분야 중 하나이다

 

인공 지능은 아래의 카테고리로 크게 구분이 가능하다고 한다

 

MLAgent는 머신러닝(기계학습)을 사용한다고 한다

 

기계학습에는 여러 종류가 있는데 MLAgent는 강화학습 기반의 심층 강화학습을 사용한다고 한다

MLAgent : 강화학습 + 딥러닝 = 심층 강화학습

 

기계학습의 종류 : 지도학습, 비지도학습, 강화학습

 

MLAgent란? : 지능형 에이전트를 훈련키는 환경을 제공하는 오픈 소스 프로젝트 PyTorch기반으로 제작되었다

학습된 에이전트는 NPC행동 제어, 게임 빌드 테스트 자동화, 출시 전 게임 설계(밸런스)검증 등 다양한 부분에 응용 가능하다

 

용어

에이전트 : 강화학습에서 의사결정을 하는 대상

환경 : 에이전트에게 정보를 주는 역할

상태 : 에이전트는 상태를 기반으로 의사 결정을 한다

관측 : 환경에서 에이전트에게 제공되는 정보

백터 관측 : 값으로 데이터를 넣에주는거

시각적 관측 : 시각적으로 데이터를 넣어주는거

 

행동 : 에이전트가 의사결정을 통해 행동을 취하게 됨

스텝 : 에이전트가 한번 행동을 취했을 때가 1스텝 (EX 에이전트가 1칸 움직인다)

에피소드 : 에이전트가 여러 스텝동안 행동을 취하다가 게임 한 판이 끝났을 때가 1 에피소드(EX 에이전트가 게임을 1판 끝냈다)

반응형