The Unity Machine Learning Agents Toolkit(ML-Agents) is an open-source project that enables games and simulations to serve as environments for training intelligent agents. We provide implementations (based on PyTorch) of state-of-the-art algorithms to enable game developers and hobbyists to easily train intelligent agents for 2D, 3D and VR/AR games. Researchers can also use the provided simple-to-use Python API to train Agents using
지능형 에이전트를 훈련하는 환경, 파이토치 기반이며 간단한 API를 사용하여 에이전트를 훈련시킬 수 있는 툴킷
파이썬에서 학습에 사용할 mlagents 설치, 문서 권장 설치 버전인 1.1.0, 설치후 pip list로 라이브러리 설치 확인
pip install mlagents==1.1.0
pip list
4. Unity에 ML-Agents 플러그인 적용
4-1. ML-Agents의 예제 프로젝트 Import
유니티 허브 > add > add project from disk > {압축해제한 경로}\ml-agents-release_22\ml-agents-release_22\Project
좌측 탐색기에서 Asset > Example > Scene > 3DBall 선택
4-2. ML-Agents 플러그인 적용
unity > 상단의 window 메뉴 > package manager 클릭 > 상단의 + > install package from disk > 압축해제 폴더 이동 > com.unity.ml-agents, com.unity.ml-agents.extension 파일의 package.json 파일 선택
5. 빌드
File > build profile > scene List에 3DBall 확인 > Build
6. 학습
6-1. mlagent-learn
아나콘다 가상 python에서 설치한 mlagent를 사용하여 학습진행.
--env 옵션은 build한 Unity의 파일, env옵션 없이 진행한다면 Unity의 재생 버튼을 사용하여 학습 가능
mlagents-learn {yaml파일} --env={build한 exe 파일} --run-id={결과 저장할 폴더 이름}
# ml-agents 압축 푼 경로에서
mlagents-learn config/ppo/3DBall.yaml --env=../../build_project01/3DBall.exe --run-id=test04
해당 정보들은 RDB에 저장되어 있으며 일반적으로는 1개의 row가 존재하는 마스터 테이블이다.
해당 데이터들은 변경이 필요하지만 자주 변경은 되지않으므로 CRUD를 위하여 WEB과 API가 필요하다. Ex) A 설정정보를 위해 A테이블에 대한 API CRUD와 WEB 개발 (데이터 1건)
B 설정정보를 위한 B 테이블에 대한 API CRUD와 WEB 개발 (데이터 1건)
C 설정정보를 위한 C 테이블에 대한API CRUD와 WEB 개발 (데이터 1건)
... 등등등
단 해당 데이터들은 반드시 1건은 아니며 최대 5건 내외 정도 될 듯 하다 (3건 이상은 못 본듯 하지만 설계상 가능)
해당 건들을 조건에 따라 조합하여 1개의 종합 설정정보를 만들어 API로 전달한다.
위 데이터들을 위해 CRUD API와 WEB 개발 하는 것은 불필요해 보이며, 변동이 적고, 조건에 따른 조합이 필요했다.
이를 위해 WorkFlow를 도입하여 테스트 해보고자 했다
1. Node-Red 란 무엇인가.
Node-RED(노드 레드)는 하드웨어 장치들, API, 온라인 서비스를 사물인터넷의 일부로 와이어링(배선화)시키기 위해 본래 IBM이 개발한 시각 프로그래밍을 위한 플로 기반 개발 도구이다.
Node-RED는 브라우저 기반 플로 편집기를 제공하므로 자바스크립트 함수를 개발하는데 사용할 수 있다. 애플리케이션의 요소들은 재사용을 위해 저장하거나 공유할 수 있다. 런타임은 Node.js 위에서 개발되어 있다. Node-RED에서 만든 플로는 JSON을 사용하여 저장된다. 버전 0.14 이후 MQTT 노드들은 적절하게 구성된 TLS 연결을 만들 수 있다.
2016년에 IBM은 Node-RED를 오픈 소스 "JS Foundation" 프로젝트로 기여했다.
출처 위키백과
2. Node-Red 설치
2-1. 도커 설치
추후 docker compose로 구성하여 volume 또한 잡아주어야 관리가 용이하다.
docker run -it -p 1880:1880 -v node_red_data:/data --name mynodered nodered/node-red
2-2. 로컬 설치
주의 Node.js 설치가 필요하다.
npm install -g --unsafe-perm node-red
실행
node-red
접속
브라우저에서 http://localhost:1880
3. Node-Red에서 RestAPI 테스트
왼쪽의 팔레트에서 http in, function, http response를 드래그하여 플로우 화면에 이동 시킨 후 각 컴포넌트들을 연결한다.
http in을 더블클릭하여 수정
function을 클릭하여 수정
http response 수정 후 오른쪽 상단의 배포하기 클릭
http://localhost:1880/apiTest로 테스트
4. 추가 컴포넌트 설치
시간에 따른 분기처리하는 컴포넌트가 기본으로 제공 되지 않는다.
오른쪽의 = 메뉴 > 팔렛트 관리 > 설치 가능한 노드 > node-red-contrib-time-switch 검색 > 설치
기능 노드 > time switch가 생긴 것을 확인 할 수 있다.
5. 샘플 설정 API 구성해보기
5-1. 전체 구성
5-2. 구성 설명
request로 codeValeu를 받는다.
codeValue별 projectId를 다르게 세팅한다.(스위치 노드 사용하여 분기)
target을 설정하는데 나중에 변경 할 수 있도록 A노드를 만들어두고 연결을 끊어둔다.(미사용 처리)
현재 시간에 따라 ment를 세팅한다. (타임 스위치 노드 사용하여 분기)
5-3. 테스트
6. 내보내기/가져오기
현재플로우/ 전체 플로우를 export, import가 가능하다. 해당 데이터는 json으로 만들어지며 파일/클립보드 형식으로 사용할 수있다.
대용량 데이터를 생성하고 다운로드 하는 api가 있는데 데이터가 늘어나다보니 60초 이상이 걸리고 api에서는 timeout이 발생하여 결과를 받지 못하는 상황이 생겼다.
개발환경에서 테스트를 하기위해 임시 api를 만든다.
url로 /public/10 과같이 값을 입력 받아 Thread.sleep으로 강제 지연을 발생 시킨다.
@Controller
@RequestMapping(value = "/public")
public class HealthController {
@GetMapping("/{time}")
public ResponseEntity healthCheck(@PathVariable("time") long time) {
try {
Thread.sleep(time * 1000L)
}catch (Exception e) {
e.printStackTrace();
}
}
}
nginx의 설정 추가
proxy_read_timeout은 nginx가 백엔드로부터 응답을 받기까지 대기하는 시간이다. 즉 client는 nginx로 요청을 보내고 nginx는 client의 요청을 다시 backend로 보내는데 nginx와 backend 통신이 proxy_read_timeout 기간내로 결과를 주지 못한다면 연결을 끊는다는 의미다.(default는 60초이다.)