전체 글
-
LaTeX 공부카테고리 없음 2021. 7. 20. 19:36
1. 단순한 문자. 달러 표시를 통해 입력하는데 정렬되지 않는다. 문장 사이에 넣을 때 사용한다 $x$ $X$ 곱하기 ${x \times y}$ 2. 굵은 문자 \mathbf{문자}로 입력 math bold font의 약자임 $\mathbf{x}$ $\mathbf{X}$ 3. 아래첨자는 _로 입력 $x_a$ $\mathbf{x}_a$ 4. 위 첨자는 ^로 입력 $x^2$ $\mathbf{x}^2$ 5. 분수는 \frac{분자}{분모} 또는 \over 로 입력 $\frac{a}{b}$ ${a \over b}$ 6. 등식은 = 기호 사용 $A\mathbf{x} = \mathbf{b}$ 7. 식에 번호를 붙이고 가운데 정렬은 begin{equation} 등식 end{equation} 사용 \begin{equa..
-
4. Malmo 설치 (우분투, 윈도우)Reinforcement Learning/마인크래프트로 배우는 강화학습 2021. 7. 19. 00:36
Malmo는 마이크로소프트에서 개발한 마인크래프트 인공지능 플랫폼입니다. 파이썬, C++, JAVA를 통해 구현한 코드로 게임의 에이전트를 제어할 수 있게 됩니다. 그럼 Malmo를 설치해보겠습니다. (1) 우분투에서의 Malmo 설치 터미널을 실행해서 다음과 같이 코드를 입력합니다. sudo apt-get install libboost-all-dev libpython3.5 openjdk-8-jdk ffmpeg python-tk python-imaging-tk sudo update-ca-certificates -f 저희는 이미 앞서 우분투에 필요한 패키지들을 설치할 때 미리 설치를 다 했습니다. 혹시나 빠진 것이 있을 수 있으니 다시 터미널에 입력해보세요. https://github.com/microso..
-
3. 개발도구 설치Reinforcement Learning/마인크래프트로 배우는 강화학습 2021. 7. 18. 04:21
본격적으로 개발에 필요한 툴들을 설치하기 위해 Anaconda, Pycham, Jupyter notebook 등의 프로그램을 설치해야 합니다. (1) Anaconda https://www.anaconda.com/products/individual Anaconda | Individual Edition Anaconda's open-source Individual Edition is the easiest way to perform Python/R data science and machine learning on a single machine. www.anaconda.com 위 링크로 들어가셔서 Anaconda Individual Edition을 다운로드 합니다. 모두 다운로드되었다면 왼쪽 독에서 파일 탐색기를..
-
2. 우분투 작업 환경 세팅Reinforcement Learning/마인크래프트로 배우는 강화학습 2021. 7. 17. 00:41
이번에는 우분투 환경 세팅을 해보겠습니다. (1) 한글 키보드 세팅 우분투 오른쪽 상단의 부분을 클릭해서 설정을 열 수 있습니다. Manage installed Languages를 누릅니다 그러면 위의 그림과 같은 창이 뜨면서 추가적으로 업데이트가 진행됩니다. 업데이트가 완료되었다면 다시 재부팅을 합시다. 다시 설정창을 열어서 + 버튼을 누릅시다 그 후, Korean을 찾아서 선택하고 Korean (Hangul)을 선택 후 Add를 누릅니다. 이후 위 그림에서 Korean(Hangul) 탭에서 톱니바퀴 모양을 누릅니다. Add 를 누른 후 오른쪽 Alt 버튼을 눌러서 키를 할당합니다. 각자의 키보드에 맞게 한영버튼을 할당해주시면 됩니다. (2) 필수 패키지 설치 우분투에서는 터미널을 통해 간단하게 패키지..
-
1. 우분투 설치Reinforcement Learning/마인크래프트로 배우는 강화학습 2021. 7. 17. 00:00
마인크래프트 강화학습 환경을 실행시키기 위해서는 다음과 같은 사항들이 요구됩니다. - Ubuntu 운영체제 - 100GB 이상의 하드디스크 공간 - Nvidia 외장 그래픽 카드 외장 그래픽 카드의 경우에는 전통적인 강화학습을 배우는 부분까지는 필요가 없습니다. 하지만 딥러닝을 쓰는 심층강화학습 파트에 들어가면 pytorch를 이용해서 심층강화학습 모델을 구현하고 학습시키게 되는데 이 때 필요하게 됩니다. 우분투를 기존에 쓰시던 분들은 모든 과정을 건너뛰시면 됩니다. 이 글의 대상독자는 우분투를 한 번도 사용해본 적 없는 사람입니다. (1) 하드디스크 파티션 할당 우분투를 설치하기 위해서 윈도우에서 하드디스크 용량을 할당해야 합니다. 윈도우 키 + R 키를 누르셔서 실행 창을 띄웁시다. 그리고 diskm..
-
0. 마인크래프트로 배우는 강화학습Reinforcement Learning/마인크래프트로 배우는 강화학습 2021. 7. 16. 23:09
안녕하세요 neverparadise입니다. 요즘 AI 연구 트렌드로 심층강화학습이 꽤나 핫한 것 같습니다. 많은 사람들이 흥미를 가지고 배우려고 시도하지만 아무래도 딥러닝과 강화학습에 대한 진입장벽이 높다보니 많은 분들이 수학과 프로그래밍의 장벽에 막혀서 좌절을 하시는 것 같습니다. 저 또한 그랬습니다... 때문에 마인크래프트를 통해서 강화학습을 배울 수 있게 글을 쓰려고 합니다. 대학교 1학년 전공기초 수업인 미적분학, 선형대수, 확률 및 랜덤 프로세스 과목들을 수강하셨다면 무리 없이 포스팅을 따라오실 수 있을 것입니다. 그렇다고 저 과목들을 꼭 수강하실 필요는 없으며 그때그때 필요에 따라 지식들을 채우시면 될 것 같습니다. 많은 분들이 강화학습을 쉽게 배울 수 있도록 열심히 해보겠습니다!
-
Frame Stack, Frame Skip 정리카테고리 없음 2021. 4. 3. 00:03
OpenAI의 gym환경을 사용하다보면 BreakoutDeterministic-v4와 같이 NoFrameskip과 같은 단어가 붙은 환경을 보신적이 있을 것입니다. 굉장히 헷갈리는 개념들인데요 이 개념들이 이미지를 입력으로 받는 환경에서 학습에 상당한 영향을 끼치기에 Stack과 Skip의 의미를 정리해보겠습니다. 1. Frame Stack Frame stack은 이미지를 관측(Image Observation)으로 받는 환경에서 주로 사용되는 기술입니다. 단어 뜻 그대로 이미지를 쌓아서 인공신경망에 입력으로 주게 되는 것입니다. 물론 벡터 관측(Vector Ovservation)도 스택으로 쌓아서 입력으로 사용할 수 있습니다. 그렇다면 왜 프레임을 하나씩 인공신경망에 입력하는게 아니라 굳이 여러 개를 입..
-
웹개발 공부, 블로그 포스팅 시작Web 2021. 4. 1. 23:05
매일 강화학습과 관련된 공부를 하고 있던 중에 우연히 프로젝트 수업에서 웹개발을 잘하시는 분을 만나게 되었다. 드롭박스를 클론코딩하는 프로젝트인데 생각보다 프론트엔드/백엔드 공부가 재밌게 느껴져서 공부를 시작해보려 한다. 멀티에이전트 강화학습을 공부하다보면 필연적으로 에이전트에 대한 동기/비동기 동작방식에 대한 고민이 생길 것인데 운영체제, 백엔드 쪽의 공부를 통해 이에 대한 기본지식을 배울 수 있을 것 같다. 열심히 공부해서 나중에는 반응형 웹페이지도 개발해보아야겠다.