Merge pull request #60 from java-squid/han

102092 · web-flow · commit bd551d99dc4f · 2021-10-01T20:59:51.000+09:00
[운영체제] 11회
diff --git a/operating-system/linux-memory-management/han/README.md b/operating-system/linux-memory-management/han/README.md
@@ -0,0 +1,254 @@
+# Memory Management
+
+- 메모리 주소는 물리적, 논리적 주소 있음.
+- `Logical Address`
+    - 가상 주소
+    - 프로세스 마다 독립적으로 가지는 주소 공간
+    - 0번지 부터 시작되고,
+    - **CPU가 보는 주소**임.
+- `Physical Address`
+    - 물리 주소
+    - 논리 주소에 + 하나의 주소 값이 더해진 값 (유일)
+    - 메모리에, 실제 올라가는 위치를 말함.
+- `Symbolic Address`
+    - 코드
+    - 컴파일러는 이 주소를 읽고, 논리 주소로 바꿔준다.
+    - 컴파일러가 심볼릭 주소를 논리 주소로 바꿔준 값은 중복 될 수 있음.
+
+> *Memory Management Unit*
+
+- 위에서도 살펴봤듯이, 컴파일러가 심볼릭 주소를 논리주소로 바꾸는 값은 중복될 수 있음. 
+- 그런데 CPU가 보는 값은 **논리 주소**
+- 그러면 컴파일러로 바꾼 값이, 중복 될 수 있는데 어떻게 컴파일러 마다 독립적인 값을 메모리에서 찾을 수 있는 걸까?
+    - 하드웨어 적인 도움이 필요하다.
+        - 주소 변환을 위한 하드웨어
+    - CPU 는 메모리에 접근할 떄, MMU의 도움을 받는다.
+        - base register, limit register 를 통해 이게 **해당 프로세스의 요청**이 맞는지 확인 (해당 프로세스 요청 범위에 맞는 물리적 주소인지 확인)
+
+## Swapping
+- 프로세스를 일시적으로 메모리에서 backing store로 쫒아 내는 것.
+- 우선 순위가 낮은 프로그램을 쫒아 냈다가, 다시 불러냈다가 하는 방법
+- 해당 방법을 실행하는 데 시간이 오래걸린다는 단점이 있음.
+
+## Dynamic Loading
+- 그때 그때 필요할 때마다 메모리에 올리는 방식.
+
+## Overlays
+- 프로세스 동작에 필요한 부분만 메모리에 올림.
+
+## Paging
+- Non contiguous allocation (현대 컴퓨터에서 가장 많이 사용되는 기법)
+- 물리 메모리를 동일한 크기의 frame으로 나누고,
+- 논리 메모리(swap memory)를 동일한 크기의 page로 나눔 (frame가 같은 크기)
+
+![image](https://user-images.githubusercontent.com/22140570/132986737-81b8959c-388d-4c73-a5ee-d1d3d13aabdc.png)
+- 페이지 테이블을 이용하여, 논리 - 물리 메모리간의 중간 다리 역할로 사용
+- 페이지 테이블을 프로세스 마다 존재, 그리고 이 페이지 테이블은 메모리에 저장됨. (Shared Page에 있음)
+- TLB를 통해 페이지 테이블로의 접근 시도를 줄임. (최적화)
+
+> *TLB Translation Look aside Buffer*
+
+![image](https://user-images.githubusercontent.com/22140570/132986916-ccca529b-c1d3-4a97-b666-b2405c47ba61.png)
+- 일종의 캐쉬 메모리
+- 주소 변환을 해주는 계층
+- CPU가 논리 주소를 요청하면, page table 에 접근하기 전에 우선적으로 살펴보는 공간.
+- 여기 CPU에서 요청하는 논리 주소가 있으면 바로 변환해서 물리 메모리에서 가져옴. 
+    - 없으면 page table을 참조해서 물리 주소를 가져옴.
+    - 그리고 요청한 논리 주소를 TLB에 저장해 둠
+
+
+# 리눅스가 메모리를 관리하는 방법
+- swap 공간에서 메모리 주소를 가져오려면 운영체제의 도움이 필요하다.
+
+
+## 가상 메모리 사용
+- Virtual Memory
+    - Swap memory + physical memroy
+
+## I/O 장치 관리
+- CPU가 논리 주소를 요청하면, TLB에 있는 지 확인
+- 없으면, 해당 프로세스를 중단
+- 여기서 리눅스(운영체제) 등장
+- 운영체제는 해당 프로세스가 왜 멈췄는 지 다시 한번 확인 (악의적인 요청이 아닌지)
+- 논리주소를 기반으로, 하드 디스크의 Swap 공간에서 해당하는 메모리 주소를 가져오고, TLB에 그 주소(논리)를 등록
+- Page table에 해당 주소 등록
+- 운영체제는 다시 프로세스를 동작
+
+> *Page fault*
+- CPU에서 요청한 논리 주소 값을 변환하여 메모리에서 찾았는 데, 해당 공간에 아무런 데이터가 없는 현상
+- 이 현상이 발생하면, 리눅스는 해당 논리주소에 대한 값을 disk 에서 찾는다.
+- 그리고 physical memory에 올린다.
+- 그 주소를 page table에 저장한다.
+
+> *Page replacement*
+- page fault가 발생한다.
+- page의 위치를 disk에서 찾는다.
+- physical memory에 빈 공간이 있는 지 확인한다 (frame 확인)
+    - 있으면 해당 프레임 사용
+    - 없으면? page replacement 진행
+- 물리 공간에서 쫒아낼 frame을 선정한다.
+- 이 프레임을 disk에 저장한다. (page table도 업데이트)
+- 올리고자 하는 정보를 비어있는 frame 에 올린다 (page table 또 업데이트)
+- 이제 프로세스 다시 진행
+
+> *Thrasing*
+![image](https://user-images.githubusercontent.com/22140570/133093189-d6a033f1-ea4f-4f7b-b3a0-1da097fba6ad.png)
+
+- Page fault rate가 높아져서, CPU는 할일이 없어지는 현상
+- 프로세스 page는 swap in, out으로 매우 바쁘게 돌아가지만, 상대적으로 CPU는 한가해지는 현상을 의미한다.
+- 이를 방지하고자 working set model, page-fault frequency 를 사용하기도 함
+
+
+# 메모리 고갈사항, CPU 사용률 확인
+- [htop](https://happist.com/557995/%EC%84%9C%EB%B2%84-%EB%AA%A8%EB%8B%88%ED%84%B0%EB%A7%81-%ED%94%84%EB%A1%9C%EA%B7%B8%EB%9E%A8-htop-%EC%82%AC%EC%9A%A9-%EB%B0%A9%EB%B2%95-ubuntu) 명령어를 통해, 모니터링 해보자
+
+- 메모리 고갈되면 발생하는 사항
+    - 프로세스 Swap 활발, CPU 사용율 하락
+    - Thrashing 발생
+    - 해소되지 않을 경우, Out of Memory 판단
+    - 중요도가 낮은 프로세스를 찾아 강제 종료
+
+- CPU 사용률 체크
+    - CPU 사용률이 급격하게 떨어지는 구간이 있으면,
+    - 메모리 적재량 확인 (메모리가 고갈 되었다?)
+    - 추가적인 서버 자원을 배치
+
+# 정리
+
+## 페이징 기법 내에서 리눅스가 메모리를 가져오는 순서
+
+![](https://t1.daumcdn.net/cfile/tistory/993CFA45600D5C1923?original)
+
+1. Symbolic address 가 컴파일러를 통해, Logical Address로 바꿔준다.
+2. Logical Address를 통해 리눅스에 있는 **MMU** 로 보낸다
+3. Phsical Address로 변환 전에, 논리주소를 통해 TLB를 찾아본다.
+    - TLB에 논리주소에 맵핑된 값(물리 주소)이 있으면, 바로 해당 물리 주소에 있는 데이터를 불러옴.
+    - 없으면 다음 단계로. 
+4. Page table을 참조하여, 해당 물리 주소를 가져옴. 그리고 이 주소를 TLB에 저장해둔다.
+    - 이 과정에서 Page table에 논리 주소에 해당하는 값이 없으면 Page fault.
+    - 해당 page에 대한 정보를 disk 에서 찾는다. 그리고 메모리에 올린다.
+    - 만약에 메모리에 올릴 수 없으면? (Page replacement 진행)
+
+
+# 참고
+- https://www.youtube.com/watch?v=qxmdX449z1U
+- http://www.kyobobook.co.kr/product/detailViewKor.laf?ejkGb=KOR&mallGb=KOR&barcode=9791158903589
+- http://web.mit.edu/rhel-doc/4/RH-DOCS/rhel-isa-ko-4/s1-memory-virt-details.html
+- https://wogh8732.tistory.com/395
+- https://m.blog.naver.com/4717010/220015472363
+
+
+
+# QnA
+
+## Logical Address와 Physical Address가 별도로 존재하는 이유는 무엇일까요?
+
+- Multi-process 환경에서 발생할 수 있는 충돌을 최소화 하기 위해서
+- 혹은 한정된 Physical Memory, Address 에도, 좀 더 확장성 있게 사용하기 위해서 (Logical Address를 통해)
+
+- 참고
+  - https://stackoverflow.com/questions/29771977/purpose-of-logical-address/47988290
+
+
+
+## Address Binding에 대해 설명
+
+- 데이터를 메모리에 올리는 걸 Address Binding이라 하는듯.
+- 언제 올리는 지에 따라서..
+  1.  Compile time에 메모리에 올릴 수 있고,
+  2. 혹은 Load time 프록그램을 실행 전에
+  3. Execution time 실행 시에도 올릴 수 있음! (신기)
+
+- 참고
+
+- https://jhnyang.tistory.com/133
+
+
+
+## 컴파일러가 심볼릭 주소를 논리주소로 바꾸는 값은 중복될 수 있음 왜?
+
+![](https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2F4zMbZ%2FbtqNqZGuKdJ%2Fo7F7BrEAr7ILddV77RESs1%2Fimg.png)
+
+- Address binding 과 관련 있는듯.
+
+- symbolic address는 컴파일을 통해 Logcial Addess로 변환 되는데, 이 때 나온 값이 중복 될 수 있음.
+- 왜?
+  - 프로세스 별로 컴파일이라는 과정을 유니크하게 보장할 수는 없을듯.
+
+
+
+## MMU가 base register, limit register를 사용하는 이유
+
+- Address binding 과 관련 있는듯.
+- 프로세스 마다 접근할 수 있는 구역을 설정하기 위해서, 보장해주기 위해서 사용하는듯
+
+
+
+## Dynamic Loading과 Virtual Memory는 어떤 관계
+
+- CPU가 바라보는 주소가 있는 공간이 Virtual Memory
+- Dynamic Loading의 경우, 메모리 공간을 효율적으로 사용하기 위한 기법
+
+- 둘 다 메모리 부족을 해결하기 위해서 등장한 기법, 방법으로 이해되어요.
+  - 전자의 경우 Virtual Memory라는 가상공간을 통해서 Physical Memory의 부족을 해소
+  - 후자의 경우 프로그램에서 사용하는 부분만 Physical Memory에 올림으로써 해소
+
+
+
+## Dynamic Loading vs Overlays vs Virtual Memory vs Paging 차이
+
+> Dynamic Loading
+
+- 프로그램을 Physical Memory에 동적(필요할 때 마다) 올림.
+- 프로그래머가 직접 컨드롤할 수 있는 부분도 있는듯 (코드 레벨에서 조절할 수 있다는 의미인듯)
+
+
+
+>  Overlays
+
+- Dynamic Loading과 비슷
+- 다만, 메모리보다 프로세스가 더 클 경우 사용되는 기법(Dynamic Loading은 이와 같을 경우 해결이 불가능한듯)
+
+
+
+>  Virtual Memory
+
+- Physical Memory 부족을 위해 나온 개념
+- CPU가 바라보로 있는 주소이고, 프로세스마다 독립적인 공간을 보장받을듯 싶음.
+
+
+
+>  Paging
+
+- Logical Address를 Page 라는 블록으로 분할하고 관리하는 기법
+- 즉 프로세스를 일정 크기로 잘라서 메모리에 적재하는 방식
+- 참고적으로 Page는 Logical Address를 나눈 크기를 의미하고, Frame은 Physical Memory를 나눈 크기를 의미
+
+
+
+- 참고
+  - https://jhnyang.tistory.com/44
+  - https://jhnyang.tistory.com/290
+
+
+
+## Page Fault 발생 과정
+
+1. CPU 가 Logical Address를 가지고 page table에 들어감.
+2. 이 때 가져온 Logical Address 해당 프로세스에서는 사용되지 않는 주소이던지, Logical Address에 해당하는 Physical Address의 주소가 Page Table에 없을 경우 Invalid 판단이 내려집니다. 이 경우 page fault handler가 실행되어요.
+2.1 전자의 경우 해당 요청 명령이 abort되고,
+2.2 후자의 경우 physical memory에 올라갈 공간 (frame)을 확보합니다.
+3. 요청한 Logical Address에 대한 정보를 Disk에서 읽어서 Physical Memory에 가져옵니다.
+4. 그리고 그에 대한 정보를 Page table을 업데이트 합니다.
+
+
+
+- 즉 위 절차를 통해 생각해볼 때, 메모리 공간 데이터의 경우 아래 2가지 시나리오가 있지 않을까 싶네요
+
+1. 요청한 Logical Address에 대한 정보가 page table, physical memory 에도 없을 경우 (위 절차를 밟아서..다시 가져올듯)
+2. 원하는 데이터가 physical memory(메모리)에 있는데, page table에는 없는 경우 아마도 MMU를 통해 메모리에서 찾은 후 page table을 업데이트하겠네요.
+
+
+
+- 참고
+  - https://data-engineer.tistory.com/53
diff --git a/operating-system/process-vs-thread/han/README.md b/operating-system/process-vs-thread/han/README.md
@@ -0,0 +1,52 @@
+# 프로세스란?
+
+- 메모리에 올라와서, 독립적으로 실행 중인 프로그램을 의미한다.
+![image](https://user-images.githubusercontent.com/22140570/132981855-c1124ab9-4342-462a-baec-9445e476559d.png)
+- 프로세스는 운영체제로 부터 독립적인 메모리 영역을 할당받고,
+    - 할당받는 메모리 영역은 `Code, Data, Stack, Heap`의 구조로 되어있음.
+- 프로세스는 최소 한 개의 스레드(메인 스레드)를 가지고,
+- 각 프로세스는 별도의 주소 공간에서 실행되고, 다른 프로세의 메모리에 접근할 수 없음.
+    - 프로세스간 통신을 하려면 IPC(inter-process-communication) 을 사용해야함.
+    - 파이프, 파일, 소켓등을 이용해야한다는 말.
+
+
+# 스레드란?
+- 프로세스가 할당받는 자원을 이용하는 실행의 단위.
+- 프로세스보다 작은 의미.
+- 프로레스 안에서의 흐름을 의미함.
+![image](https://user-images.githubusercontent.com/22140570/132981870-6323ffb1-506a-49b7-bc98-adb9f40ecba2.png)
+- 스레드는 프로세스 내에서 각각 `Stack` 를 **따로** 할당 받고, Code, Data, Heap 영역을 공유함.
+- 프로세스 내의 주소 공간이나 자원을 스레드간 공유한다.
+- 각각의 스레드는 별도의 **레지스터, 스택** 을 가지고 있고, 프로세스 안에 있는 힙 공간도 읽고 쓰는 것도 가능함. 즉 힙은 공유하는 공간임
+
+# 자바 스레드 란?
+- 일반 스레드와 차이 없음.
+- JVM이 운영체제 역할을 할 뿐.
+- 자바에서는 프로세스가 존재하지 않고, 스레드만 존재.
+- 자바 스레드는 JVM에 의해 스케쥴되어 실행되는 코드 블럭이라고 할 수 있음.
+
+# 멀티 프로세스란?
+- 하나의 응용 프로그램을 여러 개의 프로세스로 구성하여, 각 프로세스가 하나의 작업을 처리하도록 하는 것.
+    - **장점** : 여러 개의 자식 프로세스 중 하나에 문제가 발생하면 그 프로세스만 죽이면 되어서 다른 프로세스에는 영향을 주지 않음.
+    - **단점** : Context Switching 오버헤드 발생, 즉 프로세스는 각각의 독립적인 메모리 공간을 할당 받았기에, 프로세스간 공유할 수 있는 정보가 없어서 Context Swithing이 발생하면 캐쉬에 있는 데이터를 리셋하고, 다시 캐쉬정보를 불러와야함. 이과정에서 오버헤드가 발생함.
+- Context Switching?
+    - CPU에서는 여러 프로세스가 돌아가면서 작업을 처리하는 데, 이렇게 공수교대 하는 과정을 문맥 교환이라 말한다.
+    - 자세히 보면, 현재 CPU에서 실행 중인 프로세스가 대기상태로 들어가면서 현재 프로세스의 상태(context)를 보관하고, 다음 실행 대기 중인 프로세스가 동작하기 위해서, 이전 프로세스의 상태가 다리 load되는 작업을 의미한다.
+
+# 멀티 스레드란?
+- 하나의 응용프로그램(프로세스)를 여러개의 스레드로 구성하고, 각 스레드로 하여금 하나의 작업을 처리하게 하는 것.
+- 웹 서버는 대표적인 멀티 스레드 응용 프로그램
+    - 장점 → 시스템 소모 자원 감소 즉 자원의 효율성을 극대화, 프로세스를 생성하여 자원을 할당하려는 시스템 call이 줄어들어, 시스템 자원을 효율적으로 관리할 수 있음.
+        - 그리고 시스템의 처리량이 증가한다. 왜? 스레드 간 데이터를 주고 받는 것이 간단하고, 스레드 사이의 작업량이 프로세스에 비해 상대적으로 작기 때문에 Context Switching이 빠르다.
+        - 스레드는 프로세스의 영역 중 stack을 제외한 모든 영역을 공유하기에 스레드간 통신 부담이 적다는 것이 이유.
+    - 단점 → 자원 공유에서 발생하는 동기화 문제. , 하나의 스레드에서 문제가 생길 경우 발생하는 문제
+
+# 멀티 프로세스 대신 왜 멀티 스레드를 사용할까?
+![image](https://user-images.githubusercontent.com/22140570/132981913-4aac8898-0020-42bb-bd8b-6bb2b2c224ed.png)
+- 프로그램을 여러 개 실행 시키는 것 보다는, 하나의 프로그램에서 여러 작업을 해결토록 하는 것이 낫다.
+- 자원의 효율성, 처리 비용도 감소, 심지어는 응답 시간도 단축되기 때문에
+- 왜? 프로세스 간 문맥교환은 비용이 큰 작업.
+
+# 참고
+- https://gmlwjd9405.github.io/2018/09/14/process-vs-thread.html
+- https://www.youtube.com/watch?v=1grtWKqTn50
diff --git a/operating-system/scheduling/han/README.md b/operating-system/scheduling/han/README.md