쿠버네티스 패턴

책 내용 정리 및 공식 문서와 비교하며 버전 확인

1장 개요

클라우드 네이티브로 가는길

클린코드
도메인 주도 설계
마이크로서비스 아키텍처 방식
컨테이너

분산 기본 요소

개념	로컬 기본 요소	분산 기본 요소
캡슐화 동작	클래스	컨테이너 이미지
인스턴스화 동작	객체	컨테이너
재사용 단위	Jar 파일	컨테이너 이미지
컴포지션	포함 관계	사이드카 패턴
상속	확장 관계	FROM 으로 부모 이미지 상속
배포 단위	.jar/.war/.ear	pod
빌드타임/런타임 격리	모듈, 패키지, 클래스	namespace, pod, container
초기화 필요조건	Constructor	초기화 컨테이너
초기화 직 후 트리거	Init method	postStart
삭제 직전 트리거	Destroy method	preStop
정리 절차	finalize(), shutdown hook	Defer 컨테이너
비동기 & 병렬 칫행	ThreadPoolExecutor, ForkJoinPool	Job
주기적 작업	Timer, ScheduleExecutorService	CronJob
백그라운드 작업	Deamon Thread	DeamonSets
설정관리	System.getenv(), Properties	ConfigMap, Secret

컨테이너

컨테이너 이미지는 하나의 문제를 해결하는 기능 단위다.
컨테이너 이미지는 하나의 팀에 의해 소유되며, 릴리즈 주기가 있다.
컨테이너 이미지는 자기 완비적이며, 런타임 의존 성을 정의하고 수행한다.
컨테이너 이미지는 불변적이며, 한번 만들어지면 변경되지 않는다. 즉 이미 설정 값이 정해져 있다.
컨테이너 이미지는 런타임 의존성과 자원 요구사항이 정의되어 있다.
컨테이너 이미지는 기능을 노출시키기 위해 잘 정의된 API가 있다.
컨테이너는 일반적으로 하나의 유닉스 프로세스로 실행된다.
컨테이너는 일회용이며 언제든지 스케일 업과 스케일 다운을 안전하게 수행할 수 있다.

파드

파드는 스케줄링의 최소 단위이다.
파드는 파드에 속한 컨테이너들의 동일 장소 배치를 보장한다.
한 파드는 파드 안의 모든 컨테이너가 공유하는 하나의 IP 주소와 이름, 포트 범위를 갖는다.

서비스

서비스는 애플리케이션에 접근하기 위한 이름으로 된 진입점이다.

레이블

레이블은 실행 중인 특정 파드의 인스턴스들을 가리키기 위해 사용된다.
레이블은 스케줄러에서 많이 사용된다.
레이블은 파드를 논리적 그룹으로 묶어 가리킬 수 있다.
미리 앞서서 레이블을 추가하지 않아야한다. 레이블 삭제가 어떤 영향을 일으키는지 알아낼 방법이 없다.

어노테이션

레이블과 유사한 기능을 하지만, 사람보다는 봇을 위한 용도로 사용된다.
검색 불가능한 메타데이터를 지정하는데 사용한다.

네임스페이스

네임스페이스는 쿠버네티스 자원으로서 관리된다.
네임스페이스는 컨테이너, 파드, 서비스, 레플리카세트 등의 자원에 대한 영역을 제공한다.
네임스페이스 내에서 자원명은 고유해야한다.
네임스페이스는 격리시키는 것이 아니므로 자원간 접근을 막을수는 없다.
노드, PersistentVolume 등은 네임스페이스 내에 속하지 않는다.
서비스는 <service-name>.<namespace-name>.svc.cluster.local 형식의 dns address 를 갖는다.
ResourceQuota는 네임스페이스 별로 제약조건을 걸 수 있다.

1부 기본 패턴

2장 예측 범위 내의 요구사항

애플리케이션의 요구사항에 따라서 필요한 자원량은 달라지며, 이를 예측하는 것은 어려운 일이다.
쿠버네티스를 사용하면서 런타임 요구사항을 알아야하는 이유:
- 효율적인 하드웨어 사용을 위한 배치
- 전체 클러스터 설계 및 관리

런타임 의존성

PersistentVolume
hostPort
configMap, secret

자원 프로파일

compressible resource : cpu, network
incompressible resource : memory
incompressible resource를 너무 많이 사용할 경우 컨테이너가 죽게 된다.
requests, limits 에 따른 서비스 구분:
- Best-Effort:
  - requests, limits 를 갖고 있지 않다.
  - incompressible resource가 모자랄때, 가장 먼저 죽는다.
- Burstable:
  - requests와 limits 가 다르다. (일반적으로 limits 가 requests 보다 크다.)
- Guaranteed:
  - requests와 limts가 같다.
  - 가장 나중에 죽는다.

파드 우선순위

책의 내용과 살짝 다르다. k8s v1.24 문서를 기준으로 작성되었다.

apiVersion: scheduling.k8s.io/v1
kind: PrioirtyClass
metadata:
  name: high-priority
value: 1000
globalDefault: flase
description: "This is a very high priority Pod class"
---
apiVersion: v1
kind: Pod
metadata:
  name: random-generator
  labels:
    env: random-generator
spec:
  containers:
  - image: k8spatterns/random-generator:1.0
    name: random-generator
  priorityClassName: high-prioirty

프로젝트 자원

추가 참고자료 : 메모리 상승과 오버커밋
메모리 오버커밋 : 요구된 메모리를 그대로 할당하는 것이 아닌 실제 사용되는 시점에서 필요한 만큼의 메모리를 할당하는 방식에 의해 요구되는 메모리의 총량이 100%를 넘기는 경우
오버 커밋 상태에서 실제 메모리 사용 총량이 메모리 총량을 넘기게 될 수도 있는데, 이때 OOM-Killer에 의해 프로세스들을 죽여서 용량을 확보하게 된다.
개인 해석:
- 오버커밋에 의해 요청된 메모리와 사용하는 메모리는 차이가 날 수 있다.
- 즉 requests는 250M를 하는데, pod에서 오버커밋을 이용해 500M를 할당하고, 사용은 200M를 하고 있는 상황같은게 발생 할 수 있다는 것이다.
- kubernetes 는 기본적으로 requests 를 기준으로 스케줄링한다.

3장 선언적 배포

선언적 업데이트를 작동시키기 위한 옵션:
- kubectl replace로 새로운 버전의 deployment로 전체 deployment를 교체한다.
- deployment를 kubectl patch 나 kubectl edit으로 새로운 버전을 넣는다.
- kubectl set image 을 통해서 deployment에 새로운 이미지를 넣는다.
deployment 의 장점:
- deployment는 상태가 내부적으로 관리되는 객체이므로 클라이언트와 상호작용 없이, 서버측에서 실행된다.
- deployment 의 선언적 특성은 배포에 필요한 단계보다는 배포된 상태가 어떻게 보여야하는지를 알 수 있다.
- deployment의 정의는 운영 환경에 배포되기 전에 다양한 환경에서 테스트된 실행 가능한 객체이다.
- 업데이트 프로세스는 모두 기록되며, 일시 중지 및 계속을 위한 옵션, 이전 버전으로 롤백을 위한 옵션으로 버전이 지정된다.

고정 배포

Recreate 전략:
- 우선적으로 현재 버전의 모든 컨테이너를 죽이고, 이전 버전의 컨테이너가 축출될때 모든 신규 컨테이너를 동시에 시작한다.

블루-그린

블루(이전 버전), 그린(현재 버전)
블루와 그린을 모두 띄운뒤 신규 트래픽을 그린으로 보낸뒤, 기존 트래픽을 다 처리하면 블루를 삭제한다.
블루와 그린이 순간적으로 동시에 뜨게 된다.
즉, 자원이 2배로 필요하다.

카나리아

소수의 인스턴스를 교체하면서 동작한다.

4장 정상상태 점검

프로세스 상태는 애플리케이션의 정상상태를 결정하기에는 충분하지 않다.

Liveness probe

HTTP : 200~399 사이 응답코드
TCP : 성공적인 TCP connection
Exec : 성공적인 종료코드(0)
한번쯤은 yaml을 써보는게 도움이 될거 같아서 써본다. 실제로는 문서를 참고해서 작성할것

apiVersion: v1
kind: Pod
metadata:
  name: pod-with-liveness-check
spec:
  containers:
  - image: k8spatterns/random-generator:1.0
    name: random-generator
    env:
    - name: DELAY_STARTUP
      value: "20"
    ports:
    - containerPort: 8080
    protocol: TCP
    livenessProbe:
      httpGet:
        path: /actuator/health
        port: 8080
      initialDelaySeconds: 30

Readiness probe

liveness와는 다르게 readiness probe 이 실패할 경우, service의 endpoint가 제거되어 새로운 트래픽을 수신할 수 없게 된다.

Others

spring actuator, wide-fly swarm, karaf, microprofile spec 등 애플리케이션 프레임워크는 정상상태 점검을 위한 인터페이스를 제공한다.
로그는 표준스트림 이외에도 /dev/termination-log 에 남기는 것이 좋다.
OpenTracing이나 Prometheus 같은 트레이싱, 메트릭 수집 라이브러리와 통합하여 어플리케이션 상태를 관찰할 수 있도록 해야한다.

5장 수명주기 관리

k8s는 컨테이너를 종료시킬때, SIGTERM을 먼저, 그 다음 .spec.terminationGracePeriodSeconds 의 유예시간 이후 SIGKILL을 발생시킨다.
postStart, preStop 훅

apiVersion: v1
kind: Pod
metatdata:
  name: hooks
spec:
  containers:
  - image: k8spatterns/random-generator:1.0
  name: random-generator
  lifecycle:
    postStart:
      exec:
        command:
        - sh
        - -c
        - sleep 30 && echo "Wake up!" > /tmp/postStart_done
    preStop:
      httpGet:
        port: 8080
        path: /shutdown

수명주기 훅과 초기화 컨테이너

측면	수명주기 훅	초기화 컨테이너
활성화 단계	컨테이너 수명주기 단계	파드 수명주기 단계
시작 단계 동작	postStart 명령어	실행될 초기화 컨테이너 목록
종료 단계 동작	preStop 명령어	X
타이밍(Timing) 보장	postStart 명령은 컨테이너의 ENTRYPOINT 와 동시에 실행	애플리케이션 컨테이너가 시작되기 전에 모든 초기화 컨테이너는 성공적으로 종료가 완료되어야 한다.
사용 사례	컨테이너별로 트고하된 중요하지 않은 시작/정리 종료를 실행	컨테이너를 사용해 워크플로우 같은 순차적 작업을 수행. 작업 실행을 위해 컨테이너를 재사용

6장 자동 배치

가용한 노드 자원:
- Allocatable = Node Capacity - Kube-Reserved - System-Reserved
- Kube-Reserved : 쿠버네티스 데몬에 의해 사용되는 자원
- System-Reserved : sshd, udev 와 같은 시스템 데몬에 사용되는 자원
- OS와 Kubernetes가 사용하는 자원을 따로 예약해두지 않으면 자원 부족 문제가 생길 수 있다.

Node Affinity

.spec.affinity.nodeAffinity 를 통해서 선호 조건, 필수 조건을 걸 수 있다.

Pod Affinity

다른 파드와 상대적인 위치

Taint 와 Toleration

taint 종류:
- effect=NoSchedule : 스케줄링을 피하는
- effect=PreferNoSchdule : 가급적 스케줄링을 피하는
- effect=NoExecute : 이미 실행중인것을 빼도록

Descheduler

처음 들어본 개념이라 좀 찾아봤는데, 기본적으로 지원하는 건 아니고 추가적으로 deployment 형태로 설치해야하는 것 같다.
공식사이트 에서는 helm 이나 다른 방법으로 설치하는 것도 안내해주고 있다.
Scheduler 만으로는 앞으로 Balance 하는것을 만드는 거지, 이미 배포된 것들에 대해서 처리하지 못하기 때문에 사용한다.
전략 종류:
- RemoveDuplicates, LowNodeUtilization, RemovePodsViolatingInterPodAntiAffinity, RemovePodsViolatingNodeAffinity
Descheduler가 건들이지 않는 Pod:
- Replicaset, Deployment, Job, DeamonSet에 의해서 관리되지 않는 파드
- local storage을 갖는 pod
- PodDisruptionBudget 규칙에 위배되는 Pod
- Deschdeduler 파드

2부 행동 패턴

7장 배치 잡

잡의 특징:
- 잡은 일시적인 인메모리 작업이 아니라, 클러스터 재시작에도 살아남는 지속된 작업이다.
- 잡은 완료되고 나면, 삭제되지 않고 추적 목적으로 유지된다. 잡의 일부분으로 생성된 파드도 삭제되지 않으며 검사가 가능하다.
- 잡은 여러번 실행되어야 할 수 있다. (.spec.completions 항목 참조)
- 잡이 여러번 실행되어야하는 경우 동시에 실행할 수도 있다. (.spec.parallelism 항목 참조)
- Pod 가 실행 중인 동안 노드에 장애가 되거나 어떠한 이유로 Pod가 extract 되었을 때, Scheduler 는 Pod를 재배치 후 실행한다.
잡의 종류:
- 단일 파드 잡(Single Pod Job):
  - .spec.comletions 와 .spec.parallelism 값을 생략 또는 모두 1로 세팅
- 고정 완료 횟수 잡(Fixed completion count Job):
  - .spec.completions 은 1보다 크게, .spec.parallelism 은 1로 세팅
- 작업 큐 잡(Work queue Job):
  - .spec.completions 은 생략, .spec.parllelism 은 1보다 크게 세팅
복잡한 작업은 batch application framework(e.g. Spring Batch, JBeret) 으로 실행

8장 주기적 잡

책에 있는 내용은 v1beta1 이지만, 현재(v1.24) 에서는 v1 이다.

apiVersion: batch/v1
kind: CronJob
metadata:
  name: random-generator
spec:
  schedule: "*/3 * * * *"
  jobTemplate:
    spec:
      template:
        spec:
          containers:
          - name: random-generator
            image: k8spatterns/random-generator:1.0
            command:
            - "java"
            - "-cp"
            - "/"
            - "RandomRunner"
            - "/numbers.txt"
            - "10000"
          restartPolicy: OnFailure

주의사항:
- CronJob은 특정 상황에서 여러 잡을 생성할 수 있다. 따라서 Job은 멱등성(idempotent)을 지니도록 구성해야한다.
- v1 CronJob API 는 타임존 설정을 공식적으로 지원하지 않는다. 이는 내부 라이브러리가 어떻게 구현되었는 가에 따라서 다르게 동작할 수 있다. 즉, 프로덕션 레벨에서는 사용이 권장되지 않는다.
- CronJob 은 kube-controller-manager 의 시간대를 기준으로 한다.
개인 생각:
- 시간대별로 필요한거면, 복잡한 Job에 해당한다고 생각한다. Spring Batch를 사용하는게 옳지 않나 싶다.

9장 데몬 서비스

DeamonSet 의 특징:
- nodeSelector를 통해 제한하지 않는한, 모든 노드에 하나의 Pod가 배치된다.
- DeamonSet 에 의해 생성된 Pod은 생성된 시점에 nodeName을 가진다. 따라서 Scheduler에 의해 배치 되지 않는다. 이는 Scheduler와 상관 없이 실행되며, Scheduler에 의해 Pod들이 배치 되기 전에 실행할 수 있다는 것을 의미한다.
- 대부분의 컨트롤러는 DeamonSet에 의해 생성된 Pod를 더 높은 우선순위로 별개 취급한다.
DeamonSet 에 의해 생성되는 대표적인 오브젝트들:
- Service
- DNS
- NodeIP with hostPort
- Push
Static Pod 와 비교:
- Static Pod 는 Kubelet에 의해서만 관리되며, controller는 없고 health check 를 실행하지 않는다. 이 모든 것이 kubelet에 의해서만 관리된다.

10장 싱글톤 서비스

애플리케이션 외부 잠금

어플리케이션 외부에서 별도의 관리 프로세스를 통해서 싱글톤을 구현하는 방법
replica set으로 구현할 경우 replicas 숫자를 1로 유지한다는 보장이 없으므로 별도의 주의가 필요하다.
일시적으로 node가 비정상 상태일 경우, 새롭게 Pod 가 생성되는데, 이때 비정상이였던 node가 살아나면 싱글톤 보장이 깨진다.
StatefulSet 을 사용해 구현할 경우, 강력하게 싱글톤 제약을 걸 수 있지만 복잡성 또한 증가한다.
이렇게 StatefulSet 을 사용해 Singleton 서비스를 구성하면, Headless Service 를 사용해 묶어야한다.:
- 책의 이 부분이 이해하기 어려운데, 참고자료 - 조대협의 블로그 를 읽어보면 이해가 쉽다.
- 간략하게 요약하면, statfuleset 으로 만들어진 pod 같은 경우, 굳이 service를 통해서 접근할 필요가 없다. 하지만 service 가 없다면, pod 는 domain name을 가질수 없어 접근이 어렵다. 따라서 headless service 를 통해 pod를 묶기만 하고 접근은 pod로 한다.

애플리케이션 내부 잠금

distributed lock 을 활용하여 pod 가 여러개 뜨더라도 하나의 pod 만 active 상태로 만든다.
distributed lock 을 위하여 zookeeper, redis, etcd 등 이러한 내용이 구현되어 있는 프로그램 또는 프레임 워크가 필요하다.
k8s 에서는 master node 의 etcd 를 kubernetes api 를 통해서 노출하고 사용하는 편이 좋은 선택이다.:
- 또한 이렇게 하는 것이 아닌 configmap 이 동시에 하나의 pod만 수정 가능하다는 것을 이용하여 분산락을 대체해서 사용하는 방법도 있다.

PodDisruptionBudget

일정 비율의 파드가 임의의 한 시점에 노드에서 자발적으로 축출되지 않게 보장한다.
관련해서 책에서는 v1beta1 이지만 kubernetes v1.24 기준, v1 버전을 지원한다.

apiVersion: policy/v1
kind: PodDistruptionBudget
metadata:
  name: random-generator-pdb
spec:
  selector:
    matchLabels:
      app: random-generator
  minAvailable: 2

.spec.minAvailable, spec.maxUnavilable 중에 하나만 사용가능하다.

11장 스테이트풀 서비스

[[Twelve-Factor-App]]
Stateful 한 자원 : Storage, Networking, Identifier
기본 예제에 꽤나 직관적으로 특징을 알아볼수 있어서 기재

apiVersion: apps/v1
kind: StatefulSet
metadata:
  name: rg
spec:
  serviceName: random-generator
  replicas: 2
  selector:
    matchLabels:
      app: random-generator
  template:
    metadata:
      labels:
        app: random-generator
    spec:
      containers:
      - image: k8spatterns/random-generator:1.0
        name: random-generator
        ports:
        - containerPort: 8080
          name: http
        volumeMounts:
        - name: logs
          mountPath: /logs
  volumeClaimTemplates:
  - metadata:
      name: logs
    spec:
      accessModes: [ "ReadWriteOnce" ]
      resources:
        requests:
          storage: 10Mi

Scale 이 증가할 때는 pvc 가 자동생성, Scale이 감소할 때는 pvc 가 삭제되지 않는다. (데이터 보존을 위해)
- 만약 PV 재사용을 원한다면 직접 pvc 삭제

네트워크

Headless Service 로 관리:
- DNS 생성을 위해서
- 단순히 묶기위한 객체

순서성

Pod 생성 순서가 Scale에 의해서 생긴 순서를 보장한다.
내려갈때도 그 순서가 보장된다.

개인적인 궁금점

StatefulSet 에서 Durability는 어떻게 보장되지? Node가 죽으면 어떻게 동작하는지 잘 모르겠다.:
- Kubernetes Tip: How Statefulsets Behave Differently Than Deployments When Node Fails?
- 위 글에서 꽤나 상세한 설명을 하고 있다. 하지만 그렇게 와닿지는 않아서 나중에 시간될때 kind로 cluster 간략하게 구성해서 테스트 해봐야할것 같다.

기타 기능

분할 업데이트
병렬 배포
at-most-one 보장

12장 서비스 디스커버리

proxy 레이어를 둬서 application이 간접적으로 service registry 를 참조하는 구조

내부 디스커버리

Service 객체를 사용하는 방법:
- 환경 변수를 통한 방법:
  - 환경변수를 참조하도록 어플리케이션 개발, 환경변수 주입
- DNS 참조를 통한 디스커버리
- 다중 포트
- 세션 어피니티
- 레디니스 점검
- 가상 IP:
- ClusterIP 선택:
  - .spec.clusterIP를 사용

수동 서비스 디스커버리

Endpoint를 직접 만든다.
ExternalName을 사용하는 Service

클러스터 외부의 서비스 디스커버리

외부에 서비스를 노출하는 방법:
- nodePort 등으로 외부에 서비스를 노출, 이를 외부 서비스 디스커버리로 참조
- LoadBalancer를 사용
- Headless service 이용

어플리케이션 계층 서비스 디스커버리

ingress를 활용하여 만든다.

개인생각

이 책을 쓰는 시점에는 Istio가 서비스디스커버리의 메타가 아니라서 이런 여러 방법을 소개함에도 소개가 되지 않은 것 같다.
물론 어떤 관점에서 본다면 ingress의 일종이라고 여길수 있겠지만, istio 는 envoy를 활용하여 더 많은 메커니즘이 있다.
서비스 디스커버리에 대해서는 istio를 추가로 공부하자.

13장 자기 인식

Downward API 공식문서
Downward API 는 자신에 대한 정보를 환경변수, 볼륨의 형태로 제공할 수 있다.

apiVersion: v1
kind: Pod
metadata:
  name: kubernetes-downwardapi-volume-example
  labels:
    zone: us-est-coast
    cluster: test-cluster1
    rack: rack-22
  annotations:
    build: two
    builder: john-doe
spec:
  containers:
    - name: client-container
      image: k8s.gcr.io/busybox
      command: ["sh", "-c"]
      args:
      - while true; do
          if [[ -e /etc/podinfo/labels ]]; then
            echo -en '\n\n'; cat /etc/podinfo/labels; fi;
          if [[ -e /etc/podinfo/annotations ]]; then
            echo -en '\n\n'; cat /etc/podinfo/annotations; fi;
          sleep 5;
        done;
      volumeMounts:
        - name: podinfo
          mountPath: /etc/podinfo
  volumes:
    - name: podinfo
      downwardAPI:
        items:
          - path: "labels"
            fieldRef:
              fieldPath: metadata.labels
          - path: "annotations"
            fieldRef:
              fieldPath: metadata.annotations

3부 구조 패턴

14장 초기화 컨테이너

초기화 컨테이너가 실패하면, 전체 파드는 다시 시작되고, 모든 초기화 컨테이너도 다시 실행된다
초기화 컨테이너 이외의 초기화 기법:
- admission controller
- admission webhook
- initializer
- PodPreset

15장 사이드카

일반적으로 서비스의 네트워킹, 모니터링, 트레이싱에 쓰인다.
관점지향 프로그래밍과 유사

16장 어댑터

application 이 쓰는 log의 형태가 모니터링할때 원하는 형태와 다를때 사용할 수 있다.
일종의 사이드카

17장 앰배서더(Ambassador)

application 에서 외부에 접근할때, 외부 복잡성을 숨기고 간단하게 접근하도록 할수 있다.
cache, circuit-breaker 등에 활용 될 수 있다.
일종의 사이드카

4부 설정 패턴

18장 EnvVar 설정

한눈에 여러개 설정을 볼수 있어서 yaml을 기재

apiVersion: v1
kind: Pod
metadata:
  name: random-generator
spec:
  containers:
  - image: k8spatterns/random-generator:1.0
    name: random-generator
    env:
    - name: LOG_FILE
      value: /tmp/random.log
    - name: PATTERN
      valueFrom:
        configMapKeyRef:
          name: random-generator-config
          key: pattern
    - name: SEED
      valueFrom:
        secretKeyRef:
          name: random-generator-secret
          key: seed

시작하고나서는 변수를 변경할수 없어, 변경을 원할경우 재시작을 해야한다.:
- port, db connection configuration 등에 적합

19장 설정 자원

volume 으로 mount 하면 변경이 반영된다.
Secret 의 특징:
- 자신에게 접근하는 파드가 실행 중인 노드에만 배포된다.
- 노드에서 시크릿은 tmpfs의 메모리에 저장되며, 실제 스토리지에는 기록되지 않고 파드가 제거될 때 함께 제거된다.
- etcd에 암호화된 형태로 저장된다.
configmap 과 secret 에는 자원 제약이 있으므로 무분별하게 사용해서는 안된다.

20장 불변 설정

불변 설정 패턴에 데이터 컨테이너를 사용하는 것은 다소 복잡하지만 아래 장점이 있다.:
- 환경별 설정은 컨테이너 안에 있으므로, 여타 컨테이너 이미지처럼 버전을 지정할 수 있다.
- 이런 방식으로 생성된 설정은 컨테이너 레지스트리를 통해 배포될 수 있고, 클러스터에 접근하지 않아도 설정을 확인할 수 있다.
- 컨테이너 이미지 안에 이쓴 설정을 직접 변경할 수는 없다. 설정을 변경하려면 버전을 업데이트한 새로운 컨테이너 이미지가 필요하다.
- 설정 데이터 이미지는 설정 데이터가 너무 복잡해 환경 변수나 컨피그맵에 넣을 수 없을 때 유용하다. 임의의 대규모 설정 데이터를 수용할 수 있기 때문이다.
단점:
- 레지시트리를 통해 추가 컨테이너 이미지를 빌드하고 배포해야 하므로, 복잡성이 더 높다.
- 민감한 설정 데이터를 처리하는 보안 문제에는 아무런 대책이 없다.
- 쿠버네티스의 경우 별도의 초기화 컨테이너 처리가 필요하므로, 환경에 따라 다른 디플로이먼트 객체를 관리해야 한다.

21장 설정 템플릿

어플리케이션이 시작되기 전에 설정 파일을 세팅하는 방법:
- 템플릿 처리기를 ENTRYPOINT의 일부로 Dockerfile에 추가해서, 탬플릿 처리를 컨테이너 이미지에 포함시킬 수 있다.
- 쿠버네티스의 경우 템플릿 처리기가 실행되고 파드의 어플리케이션 컨테이너에 대한 설정을 만드는 초기화 컨테이너를 사용할수 있다.
모든 내용을 다 볼 필요는 없고, 아래 yaml 만 읽어도 대충은 어떻게 설정할지 보여서 yaml만 기재

apiVersion: extensions/v1beta1
kind: Deployment
metadata:
  labels:
    example: cm-template
  name: widfly-cm-template
spec:
  replicas: 1
  template:
    metadata:
      labels:
        example: cm-template
    spec:
      initContainers:
      - image: k8spatterns/example-config-cm-template-init
        name: init
        volumeMounts:
        - mountPath: "/params"
          name: wildfly-parameters
        - mountPath: "/out"
          name: widfly-config
      containers:
      - image: jboss/wildfly:10.1.0.Final
        name: server
        command:
        - "/opt/jboss/wildfly/bin/standalone.sh"
        - "-Djboss.server.config.dir=/config"
        ports:
        - containerPort: 8080
          name: http
          protocol: TCP
        volumeMounts:
        - mountPath: "/config"
          name: wildfly-config
        volumes:
        - name: wildfly-parameters
          configMap:
            name: wildfly-parameters
        - name: wildfly-config
          emptyDir: {}

5부 고급 패턴

22장 컨트롤러

reconciliation 과정:
- observe : 관측하고 있는 자원이 변경될 때 쿠버네티스가 배포하는 이벤트를 watch 하여 actual state를 찾는다.
- analyze : 실제 상태와 요청한 상태의 차이를 알아낸다.
- act : 실제 상태가 요청한 상태로 구동되도록 작업을 수행한다.
reconciliation components:
- controller : 표준 쿠버네티스 자원을 모니터링하고 작동하는 간단한 reconciliation process.
- operator: CRD와 연동.
컨트롤러는 Singletone Service 로 동작하여 동시성 문제를 방지한다.
controller 데이터를 저장할수 있는 위치:
- label:
  - 자원 메타데이터의 일부인 label은 모든 컨트롤러에서 watch할 수 있으며, backend database 에서 indexing 되어 효율적인 쿼리검색이 가능하다.
  - selector 를 사용하기 위해서는 반드시 label을 사용해야한다.
  - label은 허용된 구문과 문자 집합이 따로 있다.
- annotation:
  - label을 대체할 자원
  - 색인되지 않는다.
- configmap:
  - configmap 보다는 CRD가 더 권장되지만, CRD는 클러스터 권한이 더 높게 요구된다.
책에는 추가적인 다른 내용도 있긴하지만, deprecated 된 내용도 있어서 이정도만 알면 될것 같다.

23장 오퍼레이터

CRD 에는 특별한 두가지 자원이 존재한다.:
- scale: 이 속성을 사용하면 CRD 에서 replica 수를 관리하는 방법을 지정할 수 있다. HorizontalPodAutoscaler를 사용한다면 필수로 지정되어야한다.
- status: 외부에서 상태를 업데이트 할 수 있다.
컨트롤러와 오퍼레이터 분류:
- 설치 CRD:
  - 쿠버네티스 플랫폼에서 애플리케이션을 설치하고 운영하는 데 사용된다. 일반적인 예로 프로메테우스 자체를 설치하고 관리하는 프로메테우스 CRD가 있다.
- 어플리케이션 CRD:
  - 어플리케이션별 도메인 컨셉을 나타낼때 사용한다.
오퍼레이터 개발과 배포에 도움되는 프로젝트들:
- CoreOS Operator Framework
- Kubebuilder
- Metacontroller

24장 탄력적스케일

HPA 관련

kubectl autoscale deployment <deployment name> --cpu-percent=50 --min=1 --max=5

apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: random-generator
  spec:
    minReplicas: 1
    maxReplicas: 5
    scaleTargetRef:
      apiVersion: apps/v1
      kind: Deployment
      name: random-generator
    metrics:
    - resource:
        name: cpu
        target:
          averageUtilization: 50
          type: Utilization
      type: Resource

metric types:
- standard metrics:
  - .spec.metrics.resource[:].type 으로 선언되며 CPU, Memory 등 자원 사용량 메트릭을 나타낸다.
- user defined metrics:
  - .spec.metrics.resource[:].type 으로 선언되며 클러스터별로 각기 다른 클러스터링 모니터링 설정이 필요하다.
  - prometheus, datadog, azure 등등 에서 널리 사용되고 있다.
- 외부 메트릭:
  - 메시지 큐와 같이 외부 서비스에 존재하는 지표를 사용하고 싶을때 사용
HPA 가 해주는 것들:
- 메트릭 선택
- 쓰래싱(thrashing) 방지
- 지연된 반응

수직 Pod Autoscaling

Veritcal Pod Autoscaler (VPA)
좀 찾아보니까 기본으로 제공되는 건 아닌것 같다. 공식 사이트:
- 이것저것 민감한 이슈들이 많아서 아직까지 beta 상태이다. 글을 쓰는 이 시점에도 19시간 전에 커밋된게 있는 걸로 보아 아직까지 개발중인 것 같다.
책이랑 좀 다르니 공식 사이트를 따르자.

apiVersion: autoscaling.k8s.io/v1
kind: VerticalPodAutoscaler
metadata:
  name: my-app-vpa
spec:
  targetRef:
    apiVersion: "apps/v1"
    kind:       Deployment
    name:       my-app
  updatePolicy:
    updateMode: "Auto"

25장 이미지 빌더

읽어보니까, 예전에 봤던 면접이 이걸 하라고 했던 것 같다.
대충 yaml 만 적어둔다. 자세한건 공식 문서를 참고하자.

apiVersion: v1
kind: BuildConfig
metadata:
  name: runtime
spec:
  source:
    images:
    - from:
        kind: ImageStreamTag
        name: random-generator-build:latest
      paths:
      - sourcePath: /deployments/.
        destinationDir: "."
    dockerfile: |-
      FROM openjdk:8-alpine
      COPY *.jar /
      CMD java -jar /*.jar      
  strategy:
    type: Docker
  output:
    to:
      kind: ImageStreamTag
      name: random-generator:latest
  triggers:
  - imageChange:
      automatic: true
      from:
        kind: ImageStreamTag
        name: random-gnerator-build:latest
    type: ImageChange

KNative 도 이를 지원한다고 한다. KNative는 조금더 공부해봐야지 알 것 같다.:
- 옮긴이의 말로는 중단되고, Tekton Pipelines 으로 대체되었다고 한다. 이것도 한번 찾아봐야지 알것 같다.

–

다읽은 후기

책을 정리하면서 읽고, 최대한 모르는 건 찾아보면서 읽었으나 아직 잘 모르겠는게 많다.
실습을 해보면서 익히는게 좋을 것 같다. 책이 좀 되서, 잘 안되는 예제를 몇개 만나고 나니 예제를 안하고 책 읽고, 공식문서 보고 넘어가는 식으로 공부하니 손에 익지 않았다.
손으로 직접 해보고 싶은건 Builder, Autoscaler, Service Discovery 이다. 이렇게 3개는 다른 공부를 하면서도 접해본적이 없어서 책을 읽으면서도 꼭 나중에 손으로 해봐야겠다고 생각했다.
전체적으로 훑기에 좋았던 것 같다. CKA 자격증 동영상만 볼때는 잘 몰랐던 내용들이 나와서 계속 찾아보면서 읽었고 전체적인 이해도에 도움을 주었다.:
- 특히 StatefulSet 을 읽었을때, 아 이런식으로 돌리는구나 싶었다.
단점은 책이 좀 나온지 돼서, version issue나 deprecated 된 프로젝트가 있었다는 것 정도이다.

쿠버네티스 패턴

created : Tue, 16 Aug 2022 10:56:05 +0900

modified : Fri, 26 Aug 2022 16:08:59 +0900

1장 개요

클라우드 네이티브로 가는길

분산 기본 요소

컨테이너

파드

서비스

레이블

어노테이션

네임스페이스

1부 기본 패턴

2장 예측 범위 내의 요구사항

런타임 의존성

자원 프로파일

파드 우선순위

프로젝트 자원

3장 선언적 배포

고정 배포

블루-그린

카나리아

4장 정상상태 점검

Liveness probe

Readiness probe

Others

5장 수명주기 관리

6장 자동 배치

Node Affinity

Pod Affinity

Taint 와 Toleration

Descheduler

2부 행동 패턴

7장 배치 잡

8장 주기적 잡

9장 데몬 서비스

10장 싱글톤 서비스

애플리케이션 외부 잠금

애플리케이션 내부 잠금

PodDisruptionBudget

11장 스테이트풀 서비스

네트워크

순서성

개인적인 궁금점

기타 기능

12장 서비스 디스커버리

내부 디스커버리

수동 서비스 디스커버리

클러스터 외부의 서비스 디스커버리

어플리케이션 계층 서비스 디스커버리

개인생각

13장 자기 인식

3부 구조 패턴

14장 초기화 컨테이너

15장 사이드카

16장 어댑터

17장 앰배서더(Ambassador)

4부 설정 패턴

18장 EnvVar 설정

19장 설정 자원

20장 불변 설정

21장 설정 템플릿

5부 고급 패턴

22장 컨트롤러

23장 오퍼레이터

24장 탄력적스케일

수직 Pod Autoscaling

25장 이미지 빌더

다읽은 후기