Cloud Operations 공인 인터넷풀부터 VM NIC까지 트래픽 추적 디버깅 광역 공인 인터넷풀, 엣지 라우팅, 내부 L3/방화벽, Virtual Router/NAT, 하이퍼바이저 브리지와 VM NIC까지 같은 흐름으로 따라가며 패킷이 어디서 사라지는지 좁히는 운영 절차입니다.
Cloud Operations CloudStack Virtual Router에서 트래픽이 어디서 막히는지 추적하는 방법 CloudStack 운영 시절의 트래픽 추적 메모를 공개 가능한 형태로 정리했습니다. tcpdump, iptables, conntrack, ips.json을 함께 보면서 Public IP, VR, DNAT, VM 중 어디서 막히는지 좁히는 절차입니다.
OpenStack OpenStack 네트워크·스토리지 장애를 명령 순서로 좁히는 방법 Obsidian에 흩어진 OpenStack 네트워크, 보안 그룹, Cinder 볼륨, 로그 점검 명령을 운영 순서로 재구성했습니다.
RHOSO RHOSO 18: OpenStack on OpenShift를 운영 관점으로 읽기 RHOSP 18로 불리는 Red Hat OpenStack Services on OpenShift 18.0을 운영 관점에서 정리했습니다. OpenShift 위 control plane, RHEL data plane, Operator/CRD 배포 흐름, 네트워크와 마이그레이션 점검 기준을 다룹니다.
Cloud Operations 볼륨·스냅샷·SR: coalesce 이후 스냅샷 체인을 확인할 때 - 스토리지 프로세스 관점 coalesce 이후 스냅샷 체인을 확인할 때를 스토리지 프로세스 관점에서 좁혀 보는 케이스. Storage / Volume 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.
Cloud Operations 볼륨·스냅샷·SR: 스토리지 상태와 VM 상태가 다르게 보일 때 - 스토리지 상태 관점 스토리지 상태와 VM 상태가 다르게 보일 때를 스토리지 상태 관점에서 좁혀 보는 케이스. Storage / Volume 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.
Cloud Operations Compute Node 장애: compute node 장애 뒤 VM 위치를 정리할 때 - host 상태 관점 compute node 장애 뒤 VM 위치를 정리할 때를 host 상태 관점에서 좁혀 보는 케이스. Compute Node 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.
Cloud Operations Compute Node 장애: compute node 장애를 VM 영향도로 풀어볼 때 - host 상태 관점 compute node 장애를 VM 영향도로 풀어볼 때를 host 상태 관점에서 좁혀 보는 케이스. Compute Node 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.
Cloud Operations VM 부팅 복구: VM이 커널 단계에서 멈출 때 - 부팅 로그 관점 VM이 커널 단계에서 멈출 때를 부팅 로그 관점에서 좁혀 보는 케이스. Guest Boot 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.
Cloud Operations VM 부팅 복구: VM이 커널 단계에서 멈출 때 - hypervisor 상태 관점 VM이 커널 단계에서 멈출 때를 hypervisor 상태 관점에서 좁혀 보는 케이스. Guest Boot 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.
Cloud Operations Virtual Router 네트워크: Virtual Router 경로에서 통신이 막힐 때 - 네트워크 경로 관점 Virtual Router 경로에서 통신이 막힐 때를 네트워크 경로 관점에서 좁혀 보는 케이스. Virtual Router / Network 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.
Cloud Operations 볼륨·스냅샷·SR: tapdisk가 디스크 I/O를 붙잡을 때 - 스토리지 프로세스 관점 tapdisk가 디스크 I/O를 붙잡을 때를 스토리지 프로세스 관점에서 좁혀 보는 케이스. Storage / Volume 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.
Cloud Operations Virtual Router 네트워크: Virtual Router 경로에서 통신이 막힐 때 - 네트워크 경로 관점 Virtual Router 경로에서 통신이 막힐 때를 네트워크 경로 관점에서 좁혀 보는 케이스. Virtual Router / Network 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.
Cloud Operations Compute Node 장애: compute node 장애 뒤 VM 위치를 정리할 때 - host 상태 관점 compute node 장애 뒤 VM 위치를 정리할 때를 host 상태 관점에서 좁혀 보는 케이스. Compute Node 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.
Cloud Operations Virtual Router 네트워크: Virtual Router 경로에서 통신이 막힐 때 - 네트워크 경로 관점 Virtual Router 경로에서 통신이 막힐 때를 네트워크 경로 관점에서 좁혀 보는 케이스. Virtual Router / Network 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.
Cloud Operations Virtual Router 네트워크: VM 간 통신 장애를 계층별로 좁힐 때 - DB 상태 관점 VM 간 통신 장애를 계층별로 좁힐 때를 DB 상태 관점에서 좁혀 보는 케이스. Virtual Router / Network 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.
Cloud Operations VM 성능·I/O: 성능 지표와 로그가 서로 다르게 보일 때 - 성능 지표 관점 성능 지표와 로그가 서로 다르게 보일 때를 성능 지표 관점에서 좁혀 보는 케이스. Performance / Memory / I/O 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.
Cloud Operations VM 부팅 복구: VM이 커널 단계에서 멈출 때 - hypervisor 상태 관점 VM이 커널 단계에서 멈출 때를 hypervisor 상태 관점에서 좁혀 보는 케이스. Guest Boot 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.
Cloud Operations Virtual Router 네트워크: conntrack 한계로 세션이 끊길 때 - 패킷 흐름 관점 conntrack 한계로 세션이 끊길 때를 패킷 흐름 관점에서 좁혀 보는 케이스. Virtual Router / Network 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.
Cloud Operations VM 성능·I/O: 성능 지표와 로그가 서로 다르게 보일 때 - 모니터링 수집 관점 성능 지표와 로그가 서로 다르게 보일 때를 모니터링 수집 관점에서 좁혀 보는 케이스. Performance / Memory / I/O 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.
Cloud Operations 운영 포털·모니터링: 모니터링 화면과 실제 리소스가 다를 때 - 수집 흐름 관점 모니터링 화면과 실제 리소스가 다를 때를 수집 흐름 관점에서 좁혀 보는 케이스. Monitoring / Portal 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.
Cloud Operations Compute Node 장애: compute node 장애를 VM 영향도로 풀어볼 때 - host 상태 관점 compute node 장애를 VM 영향도로 풀어볼 때를 host 상태 관점에서 좁혀 보는 케이스. Compute Node 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.
Cloud Operations Virtual Router 네트워크: VM 간 통신 장애를 계층별로 좁힐 때 - DB 상태 관점 VM 간 통신 장애를 계층별로 좁힐 때를 DB 상태 관점에서 좁혀 보는 케이스. Virtual Router / Network 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.
Cloud Operations VM 성능·I/O: 성능 지표와 로그가 서로 다르게 보일 때 - DB 상태 관점 성능 지표와 로그가 서로 다르게 보일 때를 DB 상태 관점에서 좁혀 보는 케이스. Performance / Memory / I/O 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.
Cloud Operations VM 성능·I/O: 성능 지표와 로그가 서로 다르게 보일 때 - 성능 지표 관점 성능 지표와 로그가 서로 다르게 보일 때를 성능 지표 관점에서 좁혀 보는 케이스. Performance / Memory / I/O 계층의 증상, 확인 명령, 조치 전 판단, 복구 기준을 정리했다.