정글 · 144

  1. 2025
  2. 7월
  3. 07.31사람은 무엇으로 사는가?
  4. 07.30KRAFTON Yeoksam Office
  5. 07.29Slowly flowing day
  6. 07.28What's this?
  7. 07.27Lime Light
  8. 07.26우리가 기다린 미래
  9. 07.25Final approach
  10. 07.24폭풍의 눈
  11. 07.23IYKYK
  12. 07.22순살치킨 -> 치킨너겟
  13. 07.21TRAIN - TRAIN
  14. 07.20어떤 통찰도 지름길로는 얻을 수 없다
  15. 07.19시간이 느리게 가는 건
  16. 07.18EVEREST
  17. 07.17깊은 사고는 더 이상 니즈가 없다
  18. 07.16이기적인 토대 위
  19. 07.15무엇이든, 언제가는
  20. 07.14경험을 압축하는 알고리즘은 존재하지 않는다 ⏳
  21. 07.13무한한 가능성을 가질 것
  22. 07.12화려한 거짓을 향해
  23. 07.11Kentucky Fried Chicken 🍗
  24. 07.10Tropical Blue 🌊
  25. 07.09처음처럼 내 딛는
  26. 07.08어제와 다른 하늘의 색
  27. 07.07누군가의 달이었기를 🌕
  28. 07.06아직 뜯지 않은 마음 🎁
  29. 07.05황금의 오솔길
  30. 07.04우리는 오가는 바람
  31. 07.03Nic dwa razy
  32. 07.02Never basic
  33. 07.01입꼬리올림근
  34. 6월
  35. 06.30그럼에도 불구하고
  36. 06.29과잉포장된 자존심
  37. 06.28E3i3 🛫
  38. 06.27118 ✨
  39. 06.26무한 우주에 순간의 빛일지라도 🌌
  40. 06.25RUSH
  41. 06.24그래, 우리는
  42. 06.23The wind blowing low
  43. 06.22피어나는 마음의 꽃
  44. 06.21하나는 죽고, 하나는 살았다 💡
  45. 06.20초속일초
  46. 06.19씨앗이 가장 고귀한 이유는
  47. 06.18Evening Primrose 🏵️
  48. 06.17마음이 휑뎅그렁할 때
  49. 06.16하나
  50. 06.15강철무지개
  51. 06.14유람 🚉
  52. 06.1313일의 금요일 ⏰
  53. 06.12백만 스물하나, 백만 스물둘
  54. 06.11경안천 🥩
  55. 06.10달이 아름답네요 🌕
  56. 06.09Tampermonkey 🖥️
  57. 06.08미르 ✨
  58. 06.07나 평생 꿈만을
  59. 06.06아르기닌 🍫
  60. 06.05변속주 🌃
  61. 06.04Global Running Day 🏃‍
  62. 06.03가장 밝은 별
  63. 06.02천천히 🌃
  64. 06.01circular metal ring 🏀
  65. 5월
  66. 05.31담장과 쪽문 🐋
  67. 05.30투표런 🚀
  68. 05.29출발선 🏃
  69. 05.28Post Traumatic Growth 🌠
  70. 05.27SET 🎂
  71. 05.26READY 📅
  72. 05.25청복 💙
  73. 05.24열복 🫀
  74. 05.23강제 푸시 반성합니다 🔁
  75. 05.22유로파 🍏
  76. 05.21떠오름과 저묾 🌞
  77. 05.20Family Friend Fools
  78. 05.19Time machine ⏰
  79. 05.18맑은 일요일 🧼
  80. 05.17흐린 토요일 🐢
  81. 05.16PTG 🌧️
  82. 05.15셋이 만드는 하나 🧭
  83. 05.14Lotte+Cafeteria 🍔
  84. 05.13오십삼 🌤️
  85. 05.12일장춘몽 💊
  86. 05.11𝑬𝒗𝒆𝒓𝒍𝒂𝒏𝒅, 𝑬𝒗𝒆𝒓 𝑴𝒊𝒏𝒅 🎡
  87. 05.10五月雨よ 🌧
  88. 05.09Your Journey Starts Here 🪧
  89. 05.08「권의 속도」 📄
  90. 05.07Quiet Air ⏳
  91. 05.06놀자판 하루 🐷
  92. 05.05뭔데이 🎏
  93. 05.04After School 🎒
  94. 05.03나침반이 가리킨 곳 🌌
  95. 05.02짧은 하루 📖
  96. 05.01예고된 악재는 악재가 아니다 🌧️
  97. 4월
  98. 04.30Can More 🍧
  99. 04.29초급반 🏃‍
  100. 04.28감사합니다. 죄송합니다. 🙏
  101. 04.27맥도날드 원정 🍔
  102. 04.26무용(無用)의 쓸모 🛤️
  103. 04.25Sunny Day 🌞
  104. 04.24벚나무 아래에서 🌸
  105. 04.23언제나 이타카를 마음에 두라 🌿
  106. 04.22D-100 🧑‍💻
  107. 04.21수상한 미용실 💇‍♂️
  108. 04.20손으로 컴퓨터를 마주하다🔧
  109. 04.19비가 오면 빨래를 하자 🌧️
  110. 04.18반차😴
  111. 04.17발표, 청소, 러닝🗣️
  112. 04.16반티 발주👕
  113. 04.15첫 달리기🏃‍
  114. 04.14선택과 해석🗳️
  115. 04.13Home Sweet Home🏠
  116. 04.12人生
  117. 04.11반티 디자인 공모 & 제출👕
  118. 04.10알고리즘의 끝, C언어의 시작🧭
  119. 04.09하와이안 스테이크🥩
  120. 04.08Long Chat (#🎮)
  121. 04.07Es irrt der Mensch, solang' er strebt.📚
  122. 04.06마무리🛌
  123. 04.05움직이는 물체의 시간은 느리게 간다💤
  124. 04.04하나의 칼날🗡️
  125. 04.033x7=21🧗
  126. 04.02퀴즈 다음날, 시험 전날😴
  127. 04.01April Fools' Day🎭
  128. 3월
  129. 03.311년의 90번째 날🌅
  130. 03.30日曜日은 칠요일 중 첫째 날 이다⏰
  131. 03.29토요일은 주말이 아니다☕
  132. 03.28그래프와 치킨버거🐔
  133. 03.273주차의 시작🗓️
  134. 03.26기초 다지기🔧
  135. 03.25기초 다지기 & 정리해야 할 CS 개념들💡
  136. 03.240.44%
  137. 03.23본가 다녀온 날🏡
  138. 03.22문제 풀이에 집중한 하루 📅
  139. 03.21동료학습🌿
  140. 03.20첫번째 시험📝
  141. 03.19먹다가 끝난 하루🍖
  142. 03.18눈이 쌓이면 버그도 쌓인다❄️
  143. 03.17깃허브, 팀별 면담, 키워드 공부👨‍💻
  144. 03.16외출과 배달🚶🛍️
  145. 03.15첫 주말🛏️
  146. 03.14컴퓨팅 사고로의 전환🧠
  147. 03.13cookie4u.store🍪 + 1주차 발제📚 + 회식🍺
  148. 03.12디지털 포춘쿠키🍪
  149. 03.11정글 입성🏕
  150. 03.10입소 당일📅

경험을 압축하는 알고리즘은 존재하지 않는다 ⏳

오늘은 클릭하우스를
듀얼 클러스터로 만들어서
쓰기 전용과 읽기 전용으로 데이터 베이스를
나누는 작업을 진행했다.

이를 CQRS(command query responsibility segregation,명령 쿼리 책임 분리)라고 한다.

우리가 데이터 베이스를 클릭하우스로 선택한 이유를 설명하려면
우리가 뭘 하는질 알아야하는데

클릭랩은 클릭스트림이라고 불리는 웹사이트 사용자 행동 데이터를
초고속으로 수집 분석하는 웹 애널리틱스 플랫폼이다(구글 애널리틱스같은)

이런 주제 특성상 다음과 같은 요구사항이 있는데

이처럼 수많은 이벤트를 빠르게 기록하고
대용량 데이터를 효율적으로 분석해야 하는 환경에서

일반적인 관계형 데이터베이스로는
초당 수만 건의 데이터를 빠르게 쓰기 어렵고

복잡한 조건의 분석 쿼리를 처리하면
금방 느려지는 문제가 생길 것이라고 생각했다

그래서 찾아보다 발견한게 클릭하우스이다

클릭하우스는 컬럼 지향 저장 방식과
벡터화된 실행 엔진을 기반으로
대규모 데이터를 초고속으로 집계하고 필터링할 수 있는 성능을 갖추고 있다

즉 프로젝트 클릭랩에 가장 적합한 선택지처럼 보였다.

페이즈2로 넘어오면서
CQRS를 할 수 밖에 없었던 이유는

클릭랩의 시스템은 한쪽으로는
수십만 건의 사용자 행동 이벤트를 지연 없이 받아들여야 하고

다른 한쪽으로는 복잡한 조건으로 사용자 흐름을 분석하거나
시각화해야 하는 이중적인 요구를 동시에 만족시켜야 하기 때문인데

이 두 가지 작업은 기술적으로 성격이 완전히 다르다
쓰기 작업은 단순하지만 고빈도이고
읽기 작업은 빈도는 낮지만 계산이 복잡하고 리소스를 많이 사용한다

하나의 데이터베이스에 이 두 작업을 동시에 처리하려고 하면
성능 병목이나 데이터 유실의 위험이 존재하게 되고

실제로 API게이트웨이 병목으로 인한 접근 차단과
80%수준의 데이터 전송율을 통해서 직접 경험해보았기 때문에
단일 데이터베이스의 문제점을 체감했다

이를 해결하기 위해 CQRS패턴을 도입한것이다
즉, 쓰기 전용 인스턴스와 읽기 전용 인스턴스를 분리하여
데이터베이스의 분업화를 이룬 것이다

쓰기 전용 데이터베이스는 오직 이벤트 수집에 집중할 수 있도록 설계되어
SDK를 통해 수집된 클릭스트림 데이터는 쓰기전용 데이터베이스에 쌓이고

읽기 전용 데이터베이스는 쿼리 최적화와 캐싱 분석에 집중하여
프론트엔드(대시보드)와 연결되어있다.

그리고 그 둘을 동기화 시켜주기위해
클릭하우스 키퍼라는 개념또한 도입하였다.

키퍼는 쉽게 말해서
조율 도구이다

여러 데이터 베이스 인스턴스가 서로 동시기화 할때
헷갈리지 않게,
데이터를 올바르게 복제-동기화할 수 있도록 해주는 중심축이라고 보면 된다.

우리 클릭랩은 읽기전용 서버와 쓰기 전용 서버를 분리해 놓았는데
고객사 프론트에 설치된 SDK를 통해 발생한 이벤트는
먼저 우리 쓰기 전용 서버에 쓰여지고
읽기 전용 서버는 업데이트되는
쓰기 전용 서버의 데이터를 따라잡기 위해
ReplicatedMergeTree라는 엔진을 사용한다.

이 엔진은 쓰기 전용 서버의 데이터를 보면서
어떤 데이터가 새로 생겼는지
어떤 파티션이 병합됐는지
같은 걸 추적한다

그걸 키퍼를 통해 주기적으로 동기화하면서
읽기 전용 서버가 항상 최신 데이터를 갖고 있도록 해주는 것이다

결국 키퍼가 있어야,
읽기 전용 서버가 안정적으로 분석 쿼리를 처리하면서도
쓰기 서버와 데이터 불일치 없이
잘 따라갈 수 있는 구조가 만들어진다는 것.

이렇게 CQRS구현이 끝나고
이제 오토스케일링 그룹의
시작 템플릿을 만져야 했는데…

시작 템플릿은
나를 밤새게 했다…

월요일과 화요일의 기억은
오로지
시작 템플릿 뿐이다.


경험을 압축하는 알고리즘은 존재하지 않는다.

AWS가 이야기하는 격언으로서,
인류를 지속적으로 진화시키는 것은 ‘직감’이 아닌,
‘직접 겪은 경험을 기반으로 한 데이터와 사고방식’이라는 뜻에서 유래되었다.
실제로 아마존은 타 회사들을 압도적으로 상회하는 수준의 Data-Driven 사고방식을 보여준다.

댓글