2026년 한 데이터 과학자가 새 프로젝트를 맡는다. 주니어 시절이라면 바로 모델을 불러 fit을 돌렸을 것이다. 하지만 경력 10년차의 그는 다르게 움직인다. 먼저 데이터를 열어 한 행씩 본다. describe()를 돌린다. 히스토그램을 그린다. 이상치 몇 개를 붙들고 한 시간을 보낸다. 동료가 "왜 모델 안 돌려요?"라고 묻자 그는 답한다 — "데이터가 뭘 말하려는지 먼저 들어야죠." 13세기 주희가 『대학』의 한 구절을 풀며 평생을 바친 방법이 정확히 이것이다 — 格物致知(격물치지). 사물을 하나하나 궁구하라. 그러면 이치가 드러난다.
주희 — 앎은 하나하나의 관찰에서 자란다
데이터 과학 — 모델보다 먼저 데이터를 들어라
두 지혜가 만나는 지점
주희의 격물치지는 13세기의 데이터 과학 방법론이었다. 800년 뒤 현대 DS가 그 구조를 재발견한다. 네 가지 공명.
1. 하나의 사물을 끝까지
주희의 "궁지(窮至)"는 "끝까지 파헤침"이다. EDA에서도 같다. 평균과 중앙값만 보는 것은 격물이 아니다. 분포를 그리고, 이상치를 쪼개고, 상관을 돌리고, 결측 패턴을 읽고, 도메인 지식과 대조한다. 한 변수를 완전히 이해하면 그것 하나로 전체 모델의 방향이 잡힌다.
2. 축적이 활연관통으로 이어진다
주희의 "금일격일물, 명일격일물" — 매일 한 사물. 이것이 누적되면 어느 순간 전체가 꿰뚫린다. 신입 DS와 시니어 DS의 결정적 차이다. 시니어는 수백 개 프로젝트의 EDA가 누적되어 있고, 새 데이터셋을 열면 10분 안에 "아, 이 데이터는 이렇구나"가 온다. 활연관통이다. 지름길은 없다. 매일 한 사물뿐이다.
3. 사물 없는 깨달음은 공허하다
주희는 왕양명과 달리 — "먼저 마음에 묻지 말고, 먼저 사물에 묻으라"고 했다. 데이터 사이언스에서도 경계해야 할 함정이 "가설 우선주의". 가설을 먼저 세우고 데이터에서 증거만 찾는 것. 주희는 반대로 — 먼저 데이터가 말하게 하고, 가설은 그 뒤에 나오게 하라고 했다. 이것이 진짜 EDA의 태도다.
4. 해석가능성(interpretability)은 현대의 격물
블랙박스 모델 시대에 다시 일어난 가장 중요한 흐름이 해석가능성이다. "모델이 왜 이 결정을 했는가"를 하나의 뉴런·하나의 특성 단위로 파헤친다. 이것은 주희가 경전의 한 글자 한 글자에 각주를 달며 일생을 바친 작업과 구조적으로 같다. 전체를 이해하려면 개별을 놓치지 않아야 한다.
오늘 할 수 있는 실천 — 격물치지 5원칙
-
1
모델을 열기 전에 데이터를 100행 읽는다
Jeff Dean의 격물. 엑셀이든 notebook이든, 먼저 눈으로 읽어라. 자동 통계가 놓치는 "느낌"이 거기 있다. 10분이면 된다.
-
2
하루에 변수 하나씩 완전히 이해한다
주희의 금일격일물. 프로젝트 초반에 매일 하나의 컬럼/특성을 택해 분포·결측·상관·도메인 의미까지 끝까지 파헤쳐 기록한다. 1주일 뒤 전체 그림이 달라진다.
-
3
발견을 노트로 누적한다
주자어류는 주희 제자들이 그의 일상 대화를 기록한 것이다. 당신도 본인의 "데이터어류"를 남겨라. 프로젝트별 notebook 끝에 "이번에 배운 것" 3줄을 남기면, 1년 뒤 누적된 활연관통이 온다.
-
4
가설보다 관찰을 먼저
새 데이터셋에서 처음 30분은 가설 없이 데이터가 말하게 해라. 가설을 미리 걸면 보이지 않는 신호를 놓친다. 먼저 보고, 다음에 생각하라.
-
5
해석가능성을 모델링의 일부로 본다
"좋은 성능"만으로 끝내지 마라. SHAP, attention 시각화, 특성 중요도, 혹은 단순 ablation — 모델 내부를 한 번 더 격물해야 진짜 이해다. Anthropic의 interpretability가 아니라도, 주희의 태도는 매 프로젝트에 적용 가능하다.
결어 — 주희가 Jupyter 노트북을 본다면
주희가 2026년 한 데이터 과학자의 옆에 서서 Jupyter 노트북을 본다고 상상해보자. 그는 첫 셀부터 천천히 따라간다. import, read_csv, describe(), value_counts(). 매 셀마다 고개를 끄덕이다가, 마지막에 RandomForest 한 줄로 끝난 노트북을 보며 표정이 달라진다. 그리고 부드럽게 말할 것이다.
"모델은 결론일 뿐이다. 결론에 이르는 과정이 진짜 앎이다. 오늘 한 사물을 궁구하고, 내일 또 한 사물을 궁구하라. 조급해하지 말라. 활연관통은 하루아침에 오지 않으나, 매일의 격물 없이는 영원히 오지 않는다(今日格一物, 明日又格一物, 豁然貫通)."
더 깊이 읽기
-
📖
주희 『대학장구』 보망장 — 격물치지 해석의 정수
-
📖
『주자어류』 권14-15 — 격물 방법론의 구체 사례들
-
📖
Google, Rules of Machine Learning (Zinkevich, 2018) — 현대 ML 실무의 귀납적 지혜 모음
-
📖
Anthropic, Scaling Monosemanticity (2024) — 신경망의 개별 특성 격물 사례