⚡ 행동·강화 스케줄

Variable Ratio: How Slot Machines Cage Dopamine

B.F. Skinner 1957 — the strongest and most addictive reinforcement schedule

📅 1957 🔬 B.F. 스키너, 찰스 퍼스터 (B.F. Skinner & Charles Ferster) 🏛 하버드 대학교
⚡ TL;DR
Harvard's B.F. Skinner published Schedules of Reinforcement in 1957. A pigeon pecks a key for food (Skinner Box). When the food appears — the "reinforcement schedule" — dramatically shapes behavior. The most striking finding: **variable ratio reinforcement (food appears after an average of N pecks, but the exact number varies) produces the strongest, most extinction-resistant behavior.** Stop the food and the pigeon keeps pecking thousands of times. Fifty years later, slot machines, social media infinite scroll, and game gacha mechanics were designed on exactly this schedule. Confucius: "Only in winter's cold do we know the pine's endurance." Real willpower comes from inner consistency, not variable reward.

하버드 지하실의 비둘기

1948년 하버드 심리학과 지하실. B.F. 스키너는 비둘기 한 마리를 작은 상자에 넣었다. 상자 안에는 키 한 개와 모이 슬롯이 있다. 비둘기가 키를 쪼면 모이가 나온다. 스키너의 질문 — 모이를 **언제** 주느냐에 따라 비둘기 행동이 어떻게 달라질까? 그는 동료 찰스 퍼스터와 함께 4가지 기본 스케줄을 테스트했다. 고정 간격(FI)·변동 간격(VI)·고정 비율(FR)·변동 비율(VR). 10년의 데이터가 1957년 「Schedules of Reinforcement」 책으로 출간됐다 — 행동과학의 「Principia」.

변동비율의 충격적 강도

4가지 중 변동비율(VR)이 가장 충격이었다. "평균 10번 쪼면 모이, 그러나 정확히는 5~15번 사이에서 임의" — 비둘기는 키를 미친 듯이 쪼아댔다. 분당 200회 이상. 그리고 결정적으로 — **모이 공급을 완전히 끊어도 비둘기는 수천 번 쪼는 것을 멈추지 않았다.** 다른 스케줄(예: 매 10번마다 모이가 나오는 고정비율)에서는 모이가 끊기면 비둘기가 빠르게 포기했다. 변동비율만이 거의 무한한 인내를 만들었다. 이유: 비둘기는 "다음 한 번이 보상일지도 모른다"는 기대를 멈출 수 없다. 무작위가 의지의 최강 자극이다.

슬롯머신·무한 스크롤·가챠의 설계 원리

라스베이거스 슬롯머신 설계자들은 변동비율을 정확히 알고 있다. 잭팟 확률은 임의화되어 있고, "근접 미스(near miss)" 패턴이 추가된다. 그래서 도박 중독이 다른 중독보다 끊기 어렵다. **2010년대 등장한 소셜미디어 무한 스크롤은 같은 메커니즘이다** — 다음 게시물이 재미있을지 모른다, 다음 알림이 좋은 소식일지 모른다. 게임 가챠 시스템 역시 마찬가지. 우리 도파민 회로가 1948년 비둘기와 같다. **무작위 보상이 의지를 가두는 가장 강력한 우리(cage).** 디지털 디톡스가 어려운 신경학적 이유.

한자로 보는 보상

"賞(상)"은 높을 상(尙) + 조개 패(貝) — 위에서 내려주는 가치(貝가 옛 화폐). 본래는 군주가 신하의 공에 내리는 보상. 「논어」 자한편: "歲寒, 然後知松柏之後彫也" — 추운 겨울이 되어서야 소나무와 잣나무가 늦게 시드는 것을 안다. 진짜 강한 의지는 보상이 있을 때 드러나는 것이 아니라, 보상이 끊겼을 때 드러난다. 스키너의 비둘기는 변동 보상 앞에서 무한히 쪼아댔지만 그것은 의지가 아니라 노예 상태였다. 자기 안에 일관된 가치(松柏)가 있는 자만이 외부 賞의 변동에 흔들리지 않는다. 우리 주머니 속 스마트폰에서 매 분 변동하는 賞이 우리를 길들이고 있는 시대.

🌍 Real-world Impact 도박 산업·소셜미디어 UX·게임 가챠·이메일 알림 설계·교육 인센티브 시스템·자녀 양육 보상 패턴.
⚠️ Controversy & Replication 인간 행동에 비둘기 모델을 직접 적용하는 데 한계 — 인간은 메타인지가 있어 강화 스케줄을 자각하면 효과가 약화됨. 그러나 자각 없을 때는 동일하게 작동.