들어가며
양세종의 블로그에 오신 것을 환영합니다.

본문
1. 같은 단어, 반대의 결말
최근 몇 년 사이 한국 사회는 “확률 조작”이라는 같은 단어를 두고 서로 다른 두 개의 소동을 겪었다. 하나는 게임이었다. 공정거래위원회는 넥슨코리아가 메이플스토리의 유료 확률형 아이템인 ‘큐브’의 확률 구조를 이용자에게 불리하게 바꾸고도 이를 제대로 알리지 않은 행위에 대해 116억 원대 과징금을 부과했다. 유저들이 가장 분노한 대목은 이른바 ‘보보보’, ‘드드드’, ‘방방방’처럼 인기 있는 3중첩 옵션의 출현 확률이 한때 아예 0으로 설정되어 있었다는 사실이었다.
말하자면 이용자들은 777이 없는 룰렛 앞에 앉아 있었다. 회사는 룰렛을 팔았고, 유저는 룰렛을 돌렸고, 시장은 그것을 게임이라고 불렀다. 그런데 나중에 알고 보니 당첨판 일부는 애초에 존재하지 않았다. 이후 그라비티, 위메이드, 코그 등 다른 게임사들에 대해서도 확률형 아이템 관련 제재가 이어졌고, 2024년에는 확률형 아이템 정보공개 의무화가 시행되었다. 2025년에는 손해배상 책임과 징벌적 손해배상 특례가 도입되었고, 같은 해 말에는 허위·미표시 확률 정보에 대해 매출액 기반 과징금을 부과하는 법안까지 발의되었다. 확률은 더 이상 게임사의 영업 비밀이라는 검은 상자 안에만 둘 수 없는 문제가 되었다.
다른 하나는 선거였다. 사전투표와 본투표의 득표율 차이, 서로 다른 지역에서 득표수가 일치하는 이른바 ‘쌍둥이 숫자’ 같은 현상들이 “확률적으로 불가능하다”는 말과 함께 부정선거의 증거로 제시되었다. 그러나 통계학자들의 검토와 법원의 판단은 일관되게 이 주장들을 기각했다. 사전투표와 본투표의 표심 차이는 음모론이 본격적으로 등장하기 전인 2017년 대선에서도 이미 뚜렷하게 나타났고, 쌍둥이 숫자는 뒤에서 보겠지만 오히려 안 나오는 쪽이 더 이상한 현상이었다.
흥미로운 것은 이 비대칭이다. 한쪽에서는 통계가 진짜 조작을 잡아냈고, 다른 쪽에서는 통계에 대한 오해가 가짜 조작을 만들어냈다. 메이플스토리 사건에서 의심은 데이터로 압축되었고, 결국 내부 자료와 행정 조사를 통해 사실로 확인되었다. 반면 부정선거 주장은 대체로 결과를 본 다음에 그 결과가 나올 확률을 거꾸로 따지는 방식으로 전개되었다. 같은 확률을 말하지만 한쪽은 검증이었고, 다른 한쪽은 착시였다.
그 차이를 가르는 것이 통계적 문해력이다. 숫자를 믿는 능력이 아니라, 숫자를 의심할 줄 아는 능력. 더 정확히 말하면, 의심을 숫자의 언어로 다룰 줄 아는 능력이다. 나는 이 능력이 세 개의 질문으로 압축된다고 생각한다. 조건부 확률의 방향을 뒤집지 않았는가. 과녁을 쏘기 전에 그렸는가. 표본은 충분히 크고 대표적인가.
777이 없는 룰렛과 과녁을 나중에 그리는 사람들
확률 조작 사건과 부정선거 의혹으로 배우는 통계적 문해력
흔히들 이렇게 말한다.
돈으로 해결할 수 없는 문제가 있다면, 돈이 충분하지 않은 것은 아닌지 의심해보라.
처음 들으면 속물적인 농담처럼 들린다. 세상에 돈으로 안 되는 일이 얼마나 많은가. 돈으로 건강을 살 수 없고, 죽은 사람을 되살릴 수 없고, 진심을 강요할 수 없고, 지나간 시간을 되돌릴 수 없다. 그런데도 이 말이 끈질기게 살아남는 이유는, 냉소 속에 묘한 진실이 들어 있기 때문이다.
돈은 단순한 물건이 아니다. 돈은 가능성이다. 누군가에게 돈은 한 끼 식사이고, 누군가에게는 한 달의 생존이며, 누군가에게는 시간을 사는 방법이고, 누군가에게는 사람을 모으고 제도를 만들고 산업을 바꾸는 힘이다. 같은 이름을 쓰지만 1만 원과 100만 원과 10억 원과 1조 원은 같은 방식으로 작동하지 않는다.
나는 사랑도 비슷하다고 생각한다.
사랑에도 운용 능력이 필요하다
사랑은 감정의 총량이 아니라 역량의 총합이다
1. Agentic Coding은 정말 함정인가?
최근 Lars Faye의 글 「Agentic Coding is a Trap」을 읽었다. 글의 핵심 주장은 단순하다. 오늘날 유행하는 agentic coding, 즉 사람이 요구사항과 계획을 만들고 여러 AI 코딩 에이전트가 구현을 맡는 방식은 강력하지만 위험하다는 것이다. 왜냐하면 이 방식은 인간 개발자와 실제 코드 사이의 거리를 점점 벌리고, 그 결과 코드를 이해하고 검토하고 디버깅하는 능력 자체를 약화시킬 수 있기 때문이다 [1,2].
이 글에서 가장 인상 깊었던 표현은 “인지부채(cognitive debt)”였다. 기술부채가 미래의 개발 비용을 증가시키는 코드상의 빚이라면, 인지부채는 미래의 사고 능력을 약화시키는 정신상의 빚이다. 지금 당장은 AI가 빠르게 코드를 생성해주기 때문에 생산성이 올라간 것처럼 보인다. 그러나 내가 그 코드를 충분히 이해하지 못하고, 문제를 직접 쪼개보지 않고, 실패의 원인을 내 손으로 추적하지 않는다면, 언젠가 나는 AI가 만든 결과물을 감독할 능력마저 잃어버릴 수 있다.
이 지점에서 흥미로운 역설이 생긴다. AI를 잘 쓰려면 좋은 감독자가 필요하다. 그런데 AI를 과도하게 쓰면 좋은 감독자가 되기 위한 능력이 약화될 수 있다. Lars Faye가 인용한 Anthropic 연구에서도 비슷한 “supervision paradox”가 언급된다. Claude를 효과적으로 쓰려면 감독이 필요하지만, Claude를 감독하는 데 필요한 코딩 능력은 AI 과사용으로 위축될 수 있다는 것이다 [3].
나는 이 문제를 조금 다른 관점에서 생각해보고 싶었다. 이것은 단순히 “AI를 쓰면 바보가 된다”는 이야기가 아니다. 오히려 이 문제는 천재성이란 무엇인가, 그리고 AI 시대에 인간은 어떤 방식으로 자신의 천재성을 확장하거나 잃어버리는가에 대한 이야기다.
2. 천재란 무엇인가?
천재성의 민주화와 인지부채의 함정
Agentic Coding 시대에 우리는 무엇을 AI에게 맡기고, 무엇을 끝까지 직접 생각해야 하는가
1. 조선은 왜 전쟁 한 번 제대로 못하고 무너졌을까?
조선 말기의 멸망을 설명할 때 흔히 나오는 이야기가 있다.
조선은 성리학적 문치주의에 빠져 군대를 천시했고, 양반 지배층은 신분제를 지키는 데만 몰두했으며, 결국 근대 제국주의 국가인 일본 앞에서 전면전 한 번 치르지 못하고 무너졌다는 설명이다.
이 설명은 일정 부분 맞다. 조선 후기 군역 제도는 점차 실제 군사 복무보다 군포를 걷는 재정 제도처럼 변했고, 양반층은 여러 방식으로 군역 부담에서 빠져나갔다. 임진왜란 이후 훈련도감과 오군영 같은 군사 개혁이 있었지만, 그것이 근대적 국민군이나 재정군사국가로 발전하지는 못했다. 대한제국기에도 군사력 강화와 징병제 구상이 있었지만, 이미 일본과 러시아가 한반도를 둘러싸고 각축하던 시기였고 시간과 자원이 부족했다.
그러나 이 설명을 “조선 지배층이 멍청하고 이기적이어서 망했다”는 식으로 밀어붙이면 너무 단순하다. 조선의 문제는 도덕성의 문제가 아니라, 더 깊은 구조의 문제였다. 한반도는 산지가 많고 경작지가 제한적이었다. 조선은 낮은 농업 생산성과 좁은 세원 위에서 운영되는 국가였다. 근대 군대는 병력만 있으면 되는 것이 아니라, 인구 파악, 조세 행정, 장교단, 무기, 탄약, 군복, 훈련소, 교통망, 군수산업, 금융 시스템을 필요로 한다. 조선은 이런 체계를 만들기에는 물질적 기반도, 제도적 동원력도, 정치적 합의도 부족했다.
따라서 조선의 멸망은 단순히 “성리학 때문에 군대를 싫어해서”가 아니라, 낮은 생산 기반, 약한 재정 추출력, 신분제적 이해관계, 늦은 개혁, 제국주의 국제질서, 일본의 단계적 주권 해체가 겹친 결과였다.
2. 조선의 신분제는 왜 그렇게 오래 버텼을까?
흥미로운 점은 조선 후기 신분제가 이미 많이 흔들리고 있었다는 사실이다. 임진왜란과 병자호란을 거치며 호적과 문서가 불타고, 노비가 도망가고, 상민과 부농이 돈을 벌고, 양반 족보를 사거나 편입되는 일이 늘어났다. 실제로 조선 후기에는 양반 수가 급증하고 상민과 노비 비중은 줄어들었다.
그렇다면 신분제는 왜 더 빨리 무너지지 않았을까?
핵심은 조선의 신분제가 단순한 법적 계급표가 아니었다는 점이다. 그것은 사회 전체의 운영체제에 가까웠다. 양반이라는 지위는 관직 접근권, 교육 기회, 향촌 지배력, 혼인시장, 족보, 제사, 토지 보유, 지역 평판을 하나로 묶은 패키지였다. 누가 믿을 만한 사람인가, 누구와 혼인할 수 있는가, 분쟁이 생겼을 때 누구 편에 설 것인가, 어느 가문이 지역사회에서 발언권을 가지는가를 정해주는 장치였다.
근대적 학교, 법원, 경찰, 은행, 신용평가, 기업 채용시장이 충분히 발달하지 않은 사회에서는 가문과 신분이 신뢰 인프라 역할을 한다. 조선에서 양반 신분은 단순한 명예가 아니라, 사회적 신용등급이었다.
그래서 부자가 된 상민이 반드시 “신분제를 없애자”고 움직인 것은 아니었다. 오히려 더 현실적인 전략은 “나도 양반이 되자”였다. 토지를 사고, 족보를 사고, 유학을 배우고, 양반 가문과 혼인하고, 자식을 과거 공부시키는 방식이다. 신분제를 부수는 것보다 신분제 안의 상층으로 진입하는 것이 더 합리적인 상승 전략이었던 것이다.
이것이 조선 후기 신분제 해체의 역설이다. 신분제는 무너지고 있었지만, 많은 사람은 그 제도를 부수기보다 그 안으로 편입되려 했다. 사회 전체가 평등을 향해 간 것이 아니라, 오히려 “양반화”를 향해 움직인 셈이다.
조선의 신분제는 왜 오래 버텼고, 오늘날 한국은 무엇을 배워야 하는가
척박한 생산 기반, 지위 경쟁, 엘리트 재생산, 그리고 “현대판 양반화”의 위험
Sequoia의 Julien Bek이 쓴 Services: The New Software를 읽고, 한 발짝 더 나가보고 싶었다. 이 글은 "AI가 SaaS 시장이 아니라 서비스 시장을 먹는다"는 인사이트를 개인/커리어/국가 레벨로 확장한 개인적인 노트다.
1. 원문의 핵심만 다시 짚고 가자
세쿼이아의 주장은 단순하다.
•
SaaS는 도구를 팔았다. 인간이 그 도구로 "일"을 해야 결과가 나왔다.
•
AI 시대의 승자는 **결과(outcome)**를 파는 회사다. 소프트웨어의 탈을 쓴 서비스 회사.
•
기업이 소프트웨어에 $1 쓸 때 서비스에는 $6를 쓴다. AI는 이 $6 시장을 먹는다.
•
지능(intelligence, 반복 가능한 작업)은 AI로 빠르게 대체되고, 판단(judgement, 맥락·직관)은 당분간 인간의 영역. 단 이 경계선은 데이터가 쌓일수록 계속 뒤로 밀린다.
여기까지가 매크로 레벨 얘기다. 그리고 이 글의 가장 중요한 한 줄을 꼽으라면 나는 망설임 없이 이걸 고른다.
"Do Not Fight the Model."
이 원칙이 왜 이렇게 강력한지, 그리고 이게 개인에게도, 커리어에도, 국가에도 똑같이 적용되는 원칙이라는 게 이 글의 출발점이다.
2. Do Not Fight the Model — 모델과 싸우지 말고, 올라타라
세쿼이아 프레임에서 가장 도발적인 조언은 이거다. 변호사를 위한 AI 툴을 만들지 말고, AI 법무법인을 차려라. 회계사를 위한 AI 툴을 만들지 말고, AI 회계법인을 차려라. 음식점 사장을 위한 AI 툴을 만들지 말고, AI 음식점을 차려라.
처음 들으면 과격해 보이는데, 사실 이게 세쿼이아가 말한 "$1:$6 법칙"의 자연스러운 귀결이다. 소프트웨어 시장($1)은 포화됐고 경쟁도 치열하다. 근데 **결과 시장($6)**은 아직 노동력으로 돌아가고 있고, AI가 그 노동력을 대체할 수 있다면 그냥 결과를 직접 파는 게 낫다.
소프트웨어가 서비스를 삼킬 때: 개인, 커리어, 그리고 소버린 AI
Do not Fight or Sell the Model
본문 (Claude Code Generated)
논문: FileGram: Grounding Agent Personalization in File-System Behavioral Traces
저자: Shuai Liu, Shulin Tian, Kairui Hu 외 (NTU S-Lab, Synvo AI)
날짜: 2026년 4월 6일
링크: arXiv:2604.04901 | Project Page | GitHub | Dataset
TL;DR
AI 에이전트가 사용자의 파일 시스템 작업 패턴(파일 읽기, 생성, 편집, 정리 등)을 기억하고 개인화에 활용하는 프레임워크. 기존 대화 요약 기반 메모리 시스템(Mem0, Zep 등)이 행동 구분 정보를 잃어버리는 문제를 지적하고, 원자적 행동 로그에서 직접 프로파일을 구축하는 bottom-up 메모리 아키텍처를 제안한다.
왜 이 연구가 필요한가?
OS-level AI 에이전트(Claude Code, Cursor, Devin 등)가 단순 명령 실행을 넘어 파일 시스템 코워커로 진화하고 있다. 그런데 사용자마다 작업 방식이 완전히 다르다.
•
어떤 사람은 파일을 순차적으로 정독하고, 어떤 사람은 키워드 검색부터 한다
•
어떤 사람은 3단계 이상 중첩 폴더를 만들고, 어떤 사람은 루트에 다 쌓는다
•
어떤 사람은 소규모 반복 편집을 하고, 어떤 사람은 파일 전체를 새로 쓴다
문제는 기존 메모리 시스템이 전부 대화(dialogue) 기반이라는 것이다. "사용자가 무슨 말을 했는지"는 기억하지만, "사용자가 파일을 어떻게 다루는지"는 모른다. 여기에 세 가지 병목이 존재한다.
병목 | 설명 |
데이터 | 프라이버시 문제로 실제 파일 시스템 행동 데이터를 대규모 수집할 수 없음 |
평가 | 기존 벤치마크는 대화 회상이나 GUI 성공률만 측정, 행동 개인화 평가 부재 |
방법론 | 메모리 시스템이 대화 요약(top-down)에 의존 → 파일 작업의 세밀한 패턴이 소실됨 |
FileGram의 세 기둥
FileGram: 파일 시스템 행동 흔적으로 AI 에이전트를 개인화하다
AI와 유저의 상호작용만 중요한 게 아니라… 결국 AI가 File System, 즉 Environment와 어떻게 상호작용했느냐가 더 중요한 힌트일수도 있다 
최근 LG 인화원에서 기획 강의를 들었다.
강의가 끝나고 남은 것은 기획을 더 잘 "쓰는 법"이 아니었다.
기획을 완전히 다르게 "생각하는 법"이었다.
그 변화의 핵심을 정리해 본다.
하지만 이 뒤로는 ChatGPT 5.4와 Claude Opus 4.6의 도움으로 작성되었다.
1. 기획은 논문이 아니다
그동안 나는 연구자로서 기획을 해왔다.
문제를 정의하고, 분석하고, 방법을 제시하고, 검증한다.
이 구조는 익숙하고 논리적으로도 완벽하다.
하지만 기획서를 받아든 사람의 반응은 항상 같았다.
"그래서… 어쩌라고?"
이 질문 앞에서 논리적 완결성은 무력했다.
논문은 "이것이 맞는가?"를 증명하는 일이지만,
기획은 "이것을 해야 하는가?"에 대한 결정을 이끌어내는 일이다.
둘은 닮은 것 같지만 완전히 다른 영역이다.
논문은 진실을 향하고, 기획은 행동을 향한다.
2. 하나만 남기는 과정
좋은 기획의 핵심은 복잡함이 아니라 압축이다.
하나의 목표, 하나의 분석, 하나의 해결책.
단순해 보이지만, 이 구조가 강력한 이유가 있다.
사람은 선택지가 많을수록 결정하지 못한다.
분석이 많으면 메시지가 약해지고,
해결책이 여러 개이면 책임이 분산되면서 아무도 움직이지 않는다.
기획은 설득이다: 연구자에서 기획자로 사고가 바뀌는 순간
논문처럼 쓰던 기획서에서, 사람을 움직이는 기획으로

본문 (ChatGPT and Claude Generated)
인공지능은 반드시 "지능"의 하위범주여야 하는가?
본문
개인적으로 나는 Kingma라는 과학자를 아주 좋아한다. Adam optimizer (citation 240k 이상)의 저자이자, VAE (citation 54k 이상)의 저자이자, flow-based model, diffusion model 등을 OpenAI, Google에서 활발하게 연구함으로써 현대 딥러닝 기반 인공지능의 발전을 대단히 앞당긴 인물. 그가 가진 수학적 직관과 컴퓨터 과학자로서의 넓은 철학적 이해는 내가 추구하는 방향과 같으면서도 대단히 앞서가 있다고 느껴진다.
첨부 사진은 Kingma의 PhD 논문 두 번째 문단인데, 여기서 그는 이렇게 말한다:
인공지능은 지능을 구현하는 기술이 아니라, 지능을 이해하기 위한 도구다.
인공지능은 ‘지능’의 하위 범주일까, 아니면 새로운 종류의 지능일까?
Kingma와 Hofstadter의 시선에서 바라본 인공지능: 인간을 모방하는 도구를 넘어, 지능 자체를 탐구하는 실험

본문 (ChatGPT Generated)
“중용(中庸)”이라는 단어를 처음 배웠을 때, 나는 그것을 꽤 단순하게 이해했다.
넘치지도 않고, 부족하지도 않은 상태. 딱 적절한 균형.
이 개념을 가장 직관적으로 느꼈던 건 의외로 철학 책이 아니라, 강화학습 환경 중 하나인 CartPole이었다.
카트 위에 올려진 막대기가 쓰러지지 않도록 좌우로 움직이며 균형을 맞추는 문제.
처음에는 이게 중용의 완벽한 예시라고 생각했다.
만 30살에 다시 생각해보는 ‘중용’이라는 균형
CartPole에서 시작해, 인생이라는 다중 진자 위에서 균형을 잡는다는 것
본문 (ChatGPT Generated)
최근 TurboQuant 관련 논문과 함께, 반도체 시장—특히 삼성전자와 SK하이닉스—의 주가가 출렁이는 장면이 연출되었다.
흥미로운 점은, 기술 자체보다 “해석”과 “내러티브”가 시장을 더 크게 흔들었다는 것이다.
이 글에서는 TurboQuant라는 기술의 실제 의미와, 그것이 왜 과대해석되었는지를 정리해본다.
1. TurboQuant는 무엇인가 (간단 요약)
TurboQuant는 대규모 모델에서 메모리 사용을 줄이기 위한 quantization 기반 최적화 기법이다.
핵심은 모델의 weight나 activation을 더 효율적으로 표현하여 메모리 footprint를 줄이면서 성능을 유지하는 것이다.
즉, 본질적으로는:
•
새로운 모델 패러다임 
•
효율적인 실행 (efficiency optimization) 
이다.
이 점이 매우 중요하다.
2. “Application layer 연구”라는 본질
TurboQuant가 반도체 주가를 흔든 이유 — 기술 vs 시장의 온도차
“논문 하나로 산업이 바뀔까?”에 대한 냉정한 답
Load more


