들어가며
양세종의 블로그에 오신 것을 환영합니다.
세종 코멘트
학부 동기들과 discord에서 이야기하다가 떠오름.
Bismute는 접니다 하핳
ChatGPT Generated
최근 주변에서 “당근 1월 영업이익이 100억 원을 찍었다더라”, “이쯤 되면 연간 영업이익 1000억 원도 가능한 회사 아니냐” 같은 말이 나오는 건 꽤 흥미롭다. 공개된 월별 숫자는 아니어서 ‘1월 100억’ 자체는 확인하기 어렵지만, 이 반응이 완전히 허황된 것은 아니다. 당근은 2024년 별도 기준 매출 1,891억 원, 영업이익 376억 원을 기록했고, 2025년 1분기에는 별도 기준 매출 578억 원, 영업이익 164억 원을 냈다. 즉 “중고거래 앱이 생각보다 훨씬 돈을 잘 번다”는 인상은 실제 숫자와 꽤 부합한다. (당근)
실제로 당근의 매출 추이를 보면 놀라움이 과장이 아니다. 2020년 118억 원, 2021년 257억 원, 2022년 499억 원, 2023년 1,276억 원, 2024년 1,891억 원으로 5년 만에 약 16배 성장했다. 수익성도 급격히 바뀌었다. 2022년에는 499억 원 매출에도 영업손실 463억 원을 기록했지만, 2023년에는 영업이익 173억 원으로 창사 이후 첫 연간 흑자를 냈고, 2024년에는 376억 원으로 다시 3.8배 뛰었다. 이 흐름만 봐도 당근은 “성장하지만 적자인 플랫폼”에서 “현금 창출이 가능한 플랫폼”으로 이미 성격이 바뀌었다고 보는 편이 맞다. (미래를 보는 창 - 전자신문)
중요한 건 어디서 돈을 버느냐다. 많은 사람이 아직도 당근을 중고거래 앱으로 이해하지만, 숫자를 뜯어보면 본질은 다르다. 당근의 실적 성장은 회사 스스로도 “광고 사업이 주도했다”고 설명한다. 2023년에는 광고 매출이 전년 대비 2.5배 이상 늘었고, 2024년에도 광고주 수는 37%, 집행 광고 수는 52% 증가했다. 창업자 김용현 대표 역시 당근 광고가 “월 매출 100억 원이 넘는 모델”로 성장했다고 말했다. 즉 당근은 거래 수수료 기업이 아니라, 거래와 커뮤니티를 통해 쌓인 지역 수요를 광고 매출로 전환하는 회사다. (당근)
여기서 Bismute의 표현이 꽤 정확해진다. 당근은 “초정밀 하이퍼로컬 타겟 광고 + 애초에 구매전환이 높은 고객들을 보유”한 회사다. 이건 감상적인 비유가 아니라 플랫폼 구조를 정확히 짚은 말이다. 당근의 이용자는 이미 물건을 사거나 팔려고, 혹은 동네 정보를 찾으려고 앱에 들어온 사람들이다. 즉 사용자의 의도가 본질적으로 상업적이고 생활밀착적이다. 이런 사용자는 아무 생각 없이 피드를 스크롤하는 이용자보다 광고 전환 가능성이 높다. 게다가 광고 노출 범위가 “대한민국 전체”가 아니라 “내 생활권 반경”으로 좁혀지기 때문에, 동네 학원·카페·부동산·병원·미용실·프랜차이즈 매장이 광고비를 집행할 유인이 강하다. 실제로 당근은 지역 내 중소형 사업자뿐 아니라 브랜드와 기업 광고까지 흡수하며 광고 플랫폼을 고도화했다고 설명한다. (당근)
당근은 어떻게 돈을 버는가?
국내에서 새롭게 ‘개발’한 새로운 기회? 아니면 국내에서만 가능한 토종 BM?
중고거래 앱이 아니라, ‘한국형 로컬 데이터 기업’으로 봐야 한다.
개인적으로 분야는 다르지만 “박사과정을 마무리하며”라는 블로그 시리즈로 유명하신 KAIST 김주호 교수님의 연구를 항상 재미있게 읽고 있다. 항상 CHI라는 HCI Top-tier Conference에서 Community에게 좋은 평가를 받아오셨고, 이번에도 Best Paper를 지도하셨다.
내용을 정리하면 아래와 같은데… 아직까지 이런 연구들은 AI에게 대체되기는 어려울 것 같다. 흠냐… 나도 뭔가 이런 연구를 하는 방법을 배우는 것도 재밌을 것 같은데… second PhD… ㄱ?!
논문 요약
1. 연구 배경 및 목적
•
대형 언어 모델(LLM)이 학생들의 영어 쓰기를 단계적으로 돕는 훌륭한 도구가 될 것이라는 기대가 큽니다.
•
하지만 제한된 시간과 학생들의 다양한 실력 차이가 존재하는 '실제 오프라인 교실' 환경에서 실시간으로 AI를 썼을 때의 효과에 대해서는 연구가 부족했습니다.
•
이를 확인하기 위해 연구진은 한국의 중학교 2학년(8학년) 학생 157명을 대상으로 6주간 AI 작문 보조 도구(WRITEAID)를 실제 정규 수업에 투입하여 관찰했습니다.
2. 주요 발견 (실험 결과)
CHI 2026 Best Paper를 읽고…
무엇을 해먹고 살아야할까?
나는 보통 나에게 Agentic AI (Cursor, Claude Code, ChatGPT Codex, Gemini Cli) 활용법을 물어오는 사람에게 딱 두 가지를 명심하라고 한다. 이 두 가지를 활용해서 일하다 보면 결국 개개인의 수렴점은 모두 달라지기 때문이다.
그 중 첫번째는 바로 File System의 적극적인 활용이다. 컴퓨터과학의 위대한 산물 중 하나인 File System은 LLM 시대에 들어와서 장기 기억, 자연스러운 인터페이스, 그리고 모델에게 주어진 공간의 역할을 하면서 더욱더 중요해졌다. [1]
그렇다면 File System이 다시 중심 인터페이스로 떠오르는 시대에, 비정형 데이터베이스나 Vector DB를 만드는 회사들은 어디에 집중해야 할까. 단순히 RAG와 같은 retrieval layer에 머무르는 전략으로는 차별화를 만들기 어렵다. 검색과 저장 기능은 점점 범용 인프라로 규격화된 자원이 되고 있기 때문이다. 이런 것’만’ 만드는 회사는 금방 대체될 수 있다.
오히려 중요한 것은 Agent, File System, 그리고 Database 사이를 연결하는 memory platform을 만드는 일이다. Agent는 File System을 통해 자연스럽게 작업하고 기억을 남기지만, 데이터의 규모와 복잡성이 커질수록 파일 기반 구조만으로는 한계를 맞게 된다. 이때 필요한 것이 바로 File System 인터페이스와 데이터베이스 인프라를 연결하는 OS-like platform layer다. 이러한 계층은 Agent가 남기는 기억을 구조화하고, 검색하고, 진화시키는 규칙을 제공하며, 궁극적으로는 Agentic AI 시스템이 실제 서비스로 확장되는 기반이 된다.
결국 미래의 데이터 플랫폼은 database company가 아니라 memory operating system company가 될 가능성이 높다. Karpathy style로 말해보자면…
[1] 파일시스템이 주목받는 이유, 11P by GN+, https://news.hada.io/topic?id=27320&utm_source=discord&utm_medium=bot&utm_campaign=12
Agentic AI 활용의 마법 가루 #1: File System
The Future is Memory OS, Not Database

Sama라는 기업은 2000년대 초반부터 아프리카(케냐, 우간다), 인도 등지에서 데이터 라벨링을 싼 가격에 해왔다. [1] 해당 기사의 포인트는 사람의 정신에 해로울 수준의 다크웹 데이터를 라벨링 하는데에 시급 2달러 이하의 적은 돈으로 착취했다는 것이다. 그러나 해당 기사에서의 내 포인트는 조금 다르다.
이미 2000년대 초반부터 OpenAI뿐 아니라 Google, Amazon, MS, Meta와 같은 기업들은 데이터 엔지니어링의 중요함을 깨닫고 Human annotation과 같은 지루한 작업도 계속해왔다는 것. 결국 이러한 노력이 모여서 Data Engineering의 다음 단계들을 가능하게 하는 LLM들이 탄생했으며, 현재에는 model-driven data flywheel, self-improvement pipeline 등이 개발되는 단계로 나아가고 있다.
OpenAI의 공고에서도 볼 수 있듯이 [2] 결국 혁신에는 목표 지향적으로 필요한 모든 일을 하는 노력을 요구한다. 대AI시대를 맞아 가장 열심히 일하고 있는 Cursor Team과 Antropic이 결국 앞서나가고 있는 것도 이러한 팀을 잘 유지하고 있기 때문이다. 어떻게 그런 팀을 한국에서도 만들고 유지할 수 있을까? 적절한 보상과 “사람보다 더 많은 일 유지”와 신뢰를 통한 팀의 “황금기”를 [3] 유지하는 게 중요하다고 생각한다.
참고자료
[1] Billy Perrigo, Exclusive: OpenAI Used Kenyan Workers on Less Than $2 Per Hour to Make ChatGPT Less Toxic, https://time.com/6247678/openai-chatgpt-kenya-workers/
[2] OpenAI, Research Engineer - Human Centered AI, https://openai.com/careers/full-stack-engineer-health-ai-san-francisco/
[3] Steve Yegge, The Anthropic Hive Mind, https://steve-yegge.medium.com/the-anthropic-hive-mind-d01f768f3d7b
파운데이션 거대 언어 모델 개발은 데이터의 품질에, 데이터의 품질은 팀이 쏟은 시간에 종속된다. 그리고 그런 팀은…?

결국 핵심은 Memory를 어떻게 접근하는가의 문제다. DB는 본질적으로 다양한 다른 기능들을 충족시켜야 하기 때문에 auth와 query라는 복잡한 절차가 있을 수 밖에 없다.
하지만 File System에도 비슷한 기능들은 충분히 있고 markdown을 기반으로한 semantic information이 사람과 Agent 모두에게 편한 것이다. [1]
나는 언제나 정보의 투명한 공개가 우리가 지향해야하는 지점이라고 생각한다. 인터넷과 AI가 권위주의의 통제된 데이터 독점에 맞서기 위해서는 이러한 방법 밖에 없다.
실제로 몇몇 예시들에서는 [2], [3] 이러한 정보의 투명한 공개는 Agent뿐 아니라, 사람 조직의 생산성 향상으로도 이어진다.
대AI시대에는 이러한 투명한 정보 공개를 바탕으로한 전격적인 사람과 AI의 협업으로 생산성을 극한으로 끌어올리는 팀에게 많은 새로운 기회가 생길 것 같다.
참고자료
[1] Muratcan Koylan, The File System Is the New Database: How I Built a Personal OS for AI Agents, https://x.com/koylanai/status/2025286163641118915?s=20
[2] Steve Yegge, The Anthropic Hive Mind, https://steve-yegge.medium.com/the-anthropic-hive-mind-d01f768f3d7b
[3] GitLab Values, https://handbook.gitlab.com/handbook/values/#transparency
관련 글
Agent를 위해 File System이 새로운 DB인 시대, 회사 내 투명성의 방향은?

