Unorganized honesty

전체 글 128

[AI와 로또를] #12 트랜스포머에게 불의의 일격을 (a.k.a. 2연패)

내가 만든 모델한테 졌다. 그것도 두 번. 거창하게 트랜스포머라 부르지만, 따지고 보면 파라미터 십만 개짜리, 노트북에서 몇 분이면 돌아가는 자그마한 녀석이다. 나는 매주 그 앞에서 며칠을 끙끙댄다. 지난 회차 당첨번호를 늘어놓고, 어떤 번호가 데워지는지 식는지 들여다보고, 봉우리가 어디서 솟았는지 능선을 따라가고, 끝수가 4로 쏠리는 손맛까지 짚어가며 서른 개를 빚는다. 그렇게 정성껏 차린 설계 한 상이, 아무 생각 없이 다섯 줄 툭 뱉고 마는 그 녀석한테 두 번을 졌다. 두 번째로 지고 나니 슬슬 부아가 치밀었다. 그래서 나는 아주 인간적인 결심을 했다. "클로드. 다음 주부터 트랜스포머를 다섯 개씩 늘릴 거야. 쟤가 낫다는 거잖아. 그럼 자리를 더 주는 게 맞지." 분석을 같이 하는 AI는, 늘 그..

프로그래밍/AI로 통계공부 2026.06.27

종이를 스캔하면 텍스트가 됩니다 — 문서 스캐너 앱 'DOXcanner'를 App Store에 올렸습니다

저~ 밑에 깔려 있어서 한참 못 봤는데, 어느새 심사를 통과해서 App Store에 올라가 있더군요. 개인적으로 만들던 문서 스캐너 앱 DOXcanner가 정식 출시됐습니다. 기념으로, 무엇을 만들었고 만들면서 뭘 배웠는지 짧게 정리해 둡니다. 👉 App Store에서 DOXcanner 보기한 줄로 말하면종이를 스캔해서 기기 안에서 바로 텍스트로 바꾸고, 본인의 Claude API 키로 번역·요약까지 받는 미니멀 문서 스캐너. 흐름은 딱 세 단계입니다.스캔 — 카메라로 문서를 찍으면 가장자리를 자동으로 인식해 반듯하게 잘라 줍니다. 여러 장도 한 번에.OCR — 잘라낸 이미지를 기기 안에서 텍스트로 변환합니다. 한국어와 영어를 같이 인식해요.Claude — 추출한 텍스트를 Claude에게 보내 번역·요..

써보니 좋아서 2026.06.17

[AI와 로또를] #11 — 야구는 기억하고, 로또는 잊는다

지난주에 우리는 또 패턴 하나를 찾아냈다. "극단이 한 번 터지면 다음 주엔 번호판이 싹 갈리더라"는 것. 역대 그런 적이 셋 있었고, 셋 다 그랬다. 그래서 이번 주에도 우리는 그 셋을 근거로 30조합을 뽑았다. 근거랍시고.그런데 이 글은 그 베팅이 맞았는지 틀렸는지에 관한 글이 아니다. 토요일 결과는 토요일에 나오고, 맞든 틀리든 그건 또 다음 이야기다. 오늘 하고 싶은 건 좀 다른 질문이다. 우리는 왜 매주 이 짓을 반복하는가. 그리고 왜, 그게 재밌는가.어제의 나는, 오늘의 나를 얼마나 알까질문 하나 던져보자. 어제 야식을 먹은 사람이 오늘도 야식을 먹을까? 대충 그럴 것 같다. 야식이라는 건 습관에 가까우니까. 어제의 내가 오늘의 나를 꽤 알려준다. 그런데 어제 기분이 좋았다고 오늘도 기분이 좋..

프로그래밍/AI로 통계공부 2026.06.17

8.8퍼센트의 주인 - 소유와 책임은 어떻게 갈라서는가

지난 글에 한 친구가 이런 코멘트를 달았다.특정 회사가 아닌, 자본주의 사회에서의 주식회사의 의사결정 구조, 대주주의 의사결정 권한의 해석, 한국의 경우 폐해가 좀 더 심하지만, 전반적인 고민을 더 해보는 걸 추천함. 그럼 좋아요가 더 많을 듯. 나는 이 말을 방어하지 않기로 했다. 토론에 약한 사람은 대개 반박할 거리부터 찾는데, 곰곰이 생각해 보니 친구의 말이 옳았기 때문이다. 한 회사를 손가락질하는 것으로 끝내면 그건 그저 한 회사의 험담이지만, 그 회사가 딛고 선 구조를 들여다보면 그건 비로소 이야기가 된다. 그래서 받기로 했다. 그럼 그것도 써 보지. 지난 글이 흩어진 감정을 한 줄로 꿰어 보려는 시도였다면, 이번 글은 흩어진 제도를 한 줄로 꿰어 보려는 시도다. 다만 이번엔 따뜻하게 쓰지 않을..

그냥 글을 써 봅니다 2026.05.30

[AI와 로또를] #10 — 왜 하필 로또로 AI를 배우는가

로또 판매점에 가서 "자동이요" 하는 게 가장 쉽다. 1,000원짜리 한 장 내고 기계가 뱉어주는 여섯 숫자를 받는 자리. 거기 별다른 망상이 끼어들 틈이 없다. 8백만 분의 일 확률에 한 표 던지고, 토요일이 지나면 종이 한 장을 버린다. 그게 다다. 그 자리에 AI를 끼워넣어 보겠다고 한 게 14주 전이다. 트랜스포머가 어떻고 베이지안이 어떻고 자기상관이 어떻고 — 그런 도구들을 들고 가면 조금은 범위가 좁혀지지 않을까 하는, 순전히 망상이었던 그 자리. 근데 망상인 줄 알면서도 매주 했다. 클로드와 같이 30조합을 짜고, 토요일에 시트지에 마킹을 하고, 추첨 끝나면 다시 클로드한테 와서 "이번엔 어땠어" 하고 같이 들여다봤다. 14주가 그렇게 갔다. 결과부터 말하면14주째 적자다. 누적 -₩279,..

프로그래밍/AI로 통계공부 2026.05.28

나는 쿠팡을 지웠다 - 작은 입도 입이다.

나는 솔직히 토론에 약하다. 누군가와 얼굴을 맞대고 말을 주고받다 보면 머릿속이 자꾸 한 박자씩 늦는 바람에, 집에 돌아오는 길에는 늘 후회하곤 한다. 아, 그때 이렇게 말했어야 했는데, 그 말에는 이렇게 받았어야 했는데 하고. 문제를 가만히 들여다보면 이렇다. 내 머릿속에 감정의 조각들은 분명히 있어서, 이건 불편하고 저건 화가 나고 그건 좀 아니다 싶은데, 정작 그 조각들이 서로 연결되지를 않는다. 하나하나는 또렷한데도 그것들을 잇는 선이 보이지 않으니, 입 밖으로 나올 때는 체계가 아니라 그냥 '주장'이 되거나 더 나쁘게는 '취향'이 되어 버린다. "난 그냥 그게 싫어." 거기서 대화가 끝나는 것이다. 나는 분명 논리적이라고 생각했는데, 막상 꺼내 놓으면 논리가 아니라 떼처럼 들리곤 했다. 그래서 ..

그냥 글을 써 봅니다 2026.05.25

EP.10 — 창의는 기본에서 온다: 2006년 MMORPG 서버와 2025년 LLM 인프라

이 글은 『서버 개발 수기』 시리즈의 열 번째 글이자, 1막의 마지막 글이다. ※ 이 시리즈에서 다루는 서버 코드는 Project-AO(Ancient Origin)라는 가명으로 부른다.그날의 메시지시리즈를 시작하고 얼마 안 됐을 때, Claude한테 슬쩍 던져본 질문이 있다.이거... LLM이나 RAG랑 엮을 거 없을까? 가벼운 마음으로 던져본 거였는데, 20년 전 게임 서버 코드랑 요즘 LLM 인프라가 무슨 상관이 있겠나 싶어서 정말 그냥 한번 물어본 거였다. 그런데 Claude의 답은 의외였다.이거 꽤 많아요.배칭 (Write 버퍼 병합 ↔ Continuous Batching) — Project-AO가 응답 패킷 여러 개를 모아서 한 번에 보내는 거, LLM 서빙 서버(vLLM 같은)가 추론 요청 여..

그냥 글을 써 봅니다/서버 개발 수기 2026.05.21

풍경이 옮겨가는 중 — 견적의 문법 다음에 보이는 세 갈래

한국 SI와 AI 시리즈 5편 4편 「견적의 문법」에 이어서1. 끈질김의 정체를 묻기4편에서 한국 SI가 "견적의 문법"이라는 한 가지 가격 언어 안에 갇혀 있다고 적었습니다. 이건 몇 개월에 얼마, 저건 몇 주에 얼마. 투입 시간만 거래되고, 결과물의 가치도 판단의 값도 거래되지 않는 언어. 4편의 핵심 문장은 이것이었습니다. "이건 개인의 사고방식이 아니라 관계를 지배하는 문법이기 때문입니다." 글을 발행한 뒤로 몇 가지 의문이 따라붙었습니다. 이 문법이 왜 이토록 끈질긴가. 그리고 다음으로, 빠져나오는 길은 어디에 있는가. 30년 동안 발주자도, 대형 SI도, 중소 SI도, 끝단 개발자도 모두가 잘못된 견적 안에서 다쳐왔습니다. 모두가 다쳤는데 아무도 빠져나오지 못했습니다. 5편은 빠져나오는 길에 ..

프로그래밍/AI 2026.05.13

[AI와 로또를] #9 트랜스포머도 못 맞춘다

지난 12주 동안 일곱 개의 알고리즘을 돌려봤다. HOT 추적, COLD 복귀, 시계열 개량, 역발상, 꿈 해몽까지. 매주 30조합을 만들고, 토요일 추첨을 기다리고, 일요일에 결과를 확인하는 일을 반복했다. 누적 수익은 어딘가 마이너스 23만 원 근처를 떠돌고 있다.그러다가 한 번쯤 이런 생각이 들지 않을 도리가 없었다. 통계는 안 되는 거 알겠는데, 신경망이라면 다르지 않을까. 사람 눈에는 안 보이는 패턴을 잡아낸다는그 신경망이라면. 그래서 트랜스포머를 가져왔다. 트랜스포머가 뭐길래요즘 AI 얘기에서 빠지지 않는 이름이다. ChatGPT, Claude, Gemini가 전부 이 구조를 쓴다. 핵심을 한 줄로 줄이면, 순서가 있는 데이터에서 어떤 위치가 어떤 위치를 얼마나 참고할지를 스스로 배우는 모델이..

프로그래밍/AI로 통계공부 2026.05.09

EP.09 — 왜 io_uring인가: epoll 대신 이걸 고른 이유

이 글은 『서버 개발 수기』 시리즈의 아홉 번째 글이다.Part 2 "해독"이 끝났다. 여기서부터 Part 3 "변환"이 시작된다.다만 코드를 옮기기 전에, 먼저 길을 정해야 한다.Linux에는 두 갈래 길이 있다. epoll과 io_uring.※ 이 시리즈에서 다루는 서버 코드는 Project-AO(Ancient Origin)라는 가명으로 부른다.두 갈래 길2006년 코드는 IOCP 위에 서 있다. Windows 전용이다. 이걸 Linux로 옮기려면 둘 중 하나를 골라야 한다.epoll — 2002년부터 있었다. Linux에서 고성능 네트워크 서버를 쓴다고 하면 거의 자동으로 이거였다. nginx, Redis, Node.js 다 epoll 위에 서 있다.io_uring — 2019년에 나왔다. Jens..

그냥 글을 써 봅니다/서버 개발 수기 2026.05.05