전체 글 30

도시와 그 불확실한 벽 #2 - 무라카미 하루키

하루키를 처음 접하게 된 건, 아이들이 어릴 때 파주 출판 단지에서였다.어린이 날을 맞아 출판단지에 행사가 열려서 온 식구가 놀러 갔었다. 아이들은 여러가지 체험을 하느라 바쁠 때에 나는 슬렁슬렁 할인을 많이 해주는 재고 책 떨이 매대를 기웃 거리고 있었다. '1Q84'. 3권으로 나뉜 책이 띠지가 없어서였는지 무엇 때문이었는지 거의 50% 가까이 할인을 해주고 있기에 얼른 집어들었다. 대학 동기들이 하루키 소설을 읽어봤냐고 물어봤을 때는 속으로 '그 사람 책은 너무 가볍지 않나? 세상은 그렇게 아름답지만은 않아' 라고 깔봤는데. 1Q84를 읽고나서는 하루키에 푹 빠져들었다. 그 이후, '노르웨이의 숲', '기사단장 죽이기', '태엽감는 새 연대기' 등의 소설과 '직업으로서의 소설가' 등의 책들을 읽었다..

책 읽는 중 2024.05.01

[혼공학습단11기] 혼공머신, 회고...

혼공학습단을 알기 전에 이미 책은 사놨었고 박해선님 유투브도 알고 있었는데, 아무래도 누군가 등떠밀지 않으면 책은 또 책꼿이에서 최후를 맞이하겠다 싶어서 신청했습니다. 첫 2주까지는 일을 쉬고 있는 상황이라 책보고 동영상 강의 듣는게 가능했는데 다시 일을 시작하고 나서는 주말에 밖에 시간이 안나더라구요는 핑계고.... 책 앞쪽에 있는 내용들은 ML관련 내용들이고 중요한 부분이라고 하는데 잘 이해가 안가더라구요... 문제랑 정답 다 알려주고 기준도 다 있으면 그냥 알고리즘으로 하면 되는거 아닌가? 이렇게 하는거 말고 사진 보여주고 물고기 종류 구별하게 하는 걸로 하면 안되나? 모델링 하는건 언제 알려주나... 아무리 봐도 내가 공부를 하는 건지 기계가 공부를 하는건지 잘 모르겠다. 였습니다... 사실 6주..

공부 2024.02.18

[혼공학습단11기] 혼공머신 6주차

[기본 미션] Ch.07(07-1) 확인 문제 풀고, 풀이 과정 정리하기 1. 어떤 인공 신경망의 입력 특성이 100개이고 밀집층에 있는 뉴런 개수가 10개일 때 필요한 모델 파라미터의 개수는 몇개 인가요? 답. 3번 1,010개 인공 신경망에서 밀집층(Dense layer)의 파라미터 개수를 계산할 때, 각 입력 특성은 층에 있는 모든 뉴런에 가중치로 연결됩니다. 따라서, 입력 특성의 개수와 뉴런의 개수를 곱한 값에 뉴런마다의 편향(bias)을 더한 값이 총 파라미터 개수가 됩니다. 여기서 입력 특성의 개수가 100개이고, 밀집층의 뉴런 개수가 10개라고 했을 때, 각 뉴런에 대한 가중치의 개수는 입력 특성 수에 해당하는 100개가 됩니다. 그리고 각 뉴런은 개별적인 편향 값을 가집니다. 따라서, 10..

공부 2024.02.11

[혼공학습단11기] 혼공머신 5주차

군집 알고리즘부터 내가 원했던 무언가가 나오기 시작한 것 같아서 이해가 쏙쏙 되는 듯 하다. 예전에는 특성이 뭔지 왜 물고기를 분류하는데 머신러닝이 필요한지, 특성이 다 있는데 알고리즘으로 처리하면 되지 왜 머신러닝을 쓰나 싶었는데 이번 장부터 아~ 이래서 앞에 이야기가 필요하구나 싶은 생각이 들었다. 이미지 분류하고 개/고양이 구별하고 이런거 해보고 싶었다구요. K-평균(K-means) 알고리즘은 데이터를 특정 개수의 그룹(클러스터)으로 나누는 데 사용되는 간단하면서도 강력한 기법입니다. 이 알고리즘은 비슷한 특성을 가진 데이터 포인트들을 함께 묶어서 여러 클러스터를 형성합니다. 작동 방식은 아래와 같습니다. 클러스터의 개수 정하기 (K 결정): 우선 데이터를 몇 개의 그룹으로 나눌지 결정해야 합니다...

공부 2024.02.04

[혼공학습단11기] 혼공머신 4주차

결정트리 : 예 / 아니오에 대한 질문을 이어나가면서 정답을 찾아 학습하는 알고리즘. 비교적 예측 과정을 이해하기 쉽고 성능도 뛰어남 불순도 : 결정트리가 최적의 질문을 찾기 위한 기준. 사이킷런은 지니 불순도와 엔트로피 불순도를 제공. 정보 이득 : 부모노드와 자식노드의 불순도 차이. 결정트리 알고리즘은 정보이득이 최대화되도록 학습 가지치기 : 결정트리의 성장을 제한하는 방법. 결정트리는 제한 없이 성장하면 훈련세트에 과대적합되기 쉬움. 특성 중요도 : 결정트리에 사용된 특성이 불순도를 감소하는데 기여한 정도를 나타내는 값. 특성 중요도의 계산은 결정트리의 큰 장점 scikit-learn DecisionTreeClassifier : 결정트리 분류 클래스 검증세트 : 하이퍼파라미터 튜닝을 위해 모델을 평..

공부 2024.01.27

[혼공학습단11기] 혼공머신 3주차

[기본 미션] 04-1 / 2. 로지스틱 회귀가 이진 분류에서 확률을 출력하기 위해 사용하는 함수는 무엇인가요? ① 시그모이드 함수 로지스틱 회귀에서 이진 분류의 확률을 출력하기 위해 사용하는 함수는 '시그모이드 함수'(Sigmoid function) 또는 '로지스틱 함수'(Logistic function)라고 합니다. 시그모이드 함수는 일반적으로 다음과 같은 수학적 형태를 가집니다: $$ \varnothing = \frac{1}{1 + e^{-z}} $$ 여기서 $z$는 로지스틱 회귀 모델의 입력값에 대한 선형 조합입니다. 이 함수는 실수 범위의 입력값을 받아서 0과 1 사이의 값으로 변환합니다. $z$가 무한하게 큰 음수일 경우 이 함수는 0에 가까워지고, $z$가 무한하게 큰 양수가 될 때에는 1에..

공부 2024.01.20

IT 프로젝트 모집공고 수정해 보기 #8

원래 이 글을 연재하기로 한 동기는 고객과 개발자(사) 사이에 서로 오해할 소지가 있는 프로젝트 모집공고를 나라면 이렇게 쓰겠다는 컨셉으로 시작했습니다. 그런데 여러 공고들을 리뷰하다 보면 아직도 이런 일이 벌어지고 있구나 하는 생각이 들어 고개를 절래절래 흔들 수 밖에 없는 경우가 있습니다. 주먹구구 식으로 어떻게든 프로젝트를 수주해서 돈을 벌어보겠다는 SI 업체들이 난립하던 때에는 별의별일이 다 있었습니다. 이후에 똑똑하신 분들이 프로젝트 관리라던지 개발 방법론 등을 현장에 잘 적용하신 것으로 생각했는데 이런 일이 아직 있네요. 좋은 이론을 현장에 적용하는데는 인내와 비용이 많이 들어갑니다. 그래서 보편화 되기 힘든 이유가 아닐까 생각이 듭니다. 그래서 많은 개발자들이 소위 '네카라쿠베당토'라는 메이..

IT Coordinator 2024.01.16
반응형