공부

[혼공학습단11기] 혼공머신 1주차

Steboong 2024. 1. 5. 17:57

책 사놓고 보다가 이해가 도저히 안되서 때려치울려고 하던 차에 우연히 페북에 올라온 게시물을 보게됐다.

"혼공학습단11기 모집"!!! 바로 신청!!!

이런다고 공부를 할지 잘 모르겠지만 어쨋든 1주차 과제를 올려봄.

 

[기본 미션]

 

  • 인공지능 : 사람처럼 학습하고 추론할 수 있는 지능을 가진 시스템을 만드는 기술. 강인공지능과 약인공지능으로 구분 가능
  • 머신러닝 : 규칙을 프로그래밍하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야.
    대표 라이브러리는 사이킷런 (Scikit-Learn)
  • 딥러닝 : 인공신경망을 기반으로 한 방법들을 통칭. 종종 인공신경망과 딥러닝을 크게 구분하지 않고 사용.
    대표 라이브러리는 텐서플로(TensorFlow)와 파이토치(PyTorch)

  • 코랩 : 웹브라우저 기반의 파이썬 코드 실행환경
  • 노트북 : 코랩의 프로그램 작성 단위. 일반 프로그램 파일과 달리 대화식으로 만들 수 있기 때문에 데이터 분석이나 교육에 적합. 코드, 코드의 실행결과, 문서를 모두 저장할 수 있음.

  • 머신러닝 알고리즘이 데이터에서 규칙을 찾는 과정을 훈련이라고 함.
  • 머신러닝 프로그램에서 알고리즘이 구현된 객체를 모델이라고 함. 종종 알고리즘 자체를 모델이라고 부름

  • 지도 학습 : 입력과 타깃을 전달하여 모델을 훈련한 다음 새로운 데이터를 예측하는데 활용. k-최근접 이웃이 지도학습 알고리즘임.
  • 비지도 학습 : 타깃 데이터가 없음. 무엇을 예측하는 것이 아니라 입력 데이터에서 어떤 특징을 찾는데 주로 활용
  • 훈련 세트 : 모델을 훈련할 때 사용하는 데이터. 클 수록 좋음.
  • 테스트 세트 : 전체 데이터에서 20~30%를 테스트 세트로 사용. 훈련 모델을 평가하기 위해 사용.

[선택미션]

확인문제 2-1 (p.086)

1. 머신러닝 알고리즘의 한 종류로서 샘플의 입력과 타깃(정답)을 알고 있을 때 사용할 수 있는 학습 방법은 무엇인가요?

정답 : 1번 지도학습

 

2. 훈련 세트와 테스트 세트가 잘못 만들어져 전체 데이터를 대표하지 못 하는 현상을 무엇이라고 부르나요?

정답 : 4번 샘플링 편향

훈련 세트와 테스트 세트에 샘플이 골고루 섞여 있지 않으면 샘플링이 한쪽으로 치우쳐저 제대로 된 지도학습 모델을 만들 수 없음.

 

3. 사이킷런은 입력 데이터(배열)가 어떻게 구성되어 있을 것으로 기대하나요?

정답 : 2번 행: 샘플, 열: 특성

 

 

1주차 끝!

반응형