1편. 프로젝트 소개 - 왜 AI 추천이 필요했나

프로그래밍/AI 교과 추천 시스템 개발기

1편. 프로젝트 소개 - 왜 AI 추천이 필요했나

Tiboong 2026. 2. 15. 08:23

프로젝트 배경

대학에는 수많은 교과와 비교과가 있다. 매 학기 수강신청 때마다 학생들은 뭘 들어야 할지 몰라 선배들이 추천하는 강의에 몰리고, 막상 수강한 강의에 대한 만족도는 낮은 경우가 많다.

학생들이 자신에게 맞는 교과를 찾을 수 있도록 AI 기반 추천 시스템을 만들어달라는 의뢰를 받았다.

이후 비슷한 요청이 이어져, 현재 몇몇 교육기관에서 이 솔루션을 사용 중이다.

해결하고자 한 것

대학에서는 이 문제를 AI 기반 개인화 추천 시스템으로 해결하고자 했다.

목표

학과 기반 추천: 학생의 전공/학과에 적합한 강좌 우선 추천
관심사 반영: 학생이 선택한 관심 분야를 추천에 반영
자동화: 매 학기 새로운 강좌가 개설되어도 자동으로 추천 갱신
설명 가능성: 왜 이 강좌를 추천하는지 근거 제공

기술적 도전 과제

이 프로젝트에서 내가 마주한 기술적 도전은 다음과 같았다.

도전 과제 설명

텍스트 유사도 계산	강좌 설명과 학생 프로필을 어떻게 비교할 것인가?
한국어 처리	강좌명, 설명이 모두 한국어. 영어 모델로는 한계
불충분한 설명	강좌 설명이 너무 짧거나 없는 경우 많음
가중치 설계	학과 vs 관심사, 어떤 비율로 반영할 것인가?
성능	5,000명 학생 × 2,000개 강좌 매칭을 합리적 시간 내에
운영 환경	GPU 없는 서버에서도 동작해야 함

설계한 시스템 아키텍처

전체 시스템을 다음과 같이 설계했다.

┌───────────────────┐
│   외부 학사 API     │  ← 학생, 강좌, 학과, 관심사 데이터
└─────────┬─────────┘
          │
          ▼
┌───────────────────┐
│  데이터 파이프라인    │  ← 주기적 동기화, 정제, 저장
└─────────┬─────────┘
          │
          ▼
┌───────────────────┐
│    PostgreSQL     │  ← 원천 데이터 + 추천 결과 저장
└─────────┬─────────┘
          │
          ▼
┌───────────────────┐
│   AI 추천 엔진      │  ← XLM-R 임베딩 + 가중치 계산
│                   │
│  • 학과 기반 (70%)  │
│  • 관심사 (30%)     │
└─────────┬─────────┘
          │
          ▼
┌───────────────────┐
│   LLM 설명 보강     │  ← 부족한 강좌 설명을 LLM으로 확장
└─────────┬─────────┘
          │
          ▼
┌───────────────────┐
│   FastAPI 서버     │  ← REST API로 추천 결과 제공
└───────────────────┘

기술 스택 선정 근거

기술을 선택할 때는 항상 "왜 이것인가?"를 고민했다.

1. 임베딩 모델: XLM-R

고려한 옵션 선택 여부 이유

OpenAI Embedding	❌	API 비용, 외부 의존성, 데이터 유출 우려
KoBERT	❌	한국어 전용이지만 영어 섞인 설명 처리 한계
XLM-R	✅	100개 언어 지원, 한국어 성능 우수, 로컬 실행 가능

결정 근거: 강좌 설명에 영어 용어가 섞여 있고, 외부 API 없이 서버에서 직접 실행해야 했다.

2. LLM: 경량 모델 (1.2B 파라미터)

고려한 옵션 선택 여부 이유

GPT-4 API	❌	비용, 외부 의존성
Llama 70B	❌	GPU 필수, 운영 서버에 GPU 없음
경량 LLM (1.2B)	✅	CPU에서 실행 가능, 충분한 품질

결정 근거: 운영 서버에 GPU가 없었고, 설명 보강 작업은 배치로 처리하면 속도가 크리티컬하지 않았다.

3. 백엔드: FastAPI + SQLAlchemy

고려한 옵션 선택 여부 이유

Django	❌	이 프로젝트에는 과한 기능
Flask	❌	비동기 지원 미흡
FastAPI	✅	비동기, 자동 문서화, 타입 힌트

결정 근거: AI 추론이 느릴 수 있으므로 비동기 처리가 필요했고, Pydantic 기반 타입 검증이 ML 파이프라인과 잘 맞았다.

프로젝트 범위

내가 직접 구현한 것

데이터 파이프라인: 외부 API → PostgreSQL 마이그레이션
AI 추천 엔진: XLM-R 임베딩 + 가중치 계산
LLM 설명 보강: 부족한 강좌 설명 자동 확장
성능 최적화: CPU 환경에서 27배 속도 향상
API 서버: FastAPI 기반 REST API
배포: Nuitka 바이너리 빌드, Docker 환경

성과

항목 수치

대상 학생	5,000명+
추천 강좌	2,000개+
추천 비교과 활동	500개+
학생당 추천	강좌 5개 + 활동 5개

다음 편 예고

다음 편에서는 데이터 파이프라인 설계를 다룬다.

외부 API에서 데이터를 어떻게 가져오는가?
재시도 로직과 페이징 처리
PostgreSQL upsert로 중복 데이터 처리
증분 동기화 전략

시리즈 목차

프로젝트 소개 - 왜 AI 추천이 필요했나 ← 현재 글
추천을 위한 데이터 파이프라인 설계
XLM-R로 강좌 임베딩 구축하기
추천 알고리즘 설계 - 가중치 기반 개인화
LLM으로 강좌 설명 보강하기
성능 최적화 - CPU에서 27배 빠르게
API 서버 구축과 배포

저작자표시 비영리 변경금지 (새창열림)

'프로그래밍 > AI 교과 추천 시스템 개발기' 카테고리의 다른 글

6편. 성능 최적화 - CPU에서 27배 빠르게 (0)	2026.02.20
5편. LLM으로 강좌 설명 보강하기 (0)	2026.02.19
4편. 추천 알고리즘 설계 - 가중치 기반 개인화 (0)	2026.02.18
3편. XLM-R로 강좌 임베딩 구축하기 (0)	2026.02.17
2편. 추천을 위한 데이터 파이프라인 설계 (0)	2026.02.16

현재글1편. 프로젝트 소개 - 왜 AI 추천이 필요했나

Unorganized honesty

꼬동애비 티붕입니다. 27년차 개발자 & IT Coordinator로, 현장에서 겪은 문제 해결 경험을 나누고 있습니다. 현재 Django 트러블슈팅 책을 집필 중이며, 이 블로그의 글들이 그 출발점입니다. 꼬동이(반려견)와 함께 코딩하는 일상을 보내고 있습니다.

게임서버, 혼공, Python, svelte, 혼공학습단, 파이썬, fastapi, MMORPG, django, 혼공머신, 추천시스템, flowbitesvelte, 서버개발, flowbite, Ai, 웹소설, 장고, nlp, 로또, 프론트엔드,

Today :
Yesterday :

Unorganized honesty