LXP 콘텐츠 메타데이터 설계: 추천이 가능한 콘텐츠 구조 만들기

by UDI94

LXP의 품질은 추천 알고리즘보다 콘텐츠 메타데이터에서 시작된다

LXP를 설계할 때 많은 사람이 추천 알고리즘부터 떠올린다.

 

“AI 추천을 넣어야 하지 않을까?”
“학습자별 개인화 추천을 어떻게 만들 수 있을까?”
“비슷한 학습자 기반 추천을 적용할 수 있을까?”

물론 추천 로직도 중요하다.
하지만 그보다 먼저 설계해야 하는 것이 있다.

 

바로 콘텐츠 메타데이터다.

 

LXP에서 콘텐츠 메타데이터는 단순한 부가 정보가 아니다.
추천, 탐색, 학습경로, 이어학습, 대시보드의 기반이 되는 핵심 데이터다.

 

콘텐츠에 정보가 제대로 붙어 있지 않으면 아무리 좋은 추천 알고리즘을 적용해도 의미 있는 추천이 어렵다.

 

기획 관점에서 보면 좋은 추천은 알고리즘에서 시작되지 않는다.
먼저 콘텐츠를 설명할 수 있는 데이터 구조에서 시작된다.


콘텐츠 메타데이터란 무엇인가

콘텐츠 메타데이터는 콘텐츠를 설명하는 구조화된 정보다.

예를 들어 하나의 학습 콘텐츠가 있다고 가정해보자.

  • 콘텐츠명 : 분수의 덧셈 이해하기

이 제목만으로는 추천이나 탐색을 제대로 하기 어렵다.

이 콘텐츠가 어느 학년에 적합한지, 어떤 단원과 연결되는지, 난이도는 어떤지, 어떤 개념을 다루는지,
이전에 무엇을 학습해야 하는지 알아야 한다.

 

그래서 다음과 같은 정보가 필요하다.

  • 과목
  • 학년
  • 단원
  • 주제
  • 난이도
  • 예상 소요 시간
  • 학습목표
  • 성취기준
  • 선수 학습
  • 후속 학습
  • 콘텐츠 유형
  • 완료 기준

이 정보가 정리되어 있어야 LXP가 콘텐츠를 적절하게 분류하고 추천할 수 있다.

 

즉, 콘텐츠 메타데이터는 관리자가 보기 위한 설명값이 아니라,
서비스가 콘텐츠를 이해하고 연결하기 위한 데이터 구조다.


왜 LXP에서 메타데이터가 중요한가

LXP는 단순 콘텐츠 목록 서비스가 아니다.
학습자에게 적절한 콘텐츠를 찾아주고, 다음 학습으로 연결해야 한다.

 

이를 위해서는 콘텐츠 간 관계를 알아야 한다.

예를 들어 LXP가 다음과 같은 추천을 하려면 어떤 데이터가 필요할까?

 

  • 최근 '분수의 의미' 콘텐츠를 완료했기 때문에, 같은 단원의 다음 개념인 '분수의 덧셈'을 추천합니다.

이 추천을 하려면 최소한 다음 정보가 필요하다.

  • 사용자가 완료한 콘텐츠
  • 완료한 콘텐츠의 주제
  • 완료한 콘텐츠의 후속 콘텐츠
  • 추천할 콘텐츠의 단원
  • 추천할 콘텐츠의 난이도
  • 추천 이유를 만들 수 있는 관계 정보

즉, 추천은 단순히 콘텐츠를 보여주는 기능이 아니라, 콘텐츠 간 관계를 기반으로 만들어지는 기능이다.

 

그래서 LXP에서는 메타데이터가 중요하다.

메타데이터가 없으면 추천은 운영자의 수동 큐레이션이나 인기순 노출에 머물기 쉽다.
반대로 메타데이터가 잘 정리되어 있으면 초기 단계에서도 룰 기반 추천, 학습경로, 관련 콘텐츠 추천을 구현할 수 있다.


콘텐츠 메타데이터의 기본 구조

LXP 콘텐츠 메타데이터는 크게 다음과 같이 나눌 수 있다.

구분 설명
기본 정보 콘텐츠를 식별하고 소개하기 위한 정보
학습 정보 학습 목표, 난이도, 소요 시간 등 학습 맥락 정보
분류 정보 과목, 학년, 단원, 주제, 키워드 등 탐색 기준
교육과정/역량 정보 성취기준, 역량, 스킬 등 목표 연결 정보
경로 정보 선수 학습, 후속 학습, 관련 콘텐츠
운영 정보 공개 범위, 승인 상태, 버전, 등록자
데이터 추적 정보 xAPI/cmi5 추적 여부, 완료 기준, 수료 기준

 

이 구조는 단순히 필드를 많이 만들기 위한 것이 아니다.
각 필드가 어떤 화면과 기능에 사용되는지 연결해서 설계해야 한다.

 

예를 들어 난이도는 탐색 필터와 콘텐츠 상세에 사용되고, 선수 학습과 후속 학습은 학습경로와 추천에 사용된다.
완료 기준은 학습 활동 데이터와 대시보드에 연결된다.

 

메타데이터 설계는 결국 화면 설계, 추천 설계, 데이터 설계의 공통 기반이다.


1. 기본 정보

기본 정보는 콘텐츠를 식별하고 사용자에게 보여주기 위한 정보다.

  • 콘텐츠 ID
  • 콘텐츠명
  • 콘텐츠 설명
  • 썸네일
  • 제공자
  • 저작자
  • 콘텐츠 유형
  • 등록일
  • 수정일

예시는 다음과 같다.

- 콘텐츠 ID : math-frac-001
- 콘텐츠명 : 분수의 덧셈 이해하기
- 설명 : 분모가 같은 분수의 덧셈 원리를 그림을 통해 이해하는 콘텐츠입니다.
- 콘텐츠 유형 : 인터랙티브 콘텐츠
- 제공자 : ○○교육연구소

 

기본 정보는 콘텐츠 카드, 상세 페이지, 검색 결과에 사용된다.

 

이 단계에서 중요한 것은 콘텐츠명이 사용자가 이해하기 쉬워야 한다는 점이다.
관리자가 내부적으로 구분하기 위한 제목과 학습자가 보는 제목은 다를 수 있다.

 

예를 들어 “MATH_FRAC_ADD_04_001” 같은 내부명은 관리에는 유용하지만, 사용자 화면에서는 “분수의 덧셈 이해하기”처럼
학습 목적이 드러나는 제목이 필요하다.


2. 학습 정보

학습 정보는 콘텐츠가 어떤 학습 경험을 제공하는지 설명한다.

  • 학습목표
  • 예상 소요 시간
  • 난이도
  • 권장 학습 수준
  • 권장 학년
  • 학습 방식
  • 평가 포함 여부

예시는 다음과 같다.

- 학습목표 : 분모가 같은 분수의 덧셈 원리를 이해할 수 있습니다.
- 예상 소요 시간 : 12분
- 난이도 : 기초
- 권장 학년 : 초등 4학년
- 학습 방식 : 개념 설명 + 시각 자료 + 간단한 확인 문제

 

이 정보는 학습자가 콘텐츠를 선택할 때 중요한 판단 기준이 된다.

 

특히 예상 소요 시간과 난이도는 LXP에서 중요하다.
학습자는 “지금 이 콘텐츠를 시작해도 되는지”를 판단해야 하기 때문이다.

 

콘텐츠 상세 화면에서 이 정보가 충분히 제공되지 않으면 사용자는 학습 시작을 미룰 수 있다.


3. 분류 정보

분류 정보는 콘텐츠를 탐색하고 검색하기 위한 기준이다.

교육 서비스라면 다음 정보가 필요할 수 있다.

  • 과목
  • 학년
  • 학기
  • 단원
  • 차시
  • 주제
  • 핵심 개념
  • 키워드

예시는 다음과 같다.

- 과목 : 수학
- 학년 : 초등 4학년
- 단원 : 분수의 덧셈과 뺄셈
- 주제 : 분모가 같은 분수의 덧셈
- 핵심 개념 : 분수, 분모, 분자, 덧셈
- 키워드 : 분수 기초, 분수 연산, 초등 수학

 

기업 교육 서비스라면 분류 기준이 달라진다.

  • 직무
  • 직군
  • 스킬
  • 역량
  • 직급
  • 업무 상황
  • 학습 목적

예시는 다음과 같다.

- 직무 : 마케팅
- 스킬 : 데이터 분석
- 역량 : 성과 분석
- 직급 : 주니어
- 학습 목적 : 캠페인 성과 리포트 작성

 

메타데이터는 서비스 도메인에 따라 달라져야 한다.
학교 교육 서비스의 분류 체계를 기업 교육 서비스에 그대로 적용하면 탐색성이 떨어질 수 있다.


4. 교육과정 또는 역량 정보

교육 서비스에서는 성취기준, 교육과정 코드, 관련 개념이 중요하다.

  • 교육과정 코드
  • 성취기준
  • 관련 개념
  • 관련 단원
  • 평가 요소

예시는 다음과 같다.

- 성취기준 : [4수01-xx] 분수의 의미를 이해하고, 분수의 덧셈과 뺄셈을 할 수 있다.
- 관련 개념 : 분수의 의미, 같은 분모, 분자, 덧셈

 

기업 교육에서는 성취기준 대신 역량 또는 스킬 정보가 들어갈 수 있다.

- 역량: 데이터 기반 의사결정
- 스킬: 기초 데이터 분석, 리포트 작성, 지표 해석

 

이 정보가 있어야 LXP가 학습자의 목표와 콘텐츠를 연결할 수 있다.

 

즉, 교육과정이나 역량 정보는 콘텐츠를 단순 분류하는 값이 아니라,
학습 목표와 추천 로직을 연결하는 기준값이다.


5. 경로 정보

LXP에서는 콘텐츠 하나가 독립적으로 존재하지 않는다.
이전 학습과 다음 학습으로 연결되어야 한다.

이를 위해 경로 정보가 필요하다.

  • 선수 콘텐츠
  • 후속 콘텐츠
  • 관련 콘텐츠
  • 대체 콘텐츠
  • 보충 콘텐츠
  • 심화 콘텐츠

예시는 다음과 같다.

- 현재 콘텐츠 : 분수의 덧셈 이해하기
- 선수 콘텐츠 : 분수의 의미 이해하기
- 후속 콘텐츠 : 분모가 다른 분수의 덧셈
- 보충 콘텐츠 : 분수 그림 모델로 이해하기
- 심화 콘텐츠 : 분수 응용 문제 풀이

 

경로 정보가 있어야 학습경로를 만들 수 있다.
또한 사용자가 하나의 콘텐츠를 완료했을 때 후속 콘텐츠를 추천할 수 있다.

 

이때 주의할 점은 콘텐츠 간 연결을 단순히 수동 링크처럼 관리하면 운영 부담이 커질 수 있다는 것이다.


초기에는 핵심 경로만 수동으로 관리하고, 이후에는 주제, 난이도, 성취기준, 태그를 기반으로
관련 콘텐츠 후보를 자동 추천하는 방식으로 확장할 수 있다.


6. 운영 정보

운영 정보는 콘텐츠를 관리하기 위한 정보다.

  • 공개 여부
  • 공개 범위
  • 승인 상태
  • 등록자
  • 검수자
  • 버전
  • 사용 가능 기간
  • 기관별 노출 여부

예시는 다음과 같다.

- 공개 상태 : 공개
- 승인 상태 : 승인 완료
- 등록자 : 콘텐츠 관리자
- 버전 : v1.2
- 공개 범위 : 초등 수학 전체
- 사용 가능 기간 : 2026-03-01 ~ 2027-02-28

 

운영 정보는 관리자 화면에서 중요하다.

특히 기관별 콘텐츠 노출, 교육과정 개정, 콘텐츠 계약 기간, 저작권 이슈가 있는 서비스라면 공개 범위와 버전 관리가 반드시 필요하다.

 

운영 정보가 제대로 관리되지 않으면 사용자에게 노출되면 안 되는 콘텐츠가 추천되거나,
만료된 콘텐츠가 계속 노출되는 문제가 생길 수 있다.


7. 데이터 추적 정보

LXP는 학습 데이터를 활용하는 플랫폼이다.
따라서 콘텐츠가 어떤 데이터를 남길 수 있는지도 메타데이터에 포함해야 한다.

  • xAPI 추적 여부
  • cmi5 적용 여부
  • 완료 기준
  • 수료 기준
  • 평가 점수 수집 여부
  • 학습 시간 수집 여부
  • 진도 수집 여부

예시는 다음과 같다.

- xAPI 추적 여부: Y
- cmi5 적용 여부: Y
- 완료 기준: completed
- 수료 기준: completed + passed
- 학습 시간 수집: result.duration
- 평가 점수 수집: result.score

 

이 정보는 단순 기술 설정값이 아니라, 대시보드와 KPI 산출에 직접 연결된다.

 

예를 들어 완료 기준이 콘텐츠마다 다르면 전체 완료율을 계산할 때 기준이 흔들릴 수 있다.
학습 시간 수집 방식이 다르면 콘텐츠별 평균 학습 시간을 비교하기 어렵다.

 

따라서 데이터 추적 정보는 기획 단계에서 개발, 콘텐츠 운영, 데이터 분석 담당자와 함께 기준을 맞춰야 한다.


콘텐츠 메타데이터 예시

하나의 콘텐츠를 전체 메타데이터로 정리하면 다음과 같다.

- 콘텐츠 ID: math-frac-001
- 콘텐츠명: 분수의 덧셈 이해하기
- 유형: 인터랙티브 콘텐츠
- 설명: 분모가 같은 분수의 덧셈 원리를 그림과 예제를 통해 이해하는 콘텐츠입니다.
- 과목: 수학
- 학년: 초등 4학년
- 단원: 분수의 덧셈과 뺄셈
- 주제: 분모가 같은 분수의 덧셈
- 난이도: 기초
- 예상 소요 시간: 12분
- 학습목표: 분모가 같은 분수의 덧셈 원리를 이해하고 계산할 수 있습니다.
- 성취기준: [4수01-xx] 분수의 의미를 이해하고 분수의 덧셈과 뺄셈을 할 수 있다.
- 선수 콘텐츠: 분수의 의미 이해하기
- 후속 콘텐츠: 분모가 다른 분수의 덧셈
- 보충 콘텐츠: 분수 그림 모델로 이해하기
- 완료 기준: cmi5 completed
- 추천 태그: 기초복습, 개념이해, 시각자료, 분수연산

 

이 정도 정보가 있어야 LXP에서 추천, 탐색, 학습경로 기능을 설계할 수 있다.


MVP 단계에서 필요한 최소 메타데이터

초기 MVP에서 모든 메타데이터를 한 번에 다 넣기는 어렵다.
그렇다면 최소한 다음 정보는 필요하다.

  • 콘텐츠명
  • 콘텐츠 유형
  • 과목 또는 카테고리
  • 주제
  • 난이도
  • 예상 소요 시간
  • 학습목표
  • 선수 콘텐츠
  • 후속 콘텐츠
  • 완료 기준
  • 태그

이 정도만 있어도 기본적인 추천이 가능하다.

 

예를 들어 다음과 같은 추천을 만들 수 있다.

- 같은 주제의 콘텐츠 추천
- 완료한 콘텐츠의 후속 콘텐츠 추천
- 같은 난이도의 콘텐츠 추천
- 미완료 콘텐츠 이어학습 추천
- 관심 태그 기반 콘텐츠 추천

 

초기에는 작게 시작하되, 나중에 확장할 수 있도록 필드 구조를 열어두는 것이 좋다.

 

기획자가 주의해야 할 점은 MVP라고 해서 임시 필드로만 처리하면 안 된다는 것이다.
초기 필드는 작게 가져가되, 향후 추천, 탐색, 대시보드로 확장 가능한 구조여야 한다.


메타데이터 설계 시 주의할 점

콘텐츠 메타데이터를 설계할 때는 몇 가지 주의할 점이 있다.

 

첫 번째, 태그를 너무 자유롭게 만들면 안 된다.

예를 들어 다음 표현이 모두 섞이면 추천 품질이 떨어진다.

분수, 분수학습, 분수 기초, 기초분수, 분수개념

 

이런 경우에는 표준 태그 체계가 필요하다.

 

두 번째, 난이도 기준을 명확히 해야 한다.

기초, 보통, 심화

 

이렇게만 적어두면 운영자마다 다르게 판단할 수 있다.
난이도별 정의와 예시를 함께 제공해야 한다.

 

세 번째, 선수 콘텐츠와 후속 콘텐츠는 신중하게 연결해야 한다.

 

잘못 연결하면 학습경로 전체가 어색해질 수 있다.
특히 교육 서비스에서는 선수 학습과 후속 학습 관계가 학습 순서에 직접 영향을 주기 때문에 운영 기준이 필요하다.

 

네 번째, 메타데이터는 운영자가 계속 관리할 수 있어야 한다.

 

처음에만 입력하고 방치하면 LXP 품질은 시간이 갈수록 떨어진다.
따라서 관리자 화면에서 메타데이터 입력, 검수, 수정, 버전 관리를 할 수 있어야 한다.


정리하며

LXP에서 콘텐츠 메타데이터는 단순한 관리 정보가 아니다.

 

추천, 탐색, 학습경로, 이어학습, 대시보드의 기반이다.

좋은 LXP를 만들려면 먼저 콘텐츠를 잘 설명할 수 있어야 한다.

 

정리하면 다음과 같다.

 

좋은 추천은 좋은 알고리즘보다 먼저, 잘 정리된 콘텐츠 메타데이터에서 시작된다.

 

콘텐츠에 과목, 주제, 난이도, 학습목표, 성취기준, 선수 학습, 후속 학습, 완료 기준이 제대로 정리되어 있어야
학습자에게 의미 있는 추천을 제공할 수 있다.