Skip to content

오디오 어노테이터 스키마

오디오 어노테이터 전용 스키마

Section titled “오디오 어노테이터 전용 스키마”

본 문서는 공통 어노테이터 스키마를 상속합니다.

따라서 extra, relations, annotations, annotationsData, annotationGroups, assignmentId의 최상위 구조와

AnnotationBase, Classification 등 공통 객체 정의는 공통 문서를 참고하세요.

1. 오디오 전용 추가 메타데이터(extra)

Section titled “1. 오디오 전용 추가 메타데이터(extra)”
키 예시타입설명
durationnumber오디오 전체 길이(초)
sampleRatenumber샘플링 레이트 (예: 44100, 48000)
channelsnumber채널 수 (1: 모노, 2: 스테레오)
formatstring오디오 포맷 (예: “mp3”, “wav”, “aac”)
bitratenumber비트레이트 (kbps)

위 값들은 예시이며, 프로젝트 요구 사항에 따라 자유롭게 확장할 수 있습니다.

2. 어노테이션 툴별 고유 데이터

Section titled “2. 어노테이션 툴별 고유 데이터”

모든 어노테이션 객체는 AnnotationBase(공통 스키마 정의)를 상속하며,

아래 필드는 해당 툴에서만 추가됩니다.

툴(tool)고유 필드타입설명
segmentationsection{ start, end }오디오 구간 정보
start: 시작 시간(초)
end: 종료 시간(초)

section 등 실제 값은 동일 ID를 가진 annotationsData에 저장됩니다. end 는 항상 start 보다 값이 커야 합니다.

// annotations.audio_1
{
"id": "region-r13g4ret4s4",
"tool": "segmentation",
"isLocked": false,
"isVisible": true,
"classification": {
"class": "a"
}
}
// annotationsData.audio_1
{
"id": "region-r13g4ret4s4",
"section": {
"start": 31.07,
"end": 32.41
}
}

동일 패턴으로 여러 개의 segmentation 영역을 annotations ↔ annotationsData 쌍으로 관리됩니다.

section 등 실제 타임라인 값은 동일 ID를 가진 annotations와 annotationsData에서 쌍으로 관리됩니다.