오디오 어노테이터 스키마
오디오 어노테이터 전용 스키마
Section titled “오디오 어노테이터 전용 스키마”본 문서는 공통 어노테이터 스키마를 상속합니다.
따라서
extra,relations,annotations,annotationsData,annotationGroups,assignmentId의 최상위 구조와
AnnotationBase,Classification등 공통 객체 정의는 공통 문서를 참고하세요.
1. 오디오 전용 추가 메타데이터(extra)
Section titled “1. 오디오 전용 추가 메타데이터(extra)”| 키 예시 | 타입 | 설명 |
|---|---|---|
duration | number | 오디오 전체 길이(초) |
sampleRate | number | 샘플링 레이트 (예: 44100, 48000) |
channels | number | 채널 수 (1: 모노, 2: 스테레오) |
format | string | 오디오 포맷 (예: “mp3”, “wav”, “aac”) |
bitrate | number | 비트레이트 (kbps) |
위 값들은 예시이며, 프로젝트 요구 사항에 따라 자유롭게 확장할 수 있습니다.
2. 어노테이션 툴별 고유 데이터
Section titled “2. 어노테이션 툴별 고유 데이터”모든 어노테이션 객체는 AnnotationBase(공통 스키마 정의)를 상속하며,
아래 필드는 해당 툴에서만 추가됩니다.
툴(tool) | 고유 필드 | 타입 | 설명 |
|---|---|---|---|
segmentation | section | { start, end } | 오디오 구간 정보 • start: 시작 시간(초)• end: 종료 시간(초) |
section등 실제 값은 동일 ID를 가진annotationsData에 저장됩니다.end는 항상start보다 값이 커야 합니다.
3. 간단 예시 (Segmentation)
Section titled “3. 간단 예시 (Segmentation)”// annotations.audio_1{ "id": "region-r13g4ret4s4", "tool": "segmentation", "isLocked": false, "isVisible": true, "classification": { "class": "a" }}
// annotationsData.audio_1{ "id": "region-r13g4ret4s4", "section": { "start": 31.07, "end": 32.41 }}동일 패턴으로 여러 개의 segmentation 영역을 annotations ↔ annotationsData 쌍으로 관리됩니다.
section 등 실제 타임라인 값은 동일 ID를 가진 annotations와 annotationsData에서 쌍으로 관리됩니다.