우리는 대부분의 경우 복잡한 사운드를 다룹니다. 게임에서는 각 사운드가 전반적인 출력 라우드니스에 기여합니다. 영화나 텔레비전 제작과 달리 작은 세그먼트의 다이내믹과 주파수 반응을 마음대로 조정할 수가 없죠. 이러한 복잡함 때문에 저는 이 주제를 분명히 설명하는 것이 참 어렵게 느껴졌습니다. 그래서 제가 여기서 말씀드리는 것을 독자인 여러분들과 더 논의할 수 있길 바랍니다! 숙련된 사운드 디자이너라면 모두 이 주제에 관해 자신만의 방법을 가지고 있을 겁니다. 아주 개인적인 방법을 사용하는 분들도 있고 산업 표준 방법을 사용하는 분들도 있을 거예요. 10개나 100개의 에셋을 잘 다룰 줄 알더라도 게임에서 수천 개에 달하는 에셋의 주파수 반응과 라우드니스의 균형을 맞추는 것은 완전히 다른 수준의 문제라고 할 수 있습니다. 이
것이 바로 대량 제작이 예술적 창조와 다른 이유이죠.
에셋의 주파수 반응 제어는 음악, 대사를 포함한 모든 유형의 에셋과 전체 믹스를 위한 것이어야 합니다. 그렇기 때문에 이 작업 과정의 첫 번째 단계는 라우드니스와 주파수 반응 측면에서 다른 사운드를 위한 공간을 남겨두는 것입니다. 이것은 수많은 경험을 바탕으로 한 라우드니스 제어의 법칙입니다. 예를 들어 음악의 경우 마스터 출력의 주파수 반응은 최종 목표 음질과 전체 다이내믹을 가져야 하죠. 하지만 게임이나 음악에 적용되는 버전의 경우 대부분 전체 대역폭을 가져서는 안됩니다.
현재 콘솔 게임 영역에서 많이 사용하는 에셋 RMS 라우드니스 참조는 다음과 같습니다.
- 음악:-16dB
- 환경:-16dB
- 대사 : -12dB
- 게임 내 효과음 (SFX) : -16dB
- UI : -16dB
(위의 모든 항목의 피크는 -3dB 아래로 약 ±2dB의 편차를 허용합니다)
일반 에셋 볼륨과 FMOD 볼륨 설정은 다음과 같습니다 (번역자의 말: 이 글에서 모든 FMOD 참조는 게임 Moonlight Blade가 사용한 특정 버전의 FMOD Designer를 기준으로 합니다):
이 시스템에서의 일반적인 작업 과정은 다음과 같습니다:
1. 게임의 볼륨 참조를 설정합니다. "볼륨 참조"는 보통 특정 유형의 사운드의 볼륨을 전체 믹스의 최대 볼륨으로 사용하여 적은 개수의 사운드만 가끔씩 이 참조 볼륨과 겹치거나 초과하도록 허용하는 것입니다. 대부분의 경우 대사를 참조 대상으로 선택해요 ('고함/외치는 소리'는 제외). 일부 사운드 디자이너는 음악이나 심지어 UI를 볼륨 참조로 사용하기도 합니다. 각 프로젝트의 요구 사항에 따라 선택해야 해요.
2. 동일한 유형의 에셋은 재생 방식과 목적에 상관없이 앞서 언급한 라우드니스 참조와 비슷한 RMS를 사용합니다. 즉, 대사를 제외한 모든 에셋의 RMS가 약 -16dB입니다.
3. 게임에서는 SoundEvent나 SoundCue의 볼륨이나 롤오프 매개 변수를 변경하여 사운드 볼륨의 균형을 맞춥니다. 이렇게 하면 균형을 맞출 때 사운드의 볼륨이 '큰지' 혹은 '조용한지'를 분명히 알 수 있어요.
4. 보통 착색이나 주파수 반응은 적어도 리소스의 80%가 게임에 통합된 프로젝트 중후반 단계가 되어서야 고려합니다. 프로젝트 중후반 단계부터 다양한 에셋을 최종 수정하고 색깔을 입히기 시작하죠. 이때 사운드의 깊이와 주파수 반응, 그리고 사운드 이벤트의 볼륨에 주로 초점을 둡니다.
비교적 일정한 볼륨 범위 안에서 각 에셋을 제한한 다음 논리 볼륨을 통해 전반적인 출력 라우드니스를 제어하고 균형을 맞추는 거죠. 이 '고전적인' 균형법은 상업 음악, 영화, TV 업계에서 수년간의 믹싱 경험을 바탕으로 한 것으로 충분히 가치있는 방법입니다. 이 방법은 고정적인 믹싱을 중심으로 하며 다이내믹 믹싱을 보충으로 사용합니다. 원칙적으로 동적 믹싱을 통한 균형은 특히 프로젝트의 초중반 단계에서 주요 방법으로 사용하지 않습니다. '고전적인' 방법은 모든 프로젝트 단계에서 에셋이나 이벤트를 판단할 명확한 볼륨 측정법이 있다는 직접적인 장점이 있습니다. 물론 이 방법을 사용하기 위해 갖춰야 할 조건이 높기 때문에 여전히 완벽한 방법은 아닙니다. 오디오 디자이너가 숙련된 믹싱 경험을 가져야 하며 청력이 좋아야 하거든요.
사실 이 방법은 콘솔 게임에서 주로 사용하는 방법이며 더 많은 영화 및 TV 음향 전문가들이 게임 업계에 발을 들이면서 더욱 발전되었습니다. 또한 현재 오디오 엔진을 사용하려면 사운드 디자이너가 이러한 사고 과정을 할 줄 알아야 해요. 천애명월도 (Moonlight Blade, 天涯明月刀) 프로젝트는 아주 흥미로운 사례입니다. 프로젝트에 참여하게 되었을 때 저는 아래의 작업을 가장 먼저 진행했습니다:
1. 모든 유형의 사운드 에셋을 빠르게 살펴보기. 가끔은 한 중점을 염두에 두고 에셋을 랜덤으로 선택하기도 합니다. 예를 들어 캐릭터 스킬과 기본적인 몸체 움직임 소리들을 한 그룹으로 묶고, 고함 소리와 대사를 다른 그룹으로 묶고, 전투 음악과 배경 음악을 또 다른 그룹으로 묶습니다. 그런 다음 각 그룹 내 에셋 라우드니스의 평균과 표준 편차를 살펴봅니다.
2. 엔진과 에셋의 매개 변수를 모두 변경하면서 이러한 사운드 유형의 볼륨을 FMOD에서 설정하는 방법과 런타임에 오디오 엔진이 계산한 볼륨이 에셋 볼륨과 어떻게 관련되어 있는지 이해하기. 모든 오디오 엔진이, 심지어 동일한 엔진의 다른 버전도 이 부분을 꽤 다르게 처리한다는 점이 참 흥미롭더군요! 이 미묘한 차이를 알아내는 데에 제가 참 머리를 많이 썼습니다 :-)
간단히 말해 저는 에셋의 RMS, FMOD 이벤트 볼륨, 게임 내 볼륨 간의 분명한 규칙을 밝혀내고 싶었어요. 이 규칙은 제가 균형을 맞추고 마무리 작업을 하는 데에 영향을 줍니다.
이때 제 프로젝트에서 다음 내용을 알아낼 수 있었습니다:
1. 음악의 두 가지 기본 유형의 경우 에셋 간의 라우드니스 차이가 약 10-12dB였습니다. 동일한 음악 유형 내 평균 라우드니스의 차이는 약 10dB였습니다. 일부 배경 음악 에셋의 경우 시간에 따라 적어도 10dB의 차이가 있었습니다 (조용한 부분과 클라이맥스 사이).
2. 대사의 피크와 RMS는 꽤 일정했지만 각 녹음 세션은 아주 난잡했습니다. 마이크 배치, 마이크 진폭, 프리앰프, 성우에서 마이크까지의 위치가 세션마다 달랐어요. 심지어 일부 대사는 제작 후반 작업에서 컴프레션을 잘못 적용하여 공간 잔향이 심했습니다. 캐릭터 스킬과 액션 SFX (일반적인 몸의 움직임과 스킬)간의 전반적인 RMS 변화는 약 9dB였습니다. 특정 스킬 사운드의 고주파수와 저주파수는 표준 이상이었습니다.
3. 환경음의 중간 범위가 고르지 않았으며 일부는 저주파수가 너무 많았습니다 (플레이테스트를 기준으로 함). 환경음의 볼륨과 주파수 반응은 거의 변동이 없었지만 서로 더 조화롭게 섞이기 위해서 변동을 부드럽게해야 했습니다.
프로젝트를 마무리하기까지 시간이 많지 않았기 때문에 저는 다음의 몇 가지 목표를 염두에 두고 일괄 처리를 하는 것을 가장 우선시했습니다:
1. 에셋의 볼륨, 깊이, 주파수 반응의 균형을 맞추어 동일한 그룹인 것처럼 들리게 하며 동일한 표준 준수하기
2. 음질 개선하기, 특히 대사. 초기 에셋이 너무 건조하게 들리더군요.
3. 모든 에셋을 16kHz~60Hz으로 감쇠하며 사운드 유형 간의 감쇠 정도와 주파수 대역에 약간의 차이를 두기.
하지만 천애명월도 특유의 복잡함으로 인해 작업이 더 어려웠습니다. 출시 스케쥴이 빡빡해서 위의 과정을 하나 하나 따르는 것이 실용적이지 못했어요. 그래서 현재 파이프라인과 이에 의한 볼륨 처리 패턴을 완전히 이해하여 빠르고 안전한 방법을 고안하는 것이 최선이었습니다. 최종 볼륨 구성은 다음과 같습니다:
이 표에서는 현재 에셋 볼륨, FMOD에서의 볼륨 설정, 비교를 위한 대상 볼륨을 함께 볼 수 있습니다. 이 비교는 주요 출시의 초반 작업과 출시 후 DLC 제작하는 동안 정말 중요한 역할을 했습니다.
참고:
1. 에셋 볼륨은 절대적이 아니라 여러 가지를 랜덤으로 샘플링한 평균값입니다.
2. 대상 볼륨 (Current RMS 열)은 게임 내 최종 볼륨과 다를 수 있습니다. 하지만 보통 오류 범위가 ±3dB 이내입니다.
3. 여기의 모든 값은 정리되지 않은 날것의 데이터가 아니라 저의 1차 에셋 RMS 정리 작업과 주파수 반응 균형 작업 (곧 다루게 될 내용) 후에 얻어진 수치입니다. 이 표에서 일부 결과 델타 값은 아주 크며 일반적인 방법과 다릅니다. 그 이유는 천월명애도가 사용한 FMOD 버전의 3D 감쇠에 큰 문제가 있었기 때문이에요. 감쇠를 Event Vol = -6dB로 설정했을 때 실제 게임 내 볼륨 감쇠가 -10dB더군요. 이 감쇠는 SoundMood 구성에도 큰 관련이 있습니다.
4. 가장 오른쪽 열인 FMOD Vol.Set에서 서로 다른 사운드 레이어 간에 별 차이가 없음을 볼 수 있습니다. 이것은 사실 꽤나 드문 일입니다. 보통 에셋 볼륨의 다이내믹 레인지가 작으면 FMOD 볼륨 설정을 통한 다이내믹이 더 커집니다. 이 관찰의 주된 이유는 수많은 이벤트가 여러 레이어를 사용했으며 런타임에 볼륨 계산에 많은 맞춤 곡선을 사용했기 때문입니다. 또 다른 이유는 앞서 언급한 3D 감쇠 문제와 관련이 있습니다.
볼륨 참조의 경우 콘솔 게임의 일반적인 방법을 사용하는 대신 지름길을 사용했습니다. 제 방법이 완벽하지는 않았지만 천애명월도에 더 실용적인 방법이었습니다. 이 표에서 줄의 색 구분을 잘 살펴보면 볼륨 레이어를 볼 수 있습니다. 간단히 말해 저의 목표는 기본적으로 착색, 다이내믹, 주파수 반응면에서 사운드 유형 간에 분명한 레이어를 만드는 것이었습니다.
1차 에셋 마무리 작업을 하기 전에 저는 다음 두 가지 작업을 실행했습니다:
1. 일반 볼륨 설정을 사용하여 주로 음악과 게임 지도의 환경음으로 구성된 소규모의 공동 에셋을 일괄 처리했습니다.
2. 이미 FMOD로 가져온 에셋을 1 단계의 결과물로 교체한 후 일반 설정에 따라 볼륨을 조정하고 최종적으로 게임에서 결과를 시험했습니다. 사실 저는 캐릭터 스킬과 같은 몇 가지 중요한 사운드는 변경하지 않은 채로 두었습니다. 그 이유는 중요한 게임 내 사운드를 변경된 사운드와 비교하여 새로운 설정이 어떤 효과가 있는지 더 잘 이해하기 위해서였습니다. 또한 이 방법은 추후 몇몇 마무리 작업 단계에서도 참 유용했습니다.
1 단계는 두 가지 단계로 더 나누어 진행했습니다. 먼저 에셋을 유형별로 일괄 처리한 다음 특수한 경우는 하나씩 처리했어요. 기본 작업은 Sound Forge에서 실행했습니다:
1. 배경 음악(BGM)의 경우 ultrafunk 잔향과 EQ를 사용하여 마무리 작업하고 균형을 맞춰서 중역대 주파수를 위한 공간을 만들어주었습니다. 그 이유는 멜로디 섹션이 주로 800-2,000Hz의 중역대로 이루어진 중국 악기로 연주되었기 때문이에요. 이 작업을 통해 음악, 특히 리드 중국 악기를 보다 뒤로 배치했습니다. 요약하자면 저는 모든 BGM을 부드럽게 만들고, 믹스를 뒤로 배치하고, 영역을 넓혀서 평균 RMS를 저희의 목표와 맞추고 단기간 RMS (클라이맥스)가 -14dB를 넘지 않도록 했습니다. 이렇게 해서 환경음을 위해 큰 공간을 남겨둘 수 있었죠.
2. 전투 음악간의 변화가 아주 컸습니다. 변화가 보다 큰 에셋을 골라서 EQ를 사용하여 전역적으로 감쇠해서 라우드니스와 주파수 범위의 변동을 감소시켰습니다. 그런 다음 전체 그룹을 일괄 처리하여 약간의 짧은 잔향을 더하고 중역대, 저중역대, 심지어 50Hz 아래 부분을 EQ를 사용하여 줄였습니다. 이렇게 해서 캐릭터 스킬과 동작을 위한 스펙트럴 공간을 남길 수 있었어요. 저는 계획한 레벨의 평균 RMS를 유지하고 12kHz 윗 부분을 감쇠했으며, 환경음은 제외하여 거칠고 공기가 있는 느낌을 살려주었습니다.
3. 저는 모든 캐릭터 스킬 사운드의 16kHz와 (아주 많이) 12kHz (약간)를 감쇠하여 날카로움을 줄이고 150과 500Hz를 조금 감쇠했습니다. 그런 다음 클랜 스킬 세트 간의 음질적 차이에 따라 (번역자의 말: 클랜이란 서양 게임에서 종족과 비슷한 중국 판타지 게임의 단위를 말함)각 클랜의 스킬 세트를 EQ로 렌더링하여 클랜 간의 색깔 차이를 최대한 살려주었습니다.
4. 환경음의 경우 사운드 자체의 특성에 따라 그룹 별 (예: 낮의 계곡 소리가 모두 한 그룹) 로 일괄 처리하여 RMS와 주파수 영역을 단일화했습니다. 그런 다음 잔향을 사용하여 음장과 깊이를 강조했어요. 바람과 비를 앞으로 가져오고 (잔향을 거의 사용하지 않음) 다른 것을 모두 믹스의 뒤로 밀었습니다 (잔향을 더 사용하고 EQ 적용). 주로 곤충 소리 (매미와 귀뚜라미)와 바람 등의 일부 에셋에서는 16kHz를 감쇠했습니다. 그 중 많은 사운드에서는 심지어 4kHz도 감쇠했습니다. 그 이유는 이 사운드가 다른 사운드와 더 잘 섞이고 부드러운 음질을 만들기 위한 것이었습니다.
5. 대사 작업이 정말 힘들었습니다. 기존의 EQ와 컴프레션으로는 녹음 도중 성우와 마이크 간의 위치와 게임 내 위치 지정의 불일치를 해결할 수 없었어요. 저는 착색이 심한 플러그인을 사용하여 모든 대사를 렌더링해서 동일한 음질을 가지도록 만들었습니다. 이렇게 해서 불일치 문제를 막무가내로 줄일 수 있었습니다. 아주 위험한 방법이지만 최후의 수단이었어요. 아날로그 특유의 따뜻한 느낌을 내기 위해서 대사의 12kHz를 많이 제거했습니다. 또한 이렇게 해서 거친 숨소리나 날카로운 소리와 같이 중국 성우들의 일반적인 단점을 필터링해낼 수 있었어요. 사실 이 단점은 선택한 마이크와 마이크 배치와 관련이 있기도 합니다.
다음은 BGM (전투 음악 제외)에 사용한 기본 일괄 처리 플러그인 체인 구성입니다:
다음은 이 일괄 및 미세 처리 작업의 상세 내용입니다:
1. 먼저 이 플러그인은 모두 스펙트럼을 착색하는 역할을 합니다. 그 이유는 a) 제가 보다 따뜻한 소리를 선호하며 b) 보통 12kHz 위를 감쇠하면 고주파수가 너무 많이 생기는 것을 방지해서 소리가 편안하게 들리도록 해주기 때문이에요. 아날로그 지향성 플러그인은 고주파수 처리에 뛰어나서 사운드가 막히는 느낌 없이 따뜻하게 들리도록 해줍니다. 사실 모든 게임 프로젝트에서 균일하고 뚜렷한 색감을 주기 위해 착색 플러그인을 사용해야 해요. 이런 색감은 게임 특유의 음색이 되거든요.
2. 전체 대역폭을 유지해야 하는 사운드는 거의 없습니다! 대부분의 사운드에서 500-1,000Hz와 50-60Hz를 감쇠했습니다. 그 이유는 대부분의 사운드가 서로 겹쳐서 이 두 대역에 주파수가 빠르게 축적되기 때문에 (150Hz와 600Hz 사이에 '흐릿한 느낌'을 주는 캐릭터의 수퍼 스킬, 폭발음, 충돌음) 각 사운드가 차지하는 공간이 줄어들기 때문입니다. 각 에셋과 에셋 유형을 작업할 때 의도적으로 특정 공간을 남겨두는 것만으로 나머지 에셋에 필요한 공간을 남겨두면서 더욱 집중적인 사운드를 성취할 수 있습니다.
3. Untrafunk Reverb는 저에게 아주 특별한 잔향입니다. 저는 보다 더 깔끔하고, 공간감이 덜 넓고, 착색이 심하지 않은 잔향이 필요했어요. 이에 가장 알맞은 잔향은 Sonnox Reverb였습니다. 하지만 가격이 너무 비싸더군요. 그래서 더 이상 유지되지 않는 이 오래된 플러그인을 사용하기로 했습니다. 또한 Ultrafunk는 제가 가장 좋아하는 플러그인 브랜드예요. 이 브랜드의 Modulator와 Delay도 제가 정말 좋아하는데, 모바일 게임에서 아주 유용하더라구요 (특히 일본 느낌의 깔끔한 사운드). 이 프로젝트에서 저는 공간감을 성취하는 것이 아니라 음악이 다른 사운드와 더욱 쉽게 섞이도록 하기 위해 잔향을 사용했습니다. 이 방법은 영화와 음악 제작에서 최종 믹스를 만드는 데에도 흔히 사용됩니다. 출시 후 사운드트랙이 게임 내 음악보다 더 건조하게 들리는 것도 이 이유에요.
4. 일괄 처리를 끝낼 때마다 재빨리 에셋의 RMS 상태를 확인하고 제 귀로 직접 들어봤습니다. 그 이유는 두 에셋의 RMS가 같더라도 믹스 안에서 서로 다른 깊이에 배치된 것처럼 들릴 수 있기 때문이에요. 의도한 것이 아니라면 저희는 이 현상을 최대한 피하려고 합니다. 또한 다른 그룹으로 일괄 처리된 에셋의 경우 주파수 반응에서 예상치 못한 차이점이 생길 수 있기 때문에 이 단계를 통해 차이점을 없앱니다.
다음은 3D 환경음의 한 에셋 유형의 일괄 처리 구성입니다:
저희는 이 단계에서 각 사운드의 최종 음질과 결과를 도출하거나 모든 문제를 해결하려고 하지 않았습니다. 이 단계의 유일한 목표는 에셋의 90-95%가 계획한 라우드니스와 스펙트럴 균형에 맞추어지도록 하는 것이었어요. 결과적으로 게임 내에서 사운드가 특정히 커지거나 작아지지 않도록 하는거죠. 맞습니다! 이 결과를 통해서만 흔히 중심 게임 경험과 음향 간의 스펙트럴 관계를 알 수 있어요. 이 단계를 '영역적' 처리 작업이라고 한다면 다음 단계는 '부분적'입니다. 아주 많은 부분을 작업하게 되죠. 저는 먼저 큰 것들을 처리한 후 작은 것들을 처리하는 절차로 작업했습니다. 여기서 '큰' 것은 게임플레이 경험에 의해 정의됩니다. 특히 주요 씬 간의 스토리텔링과 중점에 관련된 것을 큰 것들로 간주해요.
일괄 처리의 거시적인 단계는 다음과 같습니다:
1. Sound Forge에서 필요한 모든 플러그인의 체인을 만듭니다:
2. 각 일괄 처리 그룹에서 사용한 플러그인을 각각 유지합니다 (BJ 확장자 파일 사용).
다음은 흔히 사용되는 몇 가지 일괄 처리 구성입니다.
- 이 구성은 일괄 처리 프리셋의 역할을 하며 천애명월도 프로젝트 문서로 기록되어 팀과 공유되어 있습니다. 이렇게 문서를 보관하는 것은 추후 콘텐츠 개발에 있어 정말 중요해요
- 또한 프로젝트의 각 플러그인에 있는 프리셋을 저장하는 것도 좋은 습관입니다.
동시에 사운드 이벤트 간의 볼륨 차이를 0, -3dB, -6dB, -9dB와 같이 음향심리학적에 따라 3dB 단계로 조정했습니다. 이 작업을 끝내면 소리가 마치 물과 같이 단조롭게 들릴 거예요. 제가 의도한 바이죠. 일부 사운드는 제어되지 않은 것처럼 들릴 수도 있습니다. 그 이유는 이전에 이벤트 볼륨을 아주 세분하게 작업하여 자세한 소리풍경을 나타냈다면 이제는 전반적으로 균형을 맞추면서 너무 평평해져서 패턴이 생기기 때문이에요. '패턴'은 여기서 아주 중요합니다. 그 이유는 볼륨 레이어 간의 뚜렷한 패턴이 게임 플레이어가 더 뚜렷하고 일정한 경험을 하도록 도와주기 때문이에요. 미국 TV 드라마를 예로 들어 이 부분에 대해 자세히 살펴볼까요. 시즌 10까지 아주 오랫동안 방영된 드라마에서 볼륨 레이어와 주파수 반응은 여전히 일정합니다. MMO나 모바일 게임이 다양한 반복 작업을 거치는 것과 다를 것이 전혀 없어요. 그저 TV 드라마가 아닐 뿐이죠! 저는 여러 단계의 볼륨 시스템을 사용하여 서로 다른 사운드 유형 간에 레이어링 패턴이 생기게 하려고 하는 것입니다. 다음 단계는 각 유형을 자세히 살펴보면서 너무 크거나 작은 사운드가 없는지 확인하고 특정 주파수 대역을 할당하는 것입니다. 여전히 첫 번째로 작은 범위로 샘플링을 해서 좋은 평균값을 찾은 다음에 결과에 따라 일관 처리를 하는 방법을 기본적인 접근 방식으로 사용했습니다. 이 작업을 하는 이유는 믹스의 균형을 더욱 맞추고 레이어를 개선하기 위함이었어요. 이 단계의 또 다른 장점은 제 동료들이 잠재적인 문제와 작업해야 할 실제 위치를 들어볼 수 있다는 것입니다. 전역적 균형이 끝나기 전까지 저는 개별 에셋 작업을 시작하지 않습니다. 사실 이전에 말씀드린 것처럼 FMOD에서 대부분의 사운드는 -9dB 혹은 심지어 -6dB도 적용되지 않는데, 그 이유는 저희가 사용한 특정 FMOD의 알 수 없는 감쇠 알고리즘 때문이에요. 저희가 알아낸 한 가지는 정말 특이하게 -6dB부터 시작해서 볼륨 감쇠가 '급격하게 빨라진다는 것'이었습니다. 하지만 이 현상이 생기는 시점을 알아내기에 저희에게 주어진 시간이 너무 짧았습니다.
각 사운드 유형을 일괄 처리하기 전에 저는 플러그인 체인과 렌더링 매개 변수에 알맞은 중간 지점을 찾기 위해서 충분히 큰 데이터 세트를 사용하여 각 유형을 랜덤으로 샘플링했습니다. 또한 모든 추후 콘텐츠에 구성이 반드시 적용되도록 할 수 있었어요. 이 작업은 많은 경험을 필요로 하며 머리를 참 많이 쓰게 만들어요. 가장 중요한 작업은 청각 시험과 RMS 라우드니스 시험을 함께 하는 QA 부분이었습니다. 저는 심지어 할리우드 베테랑이더라도 하루의 작업 일과를 시작하기 전에 준비 운동이 필요하다는 것을 강조하고 싶습니다. 예를 들어 자신에게 익숙한 음악이나 영화 사운드트랙을 듣는 것을 준비 운동으로 할 수 있습니다. 심지어 전날 작업한 작업을 들어서 청각 판단 시스템이 매일 동일한지 확인할 수도 있죠. 심지어 일부 부분의 라우드니스와 스펙트럴 균형 작업의 경우 착색 작업을 많이 하기 때문에 모든 작업을 하루 안에 끝내도록 했습니다. 지속적인 청각적 판단은 주파수 대역, 깊이, 스테레오의 폭, 음색 등을 결정하는 것을 말하며, 이 모든 판단을 감정적/신체적 상태의 영향 없이 해야 합니다. 일정한 청각적 판단을 개발하는 데에는 오랜 시간과 많은 훈련이 필요해요. 몇 가지 간단한 예를 살펴볼까요. 고음질 사운드 라이브러리를 랜덤으로 찾으세요. 크기에 상관 없이 모든 에셋의 라우드니스, 깊이, 스테레오 폭, 심지어 스펙트럴 음색과 같은 기본적인 영역이 아주 일정할 겁니다. 그렇기 때문에 좋은 모니터링 습관, 안정되고 깔끔한 취향, 나쁘지 않은 모니터링 하드웨어, 심지어 플러그인에 대한 좋은 이해도도 여러분의 판단에 영향을 끼치게 되죠. 업계에서 현장 녹음을 권장하는 것도 바로 이 이유 때문입니다. 프로젝트의 품질을 높일 뿐만 아니라 후반 작업과 마무리 작업을 통해 청각 훈련에 효율적인 도움이 되거든요.
대사의 라우드니스와 깊이를 처리할 때 아주 고전적이지만 어려운 문제가 있었습니다. 저희는 상황에 따라 대사에 다른 깊이를 주려고 했습니다. 그러기 위해서는 에셋을 미리 렌더링해야 해요. 예를 들어 메인 퀘스트에 있는 B 타입 시나리오의 경우 대사가 씬과 결합되어야 했고 심지어 미리 렌더링된 잔향도 추가해야 했습니다. 전체 대역을 사용하는 에셋은 없었습니다. 독백과 특수 대사는 '바로 앞에 있는 것 같은' 전체 대역을 강조했지만 마우스 클릭에 의한 UI 음성은 약간 더 나은 존재감을 가지고 보다 얇게 들리며 많은 주파수 대역을 감쇠했고 깊이도 2미터가 넘지 않았어요. 그래서 시네마틱 레이어를 더욱 극적이고 분명한 느낌으로 전달할 수 있었습니다. 하지만 캐릭터 대사의 파일 명명 규칙과 유형 분류법때문에 저희가 유형 별로 에셋을 추출해내는 것이 거의 불가능했습니다. 대사의 이름 길이 때문에 고생을 참 많이 했어요. 모든 대사에 전역으로 미리 렌더링하는 것이 필요했습니다. 동작과 스킬 효과음에도 이 문제가 있었어요. 콘솔 게임의 경우 보통 대사 에셋의 이름이 아주 깁니다. 일부 에셋은 녹음 그룹의 색인까지 이름의 일부로 들어가 있어요. 콘솔 게임을 현지화할 경우 더 복잡해집니다. 때로는 게임의 균형화와 라우드니스 컨트롤 작업이 조심스런 계획을 필요로 하는 시스템적 프로젝트라는 것을 알 수 있죠. 파일의 구조, 이름, 기능, 구현을 모두 고려해야 합니다.
다음은 제가 Sound Forge와 함께 주로 사용한 플러그인입니다:
- Waves All (주로 REQ 4, API560 EQ, API2500 컴프레서, Schopes 730, NR을 사용함)
- Ultrafunk
- Steinberg Masterting Edition
에셋 라우드니스 제어는 다음 주요 단계에서 실행됩니다.
- 음악: 마스터 (독립형 자료로서 출판 준비 완료된 버전)와 게임 내 에셋
- 대사: 녹음 (마이크 선택과 배치, 프리앰프 선택과 구성, 공간 음향 제어)과 후반 제작 (균형, 노이즈 감소, 착색)
- 효과음: 원본 에셋, 통합된 에셋 (전역적 밸런스 작업 이전), 후반 에셋 (전역적 밸런스 작업 후 최종 버전)
- 게임 내 시네마틱: 마스터 (독립형 자료로서 출판 준비 완료된 버전)과 게임 내 에셋
- 트레일러와 홍보용 노래: 고해상도 버전과 인터넷 버전 (저해상도 형식, 콘텐츠 제공자와 공동 제작)
에필로그
제가 Skywalker(스카이워커)에 방문했을 때 그곳의 프로듀서와 사운드 디자이너 분들에게 라우드니스에 대해 여쭤본 적이 있습니다. 앞서 말씀드린 과정 외에도 실제로 동일한 IP (지적 재산)의 서로 다른 미디어 형식을 아주 다르게 접근하더군요. 예를 들어 미국의 스타워즈(Star Wars) 극장판은 THX를 지원하지만 홈 씨어터 버전은 THX, DTS, Dolby AC-3, Dolby Stereo를 지원합니다. 포맷뿐만 아니라 트레일러도 Vimeo, YouTube, QuickTime, 심지어 iPhone과 iTunes 등 다른 디지털 형식을 지원해요. Skywalker에서는 보통 서로 다른 재생 미디어의 라우드니스와 다이내믹을 재측정하거나 심지어 후반 제작에서 동일한 믹스가 아닌 다른 버전의 최종 믹스를 사용합니다. 각 미디어에 따른 최적의 청각 경험을 전달하기 위해서죠. EA나 Ubisoft(유비소프트)와 같은 대규모 게임 회사는 영화 산업과 비슷한 접근 방식을 사용합니다. 트레일러와 시네마틱을 제작하는 팀이 따로 있는 경우가 많아요. 팀이 협업하는 내내 라우드니스와 동적 주파수 반응을 일정하게 유지하는 것은 아주 복잡한 일입니다. 스태프 훈련, 작업 과정, 기술 표준 교육, 하드웨어와 소프트웨어 도구 세트 단일화 등을 포함한 많은 것들이 아주 중요하죠.
또한 프로젝트의 초반에 모든 기본 사운드 유형에 대해 각 유형의 에셋 크기, 해상도, 재생, 로딩, 각 유형의 통합에 대한 정보를 기록하도록 준비해야 해요. 각 유형의 표준 에셋 주파수 반응과 다이내믹, 녹음 과정, 후반 제작 작업, 일괄 처리, 명명 규칙을 분명히 기록해야 합니다. 특히 프로젝트의 초기 단계에서 제작 팀과 콘텐츠 제공자에게 관념과 요구 사항뿐만 아니라 기술적 측면을 충분히 의사 소통해야 합니다.
위의 모든 내용은 여러분의 재량에 따라 논의할 거리가 더 있을 수 있습니다. 제가 틀린 것이 있다면 알려주세요. 감사히 듣겠습니다!
댓글