1980年代にゲームではじめて声が部分的に登場して以来、開発者はノンリニアでインタラクティブな媒体において、言語、人間の感情、そしてパフォーマンスを表現する音の使い方に試行錯誤を繰り返してきました。
かつてコンポーザーが作曲中のゲームタイトルのサウンドデザインを一任されていたように、ダイアログはサウンドデザイナーが担当するものと思われてきました。まるで毒入りの盃か成長の儀式かのように、ダイアログの作業が新入りたちに割りあてられたものです。
年月を経て状況は変わり、ボイスデザイン(別名ダイアログデザイン、ボイスオーバーデザイン、スピーチデザイン)はゲームオーディオの専門分野として確立されつつあります。最近は急激に発展し、多くのAAAオーディオチームが既存ボイスチームを大幅に拡大したり、新しいチームをゼロからスタートさせたりしています。
クリエイティブツールとしてのボイス
私たちはみな、無意識のうちに人間のボイス(声)の専門家であり、何かがおかしいと自然に気がつきます。例えば台詞のタイミングが遅かったり早かったり、状況にふさわしくない反応であったり、言葉遣いがぎこちなかったり、キャラクターの機嫌が不自然に変わったりした時などです。しかしボイスに対する私たちの感度は、クリエイティブな可能性を豊富に秘めています。
発した言葉以上の情報を大量に伝えることができるのは、ボイスだけです。人間の声の特徴である音色、声区、韻律、アクセント、 個人言語、言語パターン、特徴、癖、非流暢性などは、そのキャラクターが誰で、何を目指し、何を恐れているのかを多く語ることがあり、住んでいる環境についても教えてくれます。
一般的な話として、ボイスはプロジェクトのサウンドスケープにおいて明らかに人間的な要素であり、ボイスが失われると世界が色あせて心細くなってしまうでしょう。人間の営みを示してくれる「つぶやき」のレイヤーを重ねはじめた途端に、その場所にも声による独自の特徴がうまれます。このようにしてボイスは、ほかのサウンドと異なる方法で世界観を構築してくれます。
プレイヤーに聞かせるコンテンツの頻度を変えることで、安全地帯に入った安心感と安らぎを引き出したり、新しい街に到着した時の感銘や戸惑いを構築したり、戦地の危険度を表したりすることができます。人間の声は非常にパワフルで精神的なツールです。効果的に使いこなすことで、作曲家にとっては夢のような方法でプレイヤーの心理を動かし、注意を引くことができます。
トム・クランシー『ディビジョン2』のレコーディングの舞台裏
取りまとめ役を担う専門職
開発会社はボイスやダイアログに数百万も費やし、自分たちの野心を実現すべく大勢の外部委託者を雇います。ボイスディレクター、キャスティングディレクター、声優、ガヤ出演者、レコーディング技師、台本編集者、プロジェクトマネージャ、ローカライゼーション専門家、翻訳者、ローカライゼーションQA担当者など、大勢の人がかかわります。すべての関係者を指揮するだけでも大変ですが、社内開発チームのほぼすべての部署の動きが制作や実装に影響を与えるため、質の高いボイスデザインを行うために豊富な知識と経験が欠かせません。
効率的にすすめるため、専門性、クリエイティブ面、技術、制作の全体像を把握することのできるオーディオデザイン担当者が必要です。私たちが開発チームと外部パートナーの接点となり、時に相反することのある「ストーリー」と「ゲームプレイ」の双方のニーズをバランスよく調整しながら、ボイスをクリエイティブに活用する方法を理解する必要があります。
プロジェクトの種類を問わず、ボイスで誤るとすぐにゲームが古く安っぽく感じられます。ボイスは没入感を維持するために必要不可欠ですが、それを一瞬にして崩してしまうこともあります。私たちはボイスの可能性を最大限に引き出しつつ、プレイヤーの耳を疲労させないようにします。
私たちの仕事の呼び方は、ダイアログ管理者、VO(ボイスオーバー)デザイナー、ダイアログコーディネーターなど色々あり、よく使われるのがボイスデザイナーやダイアログデザイナーといった名前です。職種名や責任範囲はさまざまですが、レコーディングや編集といった一般的に外注される職種の領域をはるかに超える仕事内容です。幅広い専門知識と経験が必要であり、一生かけて勉強することになる私たちの仕事には以下が含まれます:
- 計画と範囲設定
- プリビズ、プロトタイピング
- 単発台詞システム、システミックデザイン
- ボーカリゼーションシステム、呼吸システム
- 群衆システム、ガヤシステム、環境的ボイス
- パイプライン設計(VO、シネマティックス、ガヤ)
- データベース管理
- 外部委託先との調整、協力
- 人工言語
- キャスティング
- 台本の校正、セッション準備
- レコーディング、エンジニアリング
- 演技のキャプチャ
- ボイス監督
- ダイアログ編集
- リニア作業、シネマティックス
- ボイス処理(生物やロボットなどのエフェクト処理のプリレンダリング)
- マスタリング(EQ、音量調整、ディエッシング、コンプレッション、ラウドネスターゲット、全体的なスタイル面の処理)
- ランタイムエフェクト(Wwiseなどのミドルウェアを使用したリアルタイムエフェクト処理)
- 関連SFXのデザイン(例:無線通信のスクエルチや干渉)
- 台本によるVOのタイミング、間合い
- ダイアログ管理(クールダウン、ステート駆動型の再生動作、割り込み、キューイング、プライオリティロジック)
- ローカライゼーション支援
- プレミキシング、ミキシング
このようにして私たちの仕事はプリプロダクション段階からはじまり、プロジェクトライフサイクル全体にわたり、開発プロセスの中心的な役割を担います。レコーディング作業がない時でも、やるべき仕事は常にたくさんあります!
クリエイティブ面の協業
ボイスデザインは重要なコミュニケーションツールであると同時に、オーディオと登場人物のちょうど中間点に位置し、協業や創作の機会が潜在的に多くあります。私たちはシネマティックスチームと協力して演技をキャプチャーする複雑なパイプラインを管理することもあれば、ローカライゼーションチームが優れた仕事ができるよう、必要な環境を確保することもあります。私たちが一緒に仕事をする社内の部署や外部の委託先は多岐にわたるため、コミュニケーション能力、協調性、共感性などのスキルが大切で、非常に社交的な役割です。
プレイヤーにメカニクスを理解してもらい、脅威に気づいてもらい、情報を提供するために、ゲームデザインがボイスに頼るところは大きいです。プレイヤーの没入感を破壊することなくセンスよく目的を達成することが、私たちの仕事の重要な部分です。このためゲームプレイ、AI、レベルデザイン、アニメーションなどの担当者たちと緊密に連携し、クリエイティブな解決策を見出す必要があります。私はこれこそゲーム業界で働く醍醐味であると思います。さまざまな分野の優秀な専門家たちと話し合いながら共通の問題を解決し、対立した時は必ず妥協点を見つける仕事はまさしくチームスポーツです!
特にナレーティブデザインは私たちのメインゴールである「ダイアログ」に繋がる、クリエイティブなパートナーシップで成立します。ストーリーに関してオーディオチームを先導する私たちは、彼らの創作物に命を吹き込む困難な道のりを助け、最終的にレコーディングスタジオでクライマックスを迎えます。私たちは協力し合い、ストーリーの断片を繋ぎ合わせながらキャラクターの存在感を編み上げてゆくという、すばらい経験を声優やボイスディレクターたちと共有します。オープンで協調性のある環境の中で時間に余裕をもって遊びながら実験することにより、私たちが想像する以上の演技がうまれ、目を見張ることがあります。
『Broken Sword 5 - the Serpent's Curse』のペアで行ったレコーディング
ただし安心してクリエイティブになれる、リラックスしてカジュアルな雰囲気(そして監督や声優がプロジェクトの内容、世界観、キャラクター、背景を理解している状況)は、自然にスケジュール通りに予算内でつくられるわけではありません。レコーディングセッションをスムーズに行うためには、綿密な準備と計画が必要であり、細かくデザインされているのです。
ボイスデザインの「デザイン」とは
武器の音をデザインする時、銃の発砲を何度か録音し、アセットを調整して設定し、ゲームにそのまま投げ入れただけでは、すぐに完璧に機能するはずがありません。ボイスも同じです。ボイスのセッション、システム、パイプライン、機能、キャスティング、処理など、すべてに緻密な検討、設計、イテレーションが必要です。
ボイスデザインにおいてコンテキストに勝るものはなく、それが欠落したからこそダイアログが大失敗したゲームの事例があります。成功するためには声優たちが自分のキャラクターが誰なのか、どこにいるのか、何が起きているのか、そしてなぜそこにいるのかを知る必要があります。シーン、単発台詞、ボーカリゼーションのどれに関しても充分なコンテキストを提供し、正確に書き、直感的に使えるようにする必要があります。単発台詞やボーカリゼーションのコンテキストの伝え方は、失敗を繰り返しながら習得するものであり、反復プロセスです。すばらしい演技が得られるクリエイティブで気軽な(そして何気に効率的な)現場にするために、この準備作業が大切です。
キャスティングをする時は、まず演技力を見ます。その役にふさわしく、キャラクターの性格を理解し、指示に従うことができ、仕事に必要な専門技術を身につけた声優を探します。ただしデザインの観点から考慮すべき点もあります。例えばプレイヤーがゲームの主役と補助的なキャラクターを区別できるよう、聞こえ方や感じ方が異なる声にする必要があります。映画と違い、プレイヤーがどこを向いているのかは制御できません!逆にNPCはある程度同じように聞こえるような声とし、プレイヤーが30時間もゲームを続けた時に「敵の手下No.6」に何度も遭遇したことに気づかれないようにします。
オーディオデザインのほかの領域と同様、音による疲労を防いで繰り返しを隠すためには、バリエーションが重要です。話し言葉の場合、1つの機能に必要なバリエーションの数だけでなく、必要なバリエーションの種類が肝心です。コンバットやステルスといったコンテキストのバリエーションのほか、誰に話しているのかにもよります(独り言なのか、味方に対してなのか、グループに対してなのか)。声優が同じ台詞を異なる演技で話すことによるバリエーションもあります(「リロード!」の叫び方に正答はありません...)。台詞をどこまでシンプルにすべきかによっても変わります(長く抑揚のある台詞は、定期的に何度も聞くと疲れてしまいます)。
単発台詞は違和感のない発言内容とし、トリガーされた時にコンテキストに対して正しいかを確認する
ボイスの処理は無線通信エフェクト、ロボット、エイリアンなどで当然のニーズがありますが、マスタリングも満足感のある仕事です。ミキシングは発声レベルの認知ラウドネス管理も含みますが(例えば台詞をささやくのか叫ぶのか)、プロジェクト固有の音の性格をつくり出しながら、自分の作業を楽にできるというクリエイティブなチャンスもあります。単体では最高に感じたサウンドも、ゲーム中のリバーブ、伝播、全体のサウンドスケープというコンテキストなどで、物足りなく聞こえることがよくあります。
私たちのさまざまな機能を提供するためのシステムも、私たちが気を配るべき部分で、その構想を立てる最もよい立場にいるのがボイスデザイナーです。膨大な量のアセットを効率的に管理する方法や、各種機能を設計通りに実装・ミキシングする検討は(大きなバグ生産所になりかねないダイアログ作業の管理と共に)、他人に任せるわけにはいきません。
複雑さに対応する
実装とはプレゼンテーションです。すばらしい演技のために大金をかけたとしても、気を配り慎重に実装しなければ最悪の音になります。何かが起きた時に台詞を再生すること自体は簡単ですが、単純にミドルウェアにアセットをインポートするだけではいけません。映画やテレビ番組と同様にアセットを意図的に配置し、コンテキストに対して正しいアセットであることを確認し、スパムを発生させないようにする必要があります。ゲームのミキシングと同じで、ランタイムにこのような編集を行うためには、以下の重要な機能が求められます:
- シーンでゲームのキャラクターに合ったファイルを台詞間の適切な間合いを取りながら再生するための、スクリプト化されたVO
- 再生する内容がコンテキストに対して、正しいことを保証するコンテキストタグ
- 単発台詞でほかのキャラクターの単発台詞をトリガーし、適切な間合いを入れる呼び出しとレスポンス
- 台詞がスパム化することを防止し、何がいつ再生されるのかを制御するためのクールダウン(ここでも間合いが重要)
- キャラクター同士の台詞が重なり合わないようにし、コンテンツの全体的な流れを制御するためのダイアログマネジメント(これも間合い)
さらに字幕、表情のプロシージャルアニメーション、UIやアニメーションのフラグなどを駆動する必要性と組み合わせると、オーディオミドルウェアは必然的にゲームエンジンの独自システムの領域へと突入します。
規模の問題もあります。Actor-Mixer Hierarchyで100,000個ものアセットを効率的に管理することは不可能ですが、Wwise External Sourcesがあります。Wwise外にアセットを格納することにより、階層内のオブジェクト数がひとにぎり程度となり大幅に簡素化され、同じコンテンツを異なる動作に利用する柔軟性が確保でき、何度もアセットをコピペする必要がなくなります。
ボイスデザイナーがコンテンツを設計、整理、管理し、ライターがコンテンツを書く場を提供してくれるのが、テキストデータベースです。形式も大きさもそれぞれ異なり、例えば大量のVBA機能が詰まった大げさなExcelスプレッドシートであったり、本格的な独自アプリケーションであったり、さらにはブラウザインターフェースのあるオンラインデータベースであったりします。これらに共通しているのがメタデータを生成する点で、メタデータを用いて各ダイアログシステムは適切なアセットや字幕を探し、再生します。
Ubisoft Technology GroupのテキストデータベースOasis
私たちは平均的なオーディオデザイナーよりもミドルウェアを使う時間が少し少ないかもしれませんが、私たちにとってもWwiseは非常に強力なクリエイティブツールです。やはりアニメーションでトリガーするボーカリゼーションや、ガヤシステムなど、通常のサウンドオブジェクトを使った方が達成しやすいこともあります。さらに外部ソースの場合もシーケンスコンテナやランダムコンテナを使い、無線機のスクエルチなどダイアログ駆動型のSFXをトリガーすることができます。
プリミキシングやミキシングにおける私たちのWwiseの使用経験は、ほかのオーディオ分野とほぼ同じです。Wwiseの機能を最大限に活用し、エキサイティングで雰囲気のある、魅力的な(かつ聞き取ることのできる)ミックスを私たちはつくり出します。
ちょうどよいトーンを求めて
サウンドデザインやミュージックに「スタイル」があるように、ボイスデザインにもあります。楽しいアニメ風、劇場的でメロドラマ風、安定したナチュラル風などさまざまです。ゲーム調とシネマ調の間のちょうどよいバランスを見つけることが絶対に大切です。『Call of Duty』のボーカリゼーションをそのまま『ボーダーランズ』で使うことはできません。どちらも血だらけの惨たらしいシリーズですが、トーンがこれほど違うものはないでしょう。
デザインスタイルはボイスデザインのあらゆる面で表現することができます。多くの場合、何千という小さな決断の積み重ねから、プロジェクトのボイスに感じられるスタイルやトーンが成立します。『バトルフィールド 1』の激しく刺激的なコンバットなどはそのよい例で、キャスティング、レコーディング、監督、演技、マスタリングのすべてにそのスタイルが反映されています。単発台詞は文字通り肉体的な努力を伴って収録され、マスタリングで何度も赤に入っています。単発台詞をサウンドデザインやミックスと組み合わせ、雰囲気たっぷりのクラクラするコンバット体験をプレイヤーに届けます。声優が1人ブースに入り黙々と発声したのであれば、この雰囲気は実現されなかったでしょう。
『バトルフィールド1』の声優陣がウェイトを持ちながらドイツ語のボイスを収録
思い付きで達成できるものではありません。プリプロダクションの初期段階で、社内の専門スタッフがボイスデザインをはじめる必要があります。斬新な新機能を導入する場合は、キャスティングからプロジェクトのツール要件にいたるまで、事前にパイプライン全体への影響を理解する必要があり、制作途中で急に実装することはできません。
成長中の専門分野
この業界で働く人は(私の知る限り)世界で150人ほどいますが、ダイアログ専門の社内スタッフ体制が急に広まっています。毎月新たな求人情報が出され、最近ではソニー、EA、Ubisoftなどを筆頭に、プロジェクトに3名以上のボイスデザインチームがあることも珍しくありません。
ゲーム業界への転身を考える人にとって、キャリアパスとして検討する価値が充分にある分野です。ボイスデザインはサウンドデザインや音楽と同じくらいに広く深く、急成長中のゲームオーディオ領域であり、未だ新発見と技術革新のチャンスが豊富にある未開の地です。
1人ですべてを知る必要がないことを、ここで指摘したいと思います。デザインや技術寄りのボイスデザイナーもいれば、キャスティングや制作などの方面で活躍する人もいます。サウンドデザインと同様、プロジェクトのボイスデザインを担うために必要なスキルは広範囲におよび、だからこそチームプレイで臨むのです。
さらに詳しく知りたい方は、私の親友であり同僚のAdam Ritchieの、『ディビジョン2』のボイスデザインに関するGDC講演からスタートするとよいと思います。この専門分野の概要が見事にまとめられています。
『ディビジョン2』のNPCのボイスデザイン
私はLeonard Paulと共同でSchool of Video Game Audioのためにダイアログのアドオンを開発中で、ボイスデザインの学習が取り掛かりやすくなることを目指しています。私たちの最新の進歩状況を知るには、スクールのツイッターまたは LinkedInをフォローしてください。
ポータルとなるウェブサイトも作成しました: VoiceDesignResource.com です。役に立つ動画、記事、その他の探しにくいリソースを集めました。
コメント