ブラインドテスト(20, February 2005) 最近ブラインドテストの話題が出ています。確かにブラインドテストは公正な結果が期待でき、氾濫するオーディオ機器の評価を方法を含め正すことが出来るように思えます。しかし、ただブラインドテストを行えば正しい結果が得られるのか、何故有効と思われるブラインドテストが使われないのかを考えて見ます。 加銅鉄平氏の辛口オーディオコラム番外編No.903「ブラインドテストはノー?」という文書があります。 すこし前の話になるが、1991年10月にニューヨークで行われたAESのコンベンションで、「オーディオシステムを評価するための正しい試聴の役割」と題するロバート・ハーリー氏の講演があり、その抄訳が山本武夫氏(パイオニア社)によってJASジャーナル誌に紹介されたことがある。(92年2/3月号) ハーリー氏の講演内容は今一つ要約しにくいものであるが、勇気を出して要約してみると (1) 物理的な測定でコンポーネントの評価が可能だとハード派が主張するのは間違っている。 (2) 人間の耳の方が優れた感度を持っているのだから、音楽のためにはオーディオ評論家の主観的な試聴がベストである。 (3) ハード派が主張するブラインドテストは幾つもの弊害があり、オーディオシステムの評価には適当ではない。 この講演について検討してみる。 (1) については全くその通りであるが、米国はいざ知らず、現在の日本では、いかにハード派を自認する人でもこの主張はしないであろう。少しでもオーディオと測定にタッチしたことがあれば、このようなことは言わない。これは30年前の話。 さて、問題は(3)のブラインドテストは不適当という件である。((2)も同根なのでそれも含めて) ここで彼は6項目の問題点を指摘している。 (a) 実験者は差を見付けることよりも差がないことを証明したがる。 (b) 試聴実験される側とする側が敵対関係にあることが多い。試聴実験参加者は試聴に失敗すると笑われることを知っている。 (c) 試聴実験は、部屋、装置などの試聴環境に慣れていない。 (d) 実験者は再生レベル、音楽、回数等のすべてをコントロールする。 (e) 実験者は被験者の疲労に関係なく実施したがる。 (f) 統計的な信頼度を上げようと、試験回数を増やす。 これでは、いかに耳派の良い耳でも感度が低下してしまい、分かるものも分からなくなることがある、という主張である。 氏が挙げた6項目は、これだけを見ると如何にも普遍性の無い理由のようであるが、この講演の以前に、ハード派による「試聴はブラインドであるべき」ふうの議論があったらしく、それに対するオーディオ誌の評論家、且つ耳派の代表としての反論なのでこんな形になったもののようである。 小生も職業柄、音質評価の方法については昔から関心があった。ハーリー氏の主張には頷ける点もあるが、それでよし、とするためには、次の点がクリヤーされることが前提となる。すなわち「試聴者は、メーカー、価格、外観、使用されている技術、他人の評価等に影響されないか」(ハーリー氏はそんなことは無いと言っているが) では、次のようなブラインドの試聴を企画してみようか。 1. 自宅の試聴室でもよい、十分に習熟した場所を使用する。 2. 機器の操作はすべて敵対関係にない他人が行うが、使用曲目や再生レベル、繰り返し回数、休憩時間等はすべて被験者の自由とする。 3. リファレンス機の使用は自由に行って良い。 これでハーリー氏の悩みは一切排除されたことになる筈で、これなら氏も喜んで参加してくれるのではなかろうか。(多分参加してくれないだろうけどね) このようなブラインドテストは、人手、時間、費用などの点で、実施する側は大変であるが、しかし、人間の先入観(場合によっては利害感)という、なんとも扱いにくい不透明な部分を排除出来るとしたら、これは安いものであろう。 もっとも、オーディオライターの人で、ドライバーが一本トランスの横に置いてあっても音の違いが分かると言う人に出会ったことがあって「ではブラインドで分かりますか」と聞いてみたら「ブラインドではそれは分からない」という返事であった。 こうなると「分かる」とは一体どういうことなのか、もう一つ分からなくなった。 ロバート・ハーリー氏の指摘は同意できます。私なりに解釈すると、 (a) 実験者は差を見付けることよりも差がないことを証明したがる。 これは、(c) 試聴実験は、部屋、装置などの試聴環境に慣れていない。と(d) 実験者は再生レベル、音楽、回数等のすべてをコントロールする。密接に関連します。会場に集められた被験者は普段とまったく違う環境に身を置く訳で、その環境でどのように聞えるかわかっていません。私たちが機器の評価をする場合は自分の部屋で聞き慣れたソースを用います。その時、新しい機器を購入したとか部屋の条件を変えたとか自分が主体となっていると言う動機付けがありどんな微細な変化でも聞き逃さないと言う意思を持ちます。しかし、ブラインドテストの被験者となった場合、そこまでの集中力が維持できるか言う問題が起きます。また、評価に当たっては二通りの方法を各自が使い分けていると思っています。一つは、オーディオ雑誌の記述に見られる、評価用語を用いるチェックリストのやり方、もう一つは、聞きながらもしくは聞いた後にどんなことが心に残ったかと言う記述のやり方です。チェックリスト式の評価は、既に雛形を持っていますので、どんな状況でも使うことが出来ます。しかし、記述式の評価は情緒の上で行われますので、環境が変わったことにより確信が持てなくなります。チェックリストに従っての評価は時としてチェックリストの準備が充分でなく同じ結果を得ることも多々あります。 更に、古い話の中ではブラインドテストの結果が有効であったと言う事例があります。それらの多くは伝送フォーマットに関することと記憶しています。例えばNHK技術研究所が結論付けた、偶数時高調波は3%まではほとんど検知されないという結果があります。これは、伝送に劣化する度合いはここまでは許される。つまり同じに聞えたと、言い換えると差がないという目的で使われており、氏の指摘を裏付けています。 (b) 試聴実験される側とする側が敵対関係にあることが多い。試聴実験参加者は試聴に失敗すると笑われることを知っている。 大変重要な指摘です。試験者は自由に切り替える切り替えないを使い分ける場合、変化がないのに変化したと答えることと、変化があったのに変化しないと答えるのではどちらが被験者のプライドが保たれるかと言うことが含まれていますし、敵対関係に陥りブラインドテストに至った経緯を考えると、変化したのに検知できなかったことは、被験者の問題ではなく試験環境や方法に問題があるなどのカウンター攻撃の道を残すことが出来ます。 (e) 実験者は被験者の疲労に関係なく実施したがる。 (f) 統計的な信頼度を上げようと、試験回数を増やす。 慣れない環境、試験者と対峙した関係も加わり疲労で被験者の集中力は著しく低下します。議論が紛糾し膠着したとき参加者の集中力は途切れ、最後にはその中で執着と体力を温存した人の意向で決着を見ることがあります。特に政治の場でよく起きる現象です。こういった場合、意向に従った参加者は、これ以上時間を費やしても仕方ない、たいした問題ではないのでどうでも良いなどの投遣りな気持ちになっています。ブラインドテストでこういった心情になるとどんなに細かく準備されたチェックリストであってもその運用は大雑把になり、検知能力が失われ、変化がないという結果に進みます。 また、何人かの優れたオーディオ開発者もブラインドテストに対して意見を述べています。 lungo 楠本恒隆 氏 AB比較試聴法について よく聴き込んだ知っている(つもり)の試聴装置に未知の機器やケーブルを挿入するヒアリングテストについて。 AB比較方法は、2者の差異をクローズアップするには、分かりやすい方法とされています。しかし、試聴条件を変えると、評価が変わる危険性もあります。 たとえば・・・。 古いJBLのユニットだと、端子に鉄ビスが使われています。こういうところに、最新高性能ケーブルは、必ずしも合うとは限りません。鉄の磁気ひずみが露呈することが多いのです。 ケーブルもアンプも、「装置」を構成する一要素です。内部では、電気的に直列ですから、影響度は、長さが長い分だけ、ケーブルの方が音質影響度は大きいかも知れませんね。 オーディオはトータルな装置です。 ケーブルも、機器内部配線も直列に接続されているわけで、電気的にみれば、四角いケースに入っているかどうかの違いだけです。 SPケーブルの場合を例にするなら・・・。 SPケーブルは、SP端子、アンプの中のリレー接点、パワートランジスタ、ケミコン、トランス、・・・、或いはネットワーク各部の材質,SP内部のネットワーク・・・などが全部直列に、(或いは並列に)繋がっています。 普通の人は、部品や素材固有の音質など知らないでしょう。 さらに内部の配線はその配線ルートのとり方で音質も変わります。 すなわち、未知数が、1個だと思っていた試聴装置には、5個も10個も、或いは数十個、いやもっと多数の未知数が隠れているのです。 メーカーはそういうものが表面にでないように上手にまとめているつもり発売しているので、聴き手も(そういう諸々を)全部ひっくるめて、その機械の音、として理解してるつもりになっています。 しかし、時としてそれら(内部に潜む諸々)が顔を出すのです。 ただ、素材固有の音を知らないと、あれこれ、色々な形容詞を並べるだけに終始するしかありません。 世に多く存在する比較試聴という行為。 この行為は 「沢山の未知数が有るのに、たった一つの方程式で解を得ようとしている行為」 に似たものであることを認識しておかないとないといけません。 聴いてみないと分からない・・・と云われるオーディオですが、経験が浅いと、聴いてみても表面上に起きた変化量しか分からない・・・というほうがむしろ普通なのです。 逆に中身にまで精通すると、かなりの機器が、聴かなくてもその機器の音質上の限界能力が想像や予想ができるようにもなるものです。 タイムドメイン 由井啓之 氏 ブラインド・テストについて 合理的なテスト法のように見えますが、良く考えるとオーディオの研究には余り適さないように思われますのでこれにこだわることはないでしょう。アンプ以外に目隠しできるコンポーネントはないでしょうし、音や、音以外の要素でかならず目印がついてしまいます。アンプの場合もすべてにまったく同じアンプはないので、かならず目印がつきます。オーディオに関してブラインド法は不可能ですし、必要性もないと思います。 スピーカを2つ切替えれば音の聴こえる方向は異なりますから、目隠しする意味はないでしょう。またスピーカはそれぞれベストのセッティングをして、ということであれば瞬時切替えなどはできません。 また一例をあげればまったく大きさも音の質も異なるスピーカについて、コントラバスのピチカットはどちらがそれらしいか?音程の変化はどちらが良くわかるか?などの試聴を重ねて良否の判断をしています。このような試聴において、ブラインドであることに意味があるでしょうか?また音量を合わせる議論については、何の音量を合わせれば良いのでしょう。音量を含む種々の条件や、ソースなどを変えて、自分の目的を達するまで種々の条件で試聴するのが良いと思います。アンプについても程度の差こそあれれ上記例と同じだと思います。 Atelier Audillusionの見解 ブラインドテストのメリットは否定しませんが、実施に当たっては様々な乗り越えなくてはならない問題が山積しています。先の三氏のコメントは、これまで試聴会に参加したり主催して来た経験に良く合致しています。 また、ブラインドテストに適した内容は、今あるものを基準に新しいものが勝らずとも劣らずといったことだと思います。最近目にしたまともなブラインドテストの結果は圧縮フォーマットに関することで頷けます。 つまり、新しい価値を創造するための開発に関しては不適な方法と考えます。 第一に被験者は今聞いている音は知っていますが、そこから良くなった音は観念的抽象的な世界で受け入れる範囲が個人により大きく異なります。例えば圧縮フォーマットの場合、現在の基準の品質から内側の領域での評価となり、基準に対して劣化が有るか無いかで評価は収束方向になります。しかし、今まで聴いて来た音より品質が向上する場合、革命と言えるほどの変化が聴き取れれば音楽会と比べと言うことになりますが、そこまでの改善が頻繁に起きることはありません。革新と言えない範囲の改善の場合は、改善に対する期待感は人により異なります。ある音に対し問題点を持つ人にとって少しでもそこが改善されていれば検知し評価出来ますが、特に問題点を感じない人にとっては何が変わったか判らずに終わってしまいます。言い換えると改善と言う事象は現在の基準の品質の外側での評価となり、これまで経験したことのない事象で人夫々で評価は発散方向になります。 第二に開発過程に身を置いたことのない被験者は完成された商品としての評価をします。開発途上の完成度の低い状態で、完成度の高いものと比較するのであればブラインドテストを行うまでもありません。 第三に開発過程で開発者はある意味正帰還のかかった状態で、主題となる項目に対する感度が大変高くなっています。言い換えると開発者はある主題に対して繰り返し試聴を行っており訓練された状態といえます。開発者が聞き分ける項目であっても訓練されていない被験者にとっては同じか、完成度の違いに捉われた答えになります。 開発過程においては通常の比較試聴を経験を共有する仲間で行い、思い込みや思い違いのないこととを確認し、新しい取り組みの期待できる効果を議論しながら認識しあうという方法をとらざる得ません。 いずれにせよ、既に上げられたブラインドテストの問題点が解決されなければ、絵に描いた餅から抜け出せないと考えています。Atelier Audillusionはこれまで通り信頼出来るモニターの方々の意見を取り入れ工夫を重ねて行く予定です。 |