ウィスコンシン州の研究者は、PVC パイプの少しの助けを借りて、いくつかの音声識別システムをだます
ホームページホームページ > ブログ > ウィスコンシン州の研究者は、PVC パイプの少しの助けを借りて、いくつかの音声識別システムをだます

ウィスコンシン州の研究者は、PVC パイプの少しの助けを借りて、いくつかの音声識別システムをだます

Sep 12, 2023

人の声をパスコードとして使用するコンピュータ システムをだますことは可能ですか? ウィスコンシン州の技術者の中には、答えはイエスであり、金物店で買えるプラスチックのパイプを部分的に使って実現したと言う人もいる。

一部のオンライン バンキング システムでは、自動話者識別 (より簡単に言うと、口座名義人の声) をパスコードとして使用します。 ウィスコンシン大学マディソン校電気・コンピュータ工学教授のカセム・ファワズ氏も、Apple iPhone ユーザーは、所有者にのみ応答する仮想アシスタント Siri に精通している可能性が高いと述べています。

「Siri があなたにのみ応答する理由は、Siri が話者識別と呼ばれるこの技術を採用しているためです。したがって、Siri は指紋に似たある種の声紋を取得し、それがあなたからのものなのか、それとも他の人からのものなのかを確認することができます」これにより、Siri はユーザーまたは携帯電話の所有者が話しかけていることを確認できるようになります」とファワズ氏は言います。

しかし、ファワズと2人のUWマディソン博士号は、 学生たちは、デジタル セキュリティを向上させるための複数の大学の取り組みに参加しています。 そこで、彼らはコンピュータ システムをだます方法を研究してきました。 彼らや他の研究者たちは、人間の声を複製し、コンピューターにその人のように話すようにさせることにすでに取り組んでいます。

最近になってファワズ氏は、技術者たちがデジタルから逆戻りしてアナログに移行すれば、多くの話者識別システムを騙すことができることに気づいたと述べた。

「そして、私たちは、デジタル電子機器を一切持たず、他人になりすますことを可能にする、ある種のアナログデバイスを設計するというアイデアにたどり着きました」とファワズ氏は言う。

博士号学生のシマア・アーメッドさんは、最初は多くのペーパータオルロールに入っているボール紙の筒を通して、有名人の真似をして話してみた、と語った。

「そしてそれはうまくいきました。このキッチンペーパータオルの筒に有名人の声を通したところ、それらの有名人の予測が変わりました」とアーメッドは言う。

最終的に、ファワズはホームセンターの配管部品売り場からプラスチックの PVC パイプを購入し、チームはそれを使い始めました。

ファワズ氏は、真空管には欠点があることに気づいたと言う。

「通常の配管チューブは寸法が決まっていますよね。長さは切断することで制御できますが、直径は制御できません。一部の実験では特殊な直径のチューブが必要でしたが、エース ハードウェアでは見つけることができませんでした」したがって、これらのチューブを製造するために必要なことは、チューブを製造する最も簡単な方法は、3D プリントすることです」とファワズ氏は言います。

チームは当時学部生で、現在は博士号を取得した博士に目を向けました。 いくつかのチューブを 3D プリントした学生のヤシュ ワニ。 ワニさんは、この研究によって学問への焦点が変わったと語る。

「正直に言うと、こうして博士号を取得することができたのはとてもクールだった。それを続けるのは十分にクールだった」と彼は言う。

研究者らは、ほぼすべての声の共鳴、つまり音の強さと質を変換して別の声を模倣するために必要なパイプの寸法を割り出すアルゴリズム、つまり厳密な指示を開発した。

ある録音では、アーメッドが従来の音声データセットを読み取ったところ、女優のリサ・クドロー(ご存知、『フレンズ』のフィービー)に少し似た声を出していた。

「岩の上には何もありませんでした」と読みは続きました。 アーメッドさんは、テレビシリーズ『イエローストーン』に出演している女優ケリー・ライリーの真似にも挑戦した。 「『分からない』とフィリップは答えた」とアーメッドさんは録音で語った。

それらは正確に模造されたものではありませんでした。 しかし、音声認証システムのデジタル攻撃フィルターを通過して騙すには十分でした。 実験では他の学生の音声も使用し、ウィスコンシン大学マディソン校のエンジニアは、91 の音声のテストで 60% の確率でセキュリティ システムを欺いたと報告しています。

論文を執筆し、アーメッド氏が今月カリフォルニアで開催されるセキュリティシンポジウムで調査結果を発表するには十分だ。

「人々は、チューブのような、しかしより複雑な、あらゆる人になりすますことができるデバイスをどうやって作ることができるのかについて興味を持っていました」とアーメッド氏は言う。

ファワズ氏によると、話者識別システムのメーカーはすべて、Apple、Google、IBM、Microsoft など、自社のテクノロジーのさまざまな欠点を認識しており、それらを修正しようとしているという。