banner

블로그

Jul 28, 2023

위스콘신 연구원들은 PVC 파이프의 도움으로 일부 음성 인식 시스템을 속였습니다.

사람의 목소리를 암호로 사용하는 컴퓨터 시스템을 속이는 것이 가능합니까? 일부 위스콘신 엔지니어들은 대답이 '그렇다'고 말하며 철물점에서 찾을 수 있는 플라스틱 파이프를 사용하여 부분적으로 그렇게 했다고 말합니다.

일부 온라인 뱅킹 시스템은 자동 화자 식별(간단히 말하면)을 사용하여 계정 소유자의 음성을 암호로 사용합니다. UW-Madison 전기 및 컴퓨터 공학 교수인 Kassem Fawaz는 또한 Apple iPhone 사용자는 소유자에게만 응답하는 가상 비서 Siri에 익숙할 것이라고 말합니다.

"Siri가 당신에게만 응답하는 이유는 화자 식별이라는 기술을 사용하기 때문입니다. 그래서 그들은 지문과 유사한 일종의 성문을 얻어 그것이 당신에게서 온 것인지, 아니면 다른 사람에게서 온 것인지 확인할 수 있습니다. 그리고 이것이 바로 Siri가 사용자나 휴대폰 소유자가 통화 중인지 확인할 수 있는 방법입니다."라고 Fawaz는 말합니다.

하지만 Fawaz와 두 명의 UW-Madison Ph.D. 학생들은 디지털 보안을 개선하기 위한 여러 대학의 노력에 참여하고 있습니다. 그래서 그들은 컴퓨터 시스템을 속일 수 있는 방법을 모색해 왔습니다. 그들과 다른 사람들은 이미 인간의 목소리를 복제하고 컴퓨터가 그 사람처럼 말하도록 하는 작업을 진행해 왔습니다.

최근 Fawaz는 엔지니어들이 디지털에서 물러나 아날로그로 전환하여 많은 화자 식별 시스템을 속일 수 있다는 것을 깨달았다고 말했습니다.

Fawaz는 "이것이 우리가 다른 사람을 흉내낼 수 있는 디지털 전자 장치가 없는 일종의 아날로그 장치를 설계한다는 아이디어를 갖게 된 방법입니다."라고 말합니다.

박사. 학생 Shimaa Ahmed는 유명 인사를 흉내 내면서 많은 종이 타월 롤에서 발견되는 판지 튜브를 통해 처음으로 말을 시도했다고 말했습니다.

"그리고 그것은 효과가 있었습니다. 이 키친 페이퍼 타월 튜브를 통해 유명인의 목소리 중 일부를 전달하자 그 유명인에 대한 예측이 바뀌었습니다."라고 Ahmed는 말합니다.

결국 Fawaz는 철물점의 배관 부품 통로에서 플라스틱 PVC 파이프를 구입했고 팀은 이를 사용하기 시작했습니다.

Fawaz는 튜브에 단점이 있다는 것을 깨달았다고 말했습니다.

"일반 배관 튜브는 치수가 고정되어 있죠? 길이는 잘라서 조절할 수 있지만 직경은 조절할 수 없습니다. 일부 실험에서는 Ace Hardware에서 찾을 수 없는 특별한 직경의 튜브가 필요했습니다. 따라서 이러한 튜브를 제작하기 위해 필요한 것은 튜브를 제작하는 가장 쉬운 방법은 3D 프린팅하는 것입니다."라고 Fawaz는 말합니다.

팀은 당시 학부생이었으며 현재는 박사 학위를 취득했습니다. 튜브를 3D로 인쇄한 학생 Yash Wani. Wani는 이 연구가 그의 학문적 초점을 바꾸었다고 말했습니다.

"솔직히 제가 박사 학위를 하게 된 것은 정말 멋진 일이었습니다. 계속해서 일할 수 있다는 것만으로도 충분히 멋진 일이었습니다."라고 그는 말합니다.

연구자들은 다른 목소리를 모방하기 위해 거의 모든 목소리의 공명(음조 강도와 품질)을 변환하는 데 필요한 파이프 치수를 파악하는 알고리즘 또는 엄격한 지침을 개발했습니다.

한 녹음에서 Ahmed는 기존 음성 데이터 세트를 읽었으며 여배우 Lisa Kudrow, 즉 Friends의 Phoebe와 약간 비슷하게 들렸습니다.

"바위 위에는 아무것도 없었습니다"라고 읽혀졌습니다. Ahmed는 또한 TV 시리즈 Yellowstone에 출연하는 여배우 Kelly Reilly의 흉내를 시도했습니다. 아흐메드는 녹음에서 "'모르겠다'고 필립이 대답했다"고 말했다.

그것들은 정확한 모방이 아니었습니다. 하지만 음성인증 시스템의 디지털 공격 필터를 뚫고 속일 수 있을 만큼 뛰어났다. 또한 UW-Madison 엔지니어들은 실험에서 다른 학생의 목소리를 사용하여 91개의 목소리 테스트에서 보안 시스템을 속이는 비율이 60%라고 보고했습니다.

논문을 작성하고 Ahmed가 이번 달 캘리포니아에서 열리는 보안 심포지엄에서 결과를 발표하기에 충분했습니다.

"사람들은 우리가 튜브와 같은 장치를 어떻게 만들 수 있는지 궁금해했지만 더 복잡한 것은 우리가 어떤 사람이라도 흉내낼 수 있다는 것입니다."라고 Ahmed는 말합니다.

Fawaz는 Apple, Google, IBM, Microsoft 등 모든 화자 식별 시스템 제조업체가 자사 기술의 다양한 단점을 인식하고 이를 해결하기 위해 노력하고 있다고 말합니다.

공유하다