음성 인터페이스 디자인 기본 원칙 [효과적인 VUI 디자인]

원서명Voice User Interface Design (ISBN 9780321185761)
지은이마이클 코헨(Michael Cohen), 제임스 지앤골라(James Giangola), 제니퍼 발로(Jennifer Balogh)
옮긴이박은숙

ISBN : 9791161754086
35,000원
2020년 04월 21일 펴냄
페이퍼백 | 432쪽 | 188*235mm
시리즈 : UX 프로페셔널

판매처

책 소개
저자/역자 소개
목차
관련 블로그 글
도서 오류 신고

책 소개

요약

권위 있는 음성 사용자 인터페이스(VUI) 디자인 가이드로 포괄적인 내용을 다룬다. VUI는 사용자 경험이 불만이나 만족감을 결정하는 자동 음성 인식(ASR) 시스템의 성공에 가장 중요한 요소다. 이 책은 효과적인 VUI 디자인을 만드는 실용적인 방법론을 설명한다. 이 방법론은 언어학, 심리학, 언어 기술의 원리를 과학적으로 접근한다. ASR 개발 시장 선두주자인 뉘앙스 커뮤니케이션즈의 저자들이 금융 중개업 서비스 디자인 사례를 중심으로 VUI의 디자인 원칙과 사용자의 지속적인 사용 의도를 향상시킬 수 있는 음성 에이전트 의인화 및 페르소나 전략 등을 설명한다.

이 책에 쏟아진 찬사

마이크 코헨은 음성 기술 분야의 거물이다. 저자들은 수년간 쌓아온 VUI 디자인의 소중한 경험을 이 책에 담았다. 사용자 인터페이스를 디자인한다면 반드시 읽어야 할 책이다.
- 존 켈리(John Kelly)/ 「Speech Technology Magazine」 편집장

VUI 디자인은 예술, 과학, 프로세스의 도전적인 조합이다. 저자들은 VUI 디자인에 관한 깊은 견해로 광범위한 실제 경험을 늘려 나가며, 효과적인 음성 인터페이스에 필요한 사항을 알려준다. 이 책은 새롭고도 중요한 학문 뒤에 숨겨진 많은 미스터리를 풀었다.
- 빌 마이젤(Bill Meisel)/ 「Speech Recognition Update」 발행인이자 편집자

이 책이 갖는 강점은 연구 문헌의 깊이와 기반이다. VUI 디자인에 관해 상세한 설명서를 제공하는 시늉만 내는 게 아니라, 정보에 입각해 일련의 디자인 원칙을 제공하고 이 원칙을 특정 문제에 적용하도록 신뢰성 있는 정보를 제공한다.
- 크리스 슈만드(Chris Schmandt)/ MIT 미디어랩 수석 과학자

현재의 음성 인식 시스템은 인간보다 나은 것은 아니지만 한 단어를 인식할 수 있다. 효과적인 음성 시스템을 구축하는 것은 여전히 중요한 도전 과제다. 이 책은 효과적인 VUI를 생성하는 데 필요한 배경과 단계를 제공해 문제를 해결한다. 금융 중개업 디자인 사례를 중심으로 구성된 이 책은 성공적인 음성 애플리케이션을 구축하는 데 필요한 모든 접근 방식을 다룬다. 문어와 구어 간의 차이를 분석하는 것에서부터 프롬프트 디자인과 운율 체계 계획까지 이 책은 음성 애플리케이션 디자인에 관련해 연구하는 모든 사람의 표준이 돼야 한다.
- 해리 M. 허쉬(Harry M. Hersh)/ Users Voice

이 책의 대상 독자

■ 실무자: 주요 독자는 현직 실무자나 미래의 실무자가 될 사람들이다. 초보자가 봐도 모든 자료를 이해할 수 있도록 토대를 마련하려고 노력했다. 이 책은 경험이 풍부한 디자이너와 경험이 없는 디자이너 모두에게 가치를 제공한다. 실무자들은 모든 장의 내용을 읽고 필요한 도움을 얻을 수 있을 것이다.
■ HCI(Human–Computer Interfaces) 학생: 학생들은 VUI가 다른 유형의 사용자 인터페이스와 많은 공통점이 있음을 알게 될 것이다. 반면, 다수의 문제와 디자인 접근 방식은 음성 사용자 인터페이스에서만 발견할 수 있는 고유한 것이다. 전반적으로 유용하지만 특히 1~4장, 6장, 8~13장, 15~16장에서 많은 도움을 얻을 수 있다.
■ 비즈니스 관리자: 음성 기술로 조직의 니즈를 충족할 수 있는 방법을 결정하는 이들로 1~4장과 6장에서 많은 도움을 얻을 수 있다.
■ 프로젝트 관리자: 애플리케이션을 디자인하고 배포하는 단계를 알아야 하는 이들은 1~4장, 6~8장, 14~15장, 18장에서 많은 도움을 얻을 수 있다.

이 책의 구성

1부, 소개: 1장부터 3장에서는 음성 사용자 인터페이스 및 디자인 문제의 개요, 기술 설명과 책 전반에 걸쳐 자세히 설명할 디자인 방법론에 대한 고차원적 관점을 포함한 입문 자료를 제공한다.
2부, 정의 단계: 4장부터 7장에서는 요구 사항을 파악하고, 상세 디자인을 하기 전에 상위 수준의 디자인 결정과 같은 프로젝트의 정의 단계를 다룬다.
3부, 디자인 단계: 8장부터 14장에서는 상세 디자인 단계를 다룬다. 디자인 원리는 실제 애플리케이션에 적용하는 방법을 많은 예제를 들어 자세히 설명한다.
4부, 실현 단계: 15장부터 18장에서는 실현 단계인 개발, 테스트, 조정을 다룬다. 문법 개발과 같은 음성 사용자 인터페이스 디자인만의 고유한 여러 가지 문제를 설명한다. 각 부는 해당 디자인 단계의 방법론적 세부 사항을 다루는 장으로 시작한다. 그다음에는 해당 단계와 관련된 디자인 원칙과 접근법을 설명하며, 각 절의 마지막 장에서는 디자인 예제를 제시한다.

저자/역자 소개

지은이의 말

지난 10년 동안 전화를 사용한 음성 사용자 인터페이스(VUI, Voice User Interface)의 생성과 상용 배포가 폭발적으로 증가했다. VUI는 음성 기술을 사용해 호출자에게 정보에 대한 액세스 권한을 제공하고, 거래를 수행할 수 있도록 하며, 통신을 지원한다.
VUI의 확산은 터치톤(touchtone) 인터랙션에 대한 고객의 불만족, 모바일 액세스에 대한 욕구 증가, 기업의 고객 니즈를 많은 비용을 들이지 않으면서도 보다 효과적으로 충족시켜야 하는 필요성, 무엇보다도 견고하고 명확한 도메인에서 신뢰할 수 있는 음성 기술의 개발 등 여러 요인에 의해 좌우된다.
1994년부터 기술 성장 초기 10년 동안 극복해야 할 가장 큰 장애물은 기술력에 대한 회의적인 태도였다. 음성 기술은 수십 년 동안 그 성장을 약속해왔지만 여러 번 실망시켰다. 잠재적으로 고객 서비스를 개선하고, 그 비용을 절약할 수 있는 기업뿐만 아니라, 초기 창업 자금을 댈 수 있는 벤처 캐피털 회사도 음성 기술을 입증해야 했다. 몇 년 사이에 매일 수백만 통의 전화가 음성 기술을 이용해 성공적으로 처리되면서 기술력은 많이 입증됐다. 기술 향상은 최종 사용자에게 더 나은 경험을 제공하고, 기업 비즈니스 가치를 높이며, 새로운 유형의 애플리케이션을 만들 수 있도록 새로운 기능을 계속 유지하는 데 핵심적인 역할을 수행할 것이다. 음성 기술은 더 이상 음성 산업의 성장을 막는 주요 병목 현상은 아니다.
이제 가장 큰 도전은 사용자 인터페이스 디자인이다. 신기술이 새로운 기능을 실현할 때, 필요한 모든 시스템을 구축하고 이해를 증진시키는 지식과 기술을 가진 실무자가 너무 적다. 현재 실무자는 음성 기술, 사용자 인터페이스 디자인, 인지 심리학, 언어학, 소프트웨어 개발 등 다양한 배경지식이 있다. 이 모든 분야는 VUI 디자인이 현재 이해 수준까지 올 수 있도록 기여했다. 사실 사용자 인터페이스 디자인 분야는 영향력의 다양성으로부터 상당한 도움을 받았다. 그러나 다양한 분야에서 정보를 수집하기 때문에 디자인의 이론적 근거를 체계화하고 가르치기 어려운 측면도 있다.
이 책에서 우리는 실무자가 특정 애플리케이션을 디자인하고 분야의 발전에 기여하는데 필요한 많은 배경 정보를 한곳에서 제공하는 것을 목표로 한다. 또한 디자이너가 새로운 디자인 상황과 새로운 기술에 접근할 수 있는 기반을 갖기를 희망하면서 모범 사례를 도출하고자 원칙적으로 접근했다.

지은이 소개

마이클 코헨(Michael Cohen)

1994년 뉘앙스 커뮤니케이션즈(Nuance Communications)를 공동 설립했으며 다이얼로그 R&D 그룹의 부사장을 비롯해 다양한 직책을 맡았다. 고객과 협력해 애플리케이션 디자인과 전문 서비스 팀을 구성해 뉘앙스 초기 기술 22건을 배포하며 그룹을 이끌었다. 음성 사용자 인터페이스 연구, 세이 애니씽(Say Anything)과 아쿠루트(Accuroute)를 포함해 뉘앙스의 자연어 이해 기술과 보이저(Voyager), 뉘앙스 음성 브라우저와 같은 제품 인터페이스 디자인을 담당하는 다이얼로그 R&D 그룹을 만들었다.
70건 이상의 논문을 발표하고 음성 및 VUI 기술 관련 8건의 특허를 보유하고 있으며, 학회와 산업 무역 박람회에서 주로 발표한다. 스탠포드대학교의 컨설팅 교수로 AVIOS(Application Voice Input Society)의 이사회를 맡고 있으며, UC 버클리에서 컴퓨터 공학 박사 학위를 받았다.

제임스 지앤골라(James Giangola)

운율에서부터 담화 단계까지 자연스러운 대화의 원칙을 적용하려는 ‘산업 언어학자’라고 자부한다. 다이얼로그 디자인 외에도 음성 합성, 연계 계획, 제작, 음성 코칭 등의 전문 기술을 지니고 있다. 최우선 관심사는 사용자에게 친숙하며 편안하고 이해하기 쉬운 언어 경험을 제공하는 것이다.
브라운대학교, 몬터레이국제학원, UC 샌디에이고에서 언어학 학위를 받았으며, 고등학교와 대학교에서 10년 동안 언어를 가르친 경험이 있다. 『The Pronunciation of Brazilian Portuguese』(LINCOM, 2001)의 저자다.

제니퍼 발로(Jennifer Balogh)

뉘앙스 커뮤니케이션즈의 음성 컨설턴트다. 음성 언어 시스템의 인터페이스를 디자인하고 평가한다. AT&T, 찰스 슈왑 앤 컴퍼니(Charles Schwab & Company), TD 워터하우스와 같은 고객을 위해 애플리케이션을 연구했으며 뉘앙스 전화 운영(Nuance Call Steering), Vocalizer TTS 엔진, 음성 브라우저 보이저 및 스피치 오브젝트(SpeechObjects)를 비롯한 여러 제품에 기여했다.
컴퓨터 시스템의 인적 요인에 관한 CHI 콘퍼런스와 인간 문장 처리에 관한 CUNY 콘퍼런스에서 발표를 했으며, 스탠포드대학교, UC 샌디에이고, 샌프란시스코대학교, 샌디에이고대학교에서도 강의했다. 「Brain and Language」와 「International Journal of Speech Technology」 등에서 여러 논문을 발표했다. UC 샌디에이고에서 심리학 박사 학위를 받았고 브랜다이스대학교에서 학사 학위를 받았다.

옮긴이의 말

IoT 기술의 발전으로 다양한 제품이 인터넷으로 연결되고 AI 스피커의 보급률이 높아지면서 음성 사용자 인터페이스 즉, VUI를 사용하는 제품과 서비스가 늘고 있다. VUI가 점차 삶의 일부로 성장하면서 사용자는 잠자리에서 일어날 때부터 음성 에이전트에게 날씨를 물어보고 집안의 가전 기기를 제어하는 일들에 익숙해지고 있다.
하지만 나와 같은 UX 실무자에게는 새롭고 많은 고민거리가 생겨났다. VUI의 확산은 기존의 그래픽 중심이던 사용자 경험을 디자인을 넘어 음성 에이전트 활성화 방식, 사용자 명령 인식, 음성 에이전트의 응답과 같은 VUI 인터랙션 방식과 지속해서 사용성을 향상할 수 있는 음성 에이전트의 아이덴티티 전략에 관한 많은 고민이 필요하다. 또한 VUI 디자인은 사람들에게 가장 익숙한 커뮤니케이션 시스템인 ‘대화’로 시작하지만 인간의 ‘대화’는 상당히 복잡한 영역이다.
미묘한 뉘앙스로 인해 한순간에 호감도가 달라질 수 있을 뿐만 아니라 인터랙션 과정 전반에 걸쳐 더욱더 감성적이고 디테일한 피드백이 제공돼야 하기 때문에 인간의 언어 체계와 감정 체계에 많은 이해가 필요하다.
이 책의 저자들은 세계 최고의 음성 인식 전문가다. 오랜 시간 실제로 VUI 디자인을 하며 터득한 노하우와 시행착오를 이 책에 담았기 때문에 VUI 실무자들의 많은 고민을 해결해줌과 동시에 훌륭한 가이드라인이 될 것이다.
이 책이 사용성 높은 VUI를 디자인하는 데 실질적인 도움이 되기를 바란다.

옮긴이 소개