책 소개
요약
최근 가장 주목 받는 음성 사용자 인터페이스(VUI)는 어떻게 기획될까? 저자 캐시 펄(Cathy Pearl)은 17년 동안 쌓아온 경험을 바탕으로 음성 사용자 인터페이스를 명쾌하게 정리한다. 음성 사용자 인터페이스를 쉽게 이해할 수 있도록 다양한 사례를 제공하고, 음성 사용자 인터페이스를 디자인하기 위한 기본적인 원칙들을 알려준다. 음성 사용자 인터페이스 디자인을 이제 막 시작하는 새내기 디자이너뿐 아니라, 실무자들도 이 책을 통해 음성 사용자 인터페이스 디자인의 개념과 목적을 더욱 명확히 해서, 더 효율적이고 실용적인 음성 사용자 인터페이스 설계를 하는 데 도움을 얻을 수 있을 것이다.
추천의 글
음성은 오래 전부터 핵심적인 인간이 의사소통 방식이었다. 이제 이 오래된 방식이 가장 새로운 방식이 돼, 사람과 컴퓨터가 소통하는 핵심 방법이 되고 있다. 캐시 펄은 17년간의 경험을 이 책에 담아 출판했다. 그녀는 귀중한 경험들, 명쾌한 생각, 통찰력 있는 관찰을 바탕으로 음성 인터페이스 디자인의 주요 요소들을 담아내고 있다. 고대 소통 방식을 완전히 새롭게 접근하고 있는 것이다.
ㅡ 마크 스테판 메도우(Mark Stephen Meadows) / 작가, 예술가, 보타닉(BOTANIC.IO) 대표
이 책은 음성 사용자 인터페이스 디자인의 기초를 배우기에 훌륭한 자료다. 앞으로 점점 더 많은 디자이너가 VUX를 설계하게 될 것이며, 이 책은 그들이 음성 사용자 인터페이스를 설계하는 방법을 배우는 데 도움을 줄 것이다.
ㅡ 크리스 모리(Chris Maury) / 컨버센트 랩스(Conversant Labs) 창립자
음성 사용자 인터페이스 디자인에 대한 실용적이면서도 종합적인 캐시 펄의 책은 그녀의 방대한 실무 경험에서 비롯된 것이다. 그녀의 수년간 경험이 담긴 이 책으로 당신만의 음성 사용자 인터페이스 경험을 좀 더 유리하게 시작할 수 있을 것이다.
ㅡ 레베카 나울린 그린(Rebecca Nowlin Green) / 뉘앙스 커뮤니케이션 비즈니스 컨설턴트
듣고 말할 수 있는 시스템에 대한 그녀의 열정을 공유하는 동시에 음성 사용자 인터페이스 디자인의 새로운 시대를 맞이해 폭넓고 실질적인 적용 범위를 제시하고 있다. 음성 디자인은 업계의 ‘내부자’조차도 피할 수 없는 특별한 도전과 의미를 지니고 있기 때문에 이 책은 이 분야에 종사하는 의사 결정자들과 개발자들에게도 가치가 있을 것이다. 멀티 모달 앱의 문화적 정착, 챗봇의 등장, 가상 비서(virtual assistant)의 부활(1990년대의 와일드파이어(Wildfire)와 제네럴 매기(General Magi)를 기억하는가?) 시기에 꼭 필요한 책이다.
ㅡ 제임스 지안골라(James Giangola) / 크리에이티브 책임자, 대화 디자인 & 디렉션, 구글
이 책에는 효과적인 음성 사용자 인터페이스를 설계하는 방법이 담겨 있다. 또한 전문가의 실질적인 조언과 최신 기술들을 참조로 하는 최신 예시들로 가득 차 있다. 이 책은 모든 음성 사용자 인터페이스 디자이너의 책상에 있어야 마땅하다.
ㅡ 제니퍼 발로그(Jennifer Balogh) / 『Voice User Interface Design』(Addison-Wesley Professional, 2004) 공동 저자
이 책에서 다루는 내용
■ 명령 제어 및 대화형 시스템을 포함한 주요 음성 사용자 인터페이스 디자인 개념 이해
■ 음성 사용자 인터페이스에서 아바타 또는 시각적 효과 사용 여부의 결정
■ 음성 인식 기술과 이 기술이 디자인에 미치는 영향
■ 기본적인 정보 전달 이상의 음성 사용자 인터페이스 구축
■ 사용자와 음성 사용자 인터페이스 응용 프로그램을 테스트하는 실용적인 방법
■ 앱을 모니터링하고, 신속하게 성능을 개선하는 방법
■ 홈 어시스턴트, 스마트워치 및 자동차 시스템 등의 음성 사용자 인터페이스의 실제 사례
이 책의 대상 독자
이 책의 주요 독자는 모바일 폰이든, 장난감이든, 가정용 비서이든 관계 없이 음성 사용자 인터페이스를 디자인하는 사람이다. 일반적인 UI 디자인의 원칙이 여전히 음성 사용자 인터페이스에 적용되지만 음성 사용자 인터페이스 디자인과 웹 사이트 또는 GUI 전용 모바일 앱 디자인 간에는 중요한 차이점이 있다. GUI를 사용하면 사용자가 할 수 있는 일의 수가 제한되고 사용자가 언제 버튼을 눌렀고 언제 메뉴 항목을 선택했는지가 명확해진다. 사람은 누군가 말을 하면 그 사람이 한 말의 맥락을 이해할 수 있지만 음성 사용자 인터페이스는 그렇지 못하기 때문에 좋은 사용자 경험을 위해 많은 추가 디자인 요소가 필요하다.
음성 사용자 인터페이스(또는 챗봇과 같은 다른 유형의 대화형 UI)를 만드는 개발자가 기본 디자인 원칙을 이해하고 있으면 프로토타입 성공 가능성이 더 커진다.
관리자와 비즈니스 개발자는 이 책을 통해 음성 사용자 인터페이스 디자인 도전 과제와 해결하고자 하는 문제에 음성 사용자 인터페이스가 적합한지 여부를 배울 수 있다. 경우에 따라 GUI 앱이 제대로 작동해 음성 사용자 인터페이스가 필요하지 않을 수도 있다.
이 책의 구성
1장, ‘소개’에서는 음성 사용자 인터페이스의 역사를 간략하게 소개하고 음성 사용자 인터페이스가 당신과 당신의 앱에 적합한지 여부에 대해 다룬다. 또한 ‘대화식’의 의미와 챗봇의 개요를 설명한다.
2장, ‘기본 음성 사용자 인터페이스 디자인 원칙’에서는 음성 사용자 인터페이스 생성 시 알아야 하는 기초 지식을 설명한다. 디자인 도구, 확인, 에러 동작 및 초보 대 전문 사용자와 같은 주제에 대한 필수 디자인 원칙을 다룬다.
3장, ‘페르소나 아바타, 배우 그리고 비디오 게임’은 음성 사용자 인터페이스에 아바타 또는 캐릭터를 추가하려는 디자이너에게 유용하다. 당신의 음성 사용자 인터페이스에 아바타가 있어야 하는지 확실하지 않은 경우에 유용할 것이다. 또한 모든 음성 사용자 인터페이스에 필수적인 페르소나 디자인에 대해 논의한다.
4장, ‘음성 인식 기술’은 음성 사용자 인터페이스 디자이너에게 필수다. 디자인에 큰 영향을 미칠 수 있는 기술 자체를 이해하기 위해 필요한 내용을 다룬다.
5장, ‘고급 음성 사용자 인터페이스 디자인’은 2장, ‘기본 음성 사용자 인터페이스 디자인 원칙’에서 다룬 내용을 넘어 자연 언어(natural-language) 이해, 정서 분석, 데이터 수집 및 텍스트 음성 변환을 위한 좀 더 복잡한 전략을 소개한다.
6장, ‘음성 사용자 인터페이스 사용자 테스트’에서는 음성 사용자 인터페이스 사용자 테스트가 모바일 앱과 웹 사이트의 사용자 테스트와 어떻게 다른지에 대해 자세히 설명한다. 저-정확도(low-fidelity) 테스트 방법, 원격 및 실험실 테스트 방법을 다룬다. 또한 자동차 및 기타 다른 유형의 기기의 음성 사용자 인터페이스를 테스트하는 방법을 소개한다.
7장, ‘음성 사용자 인터페이스 완료! 다음 작업은?’에서는 음성 사용자 인터페이스가 ‘실전’일 때 필요한 방법론에 대해 간략히 설명한다. 또한 성능을 이해하고 개선하기 위해 분석할 수 있는 정보와 방법을 다룬다. 그러나 (7장을 읽기 위해) 출시할 때까지 기다리지는 말자. 시스템이 아직 개발되는 동안 무엇을 기록해야 하는지 아는 것이 중요하다.
8장, ‘음성 지원 기기 및 자동차’에서는 7장, ‘음성 사용자 인터페이스 완료! 다음 작업은?’에서 다루지 않았던 음성 사용자 인터페이스에 중점을 둔다. ‘기기’ 절에서는 가정용 비서 기기와 웨어러블을 다루고 ‘자동차 및 자율 차량’ 절에서는 자동차 디자인의 도전 과제와 모범 사례를 살펴본다. 8장에는 이 분야의 전문가들이 기여했다.
일부 디자이너는 독립 실행형 시스템으로 음성 사용자 인터페이스를 만드는 반면, 다른 디자이너는 아마존에코(Echo)의 단일 기술과 같은 기존 플랫폼을 사용한다. 특히 기존 플랫폼 위에 구축하는 데 중점을 둔 독자에게 관련된 내용은 2장, ‘기본 음성 사용자 인터페이스 디자인 원칙’, 4장, ‘음성 인식 기술’, 5장, ‘고급 음성 사용자 인터페이스 디자인’이다.
상세 이미지
목차
목차
- 1장. 쉐이더 개발 과정
- VUI의 역사
- VUI의 두 번째 시대
- 왜 음성 사용자 인터페이스인가?
- 속도
- 핸즈프리
- 직관성
- 공감
- 공공 장소
- 컴퓨터에게 말하는 어색함
- 문자 메시지를 선호하는 사용자
- 사생활 보호
- 대화형 사용자 인터페이스
- VUI 디자이너란?
- 챗봇
- 결론
- VUI의 역사
- 2장. 음성 사용자 인터페이스 기본 디자인 원칙
- 모바일 기기 대 IVR 시스템 설계
- 대화형 디자인
- 사용자 기댓값 설정
- 디자인 도구
- 샘플 대화
- 비주얼 목업
- 흐름
- 프로토타이핑 도구
- 확인
- 명시적 확인
- 암시적 확인
- 방법1: 3단계 신뢰도(Three-Tiered Confidence)
- 방법2: 암시적 확인
- 방법3: 비언어적 확인
- 방법4: 일반적 확인
- 명령 제어형 대 대화형
- 명령 제어형
- 대화형
- 대화형 마커
- 에러 처리
- 잘못 인식된 경우
- 에스컬레이팅 에러
- 사용자를 비난하지 말 것
- 초보 사용자와 전문 사용자
- 지속적인 맥락 추적
- 도움말 및 기타 유니버설
- 대기
- 명확성
- 디자인 문서
- 프롬프트
- 문법/핵심 문구
- 접근성
- 짧게 하라
- 더 빨리 말하라!
- 언제든지 중단할 수 있게 하라
- 맥락을 제공하라
- 뭐하고 있었지?
- 텍스트 음성 변환의 개인화
- 다른 방식의 접근성
- 결론
- 페르소나
- VUI는 눈에 보여야 하는가?
- 아바타 사용하기: 하지 말아야 할 것
- 아바타 사용하기(또는 영상 녹화): 해야 할 것
- 스토리텔링
- 팀워크
- 비디오 게임
- UI에서는 언제 비디오를 사용해야 하는가?
- 시각적 VUI의 모범 사례
- 사용자들이 그들 스스로를 봐야 하는가?
- GUI에서는 어떠해야 하는가?
- 에러 처리하기
- 차례대로 말하기와 끼어들기
- 참여도 유지 및 인식의 환상
- 시각적 피드백(아바타 제외)
- 목소리 선택하기
- 아바타의 장점
- 아바타의 단점
- 불쾌의 골짜기
- 결론
- 엔진 선택하기
- 끼어들기
- 시간 초과
- 발화 종료 시간 초과
- 발화 시간 제한 없음
- 너무 말이 많은 경우
- N-베스트 목록
- 음성 인식의 도전 과제
- 소음
- 다중 스피커
- 어린이
- 이름, 철자, 글자와 숫자의 혼합
- 정보 보호
- 결론
- 음성 입력 기반 분류(Branching)
- 제한된 응답
- 오픈 스피치
- 입력의 범주화(Categorization)
- 와일드카드 및 논리적 표현
- 명확화
- 충분하지 않은 정보
- 너무 많은 정보의 제공
- 부정(否定) 처리
- 의도와 대상 포착하기
- 대화 관리
- 사용자를 내버려두지 말 것
- VUI가 인식한 것을 표시할 것인가?
- 감성 분석과 감정 탐지
- 문자 음성 변환과 녹음된 음성 비교
- 발화자 인증
- 기동어
- 맥락
- 고급 멀티 모달
- 부트스트랩 데이터 세트
- 웹 사이트 데이터
- 콜센터 데이터
- 데이터 수집
- 고급 NLU
- 데보라 다힐, 모바일 2016
- 결론
- VUI의 특수 고려 사항
- 사용자 및 사용 사례에 대한 사전 조사
- 쓸데없이 시간을 낭비하지 마라
- 실제 사용자와 함께 연구 설계하기
- 과제 정의(Task Definition)
- 실험 참가자 선택하기
- 물어볼 질문
- 개방형 답변(문답형 질문)
- 살펴봐야 할 사항
- 초기 단계 테스트
- 샘플 대화
- 산타클로스와 얘기하세요
- 목업
- 오즈의 마법사 테스트
- 위대하고 강력한 오즈
- 문자 메시지 사용하기
- 생략된 작업에 집중하기
- 오류 발생시키기
- VUI가 완성되기 전부터, GUI 테스트하기
- WOz 테스트와 사용성 테스트의 차이점
- 사용성 테스트
- 다음 단계
- 자동차, 기기, 로봇의 VUIS 테스트
- 자동차
- 기기와 로봇
- 결론
- 출시 전 검증
- 대화 흐름 검증
- 인식 검증
- 인식 검증
- 부하 검증
- 성과 측정
- 임무 완수율
- 중도 이탈률
- 기타 추적해야 할 항목들
- VUI 소요 시간
- 끼어들기
- 음성 대 GUI
- 잦은 시간 초과와 불일치
- 탐색
- 지연
- 전체 통화 녹음
- 정보 수집(logging)
- 전사(轉寫)
- 출시 단계
- 파일럿(시범 서비스)
- 설문
- 분석
- 신뢰 임곗값
- 발화 종료 시간 초과
- 중간 결괏값 대 최종 결괏값
- 맞춤 사전
- 프롬프트
- 도구
- 회귀 테스트
- 결론
- 기기들
- 홈 어시스턴트
- 스크린이 없는 기기의 VUI 설계하기
- 짧게 유지할 것
- 자연스럽게 유지할 것
- 피드백을 제공할 것
- 모호한 것을 위해 디자인할 것
- 수정을 지원할 것
- 시기의 중요성
- 목록의 어려움
- TTS(문자 음성 변환)의 제약 사항
- 시계/밴드/이어폰
- 다른 기기들
- 자동차 및 자율주행차
- 자동차 VUI의 도전 과제들
- 자동차 안을 위한 디자인
- 부주의 운전
- 기기 전환
- 인터랙션 모드
- 자동차 결론