Top

음성 사용자 인터페이스 디자인 [VUI 디자인의 핵심 개념과 활용]

  • 원서명Designing Voice User Interfaces: Principles of Conversational Experiences (ISBN 9781491955413)
  • 지은이캐시 펄(Cathy Pearl)
  • 옮긴이김명선, 김선영
  • ISBN : 9791161753164
  • 30,000원
  • 2019년 06월 28일 펴냄
  • 페이퍼백 | 304쪽 | 188*235mm
  • 시리즈 : UX 프로페셔널

책 소개

요약

최근 가장 주목 받는 음성 사용자 인터페이스(VUI)는 어떻게 기획될까? 저자 캐시 펄(Cathy Pearl)은 17년 동안 쌓아온 경험을 바탕으로 음성 사용자 인터페이스를 명쾌하게 정리한다. 음성 사용자 인터페이스를 쉽게 이해할 수 있도록 다양한 사례를 제공하고, 음성 사용자 인터페이스를 디자인하기 위한 기본적인 원칙들을 알려준다. 음성 사용자 인터페이스 디자인을 이제 막 시작하는 새내기 디자이너뿐 아니라, 실무자들도 이 책을 통해 음성 사용자 인터페이스 디자인의 개념과 목적을 더욱 명확히 해서, 더 효율적이고 실용적인 음성 사용자 인터페이스 설계를 하는 데 도움을 얻을 수 있을 것이다.

추천의 글

음성은 오래 전부터 핵심적인 인간이 의사소통 방식이었다. 이제 이 오래된 방식이 가장 새로운 방식이 돼, 사람과 컴퓨터가 소통하는 핵심 방법이 되고 있다. 캐시 펄은 17년간의 경험을 이 책에 담아 출판했다. 그녀는 귀중한 경험들, 명쾌한 생각, 통찰력 있는 관찰을 바탕으로 음성 인터페이스 디자인의 주요 요소들을 담아내고 있다. 고대 소통 방식을 완전히 새롭게 접근하고 있는 것이다.
ㅡ 마크 스테판 메도우(Mark Stephen Meadows) / 작가, 예술가, 보타닉(BOTANIC.IO) 대표

이 책은 음성 사용자 인터페이스 디자인의 기초를 배우기에 훌륭한 자료다. 앞으로 점점 더 많은 디자이너가 VUX를 설계하게 될 것이며, 이 책은 그들이 음성 사용자 인터페이스를 설계하는 방법을 배우는 데 도움을 줄 것이다.
ㅡ 크리스 모리(Chris Maury) / 컨버센트 랩스(Conversant Labs) 창립자

음성 사용자 인터페이스 디자인에 대한 실용적이면서도 종합적인 캐시 펄의 책은 그녀의 방대한 실무 경험에서 비롯된 것이다. 그녀의 수년간 경험이 담긴 이 책으로 당신만의 음성 사용자 인터페이스 경험을 좀 더 유리하게 시작할 수 있을 것이다.
ㅡ 레베카 나울린 그린(Rebecca Nowlin Green) / 뉘앙스 커뮤니케이션 비즈니스 컨설턴트

듣고 말할 수 있는 시스템에 대한 그녀의 열정을 공유하는 동시에 음성 사용자 인터페이스 디자인의 새로운 시대를 맞이해 폭넓고 실질적인 적용 범위를 제시하고 있다. 음성 디자인은 업계의 ‘내부자’조차도 피할 수 없는 특별한 도전과 의미를 지니고 있기 때문에 이 책은 이 분야에 종사하는 의사 결정자들과 개발자들에게도 가치가 있을 것이다. 멀티 모달 앱의 문화적 정착, 챗봇의 등장, 가상 비서(virtual assistant)의 부활(1990년대의 와일드파이어(Wildfire)와 제네럴 매기(General Magi)를 기억하는가?) 시기에 꼭 필요한 책이다.
ㅡ 제임스 지안골라(James Giangola) / 크리에이티브 책임자, 대화 디자인 & 디렉션, 구글

이 책에는 효과적인 음성 사용자 인터페이스를 설계하는 방법이 담겨 있다. 또한 전문가의 실질적인 조언과 최신 기술들을 참조로 하는 최신 예시들로 가득 차 있다. 이 책은 모든 음성 사용자 인터페이스 디자이너의 책상에 있어야 마땅하다.
ㅡ 제니퍼 발로그(Jennifer Balogh) / 『Voice User Interface Design』(Addison-Wesley Professional, 2004) 공동 저자

이 책에서 다루는 내용

■ 명령 제어 및 대화형 시스템을 포함한 주요 음성 사용자 인터페이스 디자인 개념 이해
■ 음성 사용자 인터페이스에서 아바타 또는 시각적 효과 사용 여부의 결정
■ 음성 인식 기술과 이 기술이 디자인에 미치는 영향
■ 기본적인 정보 전달 이상의 음성 사용자 인터페이스 구축
■ 사용자와 음성 사용자 인터페이스 응용 프로그램을 테스트하는 실용적인 방법
■ 앱을 모니터링하고, 신속하게 성능을 개선하는 방법
■ 홈 어시스턴트, 스마트워치 및 자동차 시스템 등의 음성 사용자 인터페이스의 실제 사례

이 책의 대상 독자

이 책의 주요 독자는 모바일 폰이든, 장난감이든, 가정용 비서이든 관계 없이 음성 사용자 인터페이스를 디자인하는 사람이다. 일반적인 UI 디자인의 원칙이 여전히 음성 사용자 인터페이스에 적용되지만 음성 사용자 인터페이스 디자인과 웹 사이트 또는 GUI 전용 모바일 앱 디자인 간에는 중요한 차이점이 있다. GUI를 사용하면 사용자가 할 수 있는 일의 수가 제한되고 사용자가 언제 버튼을 눌렀고 언제 메뉴 항목을 선택했는지가 명확해진다. 사람은 누군가 말을 하면 그 사람이 한 말의 맥락을 이해할 수 있지만 음성 사용자 인터페이스는 그렇지 못하기 때문에 좋은 사용자 경험을 위해 많은 추가 디자인 요소가 필요하다.
음성 사용자 인터페이스(또는 챗봇과 같은 다른 유형의 대화형 UI)를 만드는 개발자가 기본 디자인 원칙을 이해하고 있으면 프로토타입 성공 가능성이 더 커진다.
관리자와 비즈니스 개발자는 이 책을 통해 음성 사용자 인터페이스 디자인 도전 과제와 해결하고자 하는 문제에 음성 사용자 인터페이스가 적합한지 여부를 배울 수 있다. 경우에 따라 GUI 앱이 제대로 작동해 음성 사용자 인터페이스가 필요하지 않을 수도 있다.

이 책의 구성

1장, ‘소개’에서는 음성 사용자 인터페이스의 역사를 간략하게 소개하고 음성 사용자 인터페이스가 당신과 당신의 앱에 적합한지 여부에 대해 다룬다. 또한 ‘대화식’의 의미와 챗봇의 개요를 설명한다.
2장, ‘기본 음성 사용자 인터페이스 디자인 원칙’에서는 음성 사용자 인터페이스 생성 시 알아야 하는 기초 지식을 설명한다. 디자인 도구, 확인, 에러 동작 및 초보 대 전문 사용자와 같은 주제에 대한 필수 디자인 원칙을 다룬다.
3장, ‘페르소나 아바타, 배우 그리고 비디오 게임’은 음성 사용자 인터페이스에 아바타 또는 캐릭터를 추가하려는 디자이너에게 유용하다. 당신의 음성 사용자 인터페이스에 아바타가 있어야 하는지 확실하지 않은 경우에 유용할 것이다. 또한 모든 음성 사용자 인터페이스에 필수적인 페르소나 디자인에 대해 논의한다.
4장, ‘음성 인식 기술’은 음성 사용자 인터페이스 디자이너에게 필수다. 디자인에 큰 영향을 미칠 수 있는 기술 자체를 이해하기 위해 필요한 내용을 다룬다.
5장, ‘고급 음성 사용자 인터페이스 디자인’은 2장, ‘기본 음성 사용자 인터페이스 디자인 원칙’에서 다룬 내용을 넘어 자연 언어(natural-language) 이해, 정서 분석, 데이터 수집 및 텍스트 음성 변환을 위한 좀 더 복잡한 전략을 소개한다.
6장, ‘음성 사용자 인터페이스 사용자 테스트’에서는 음성 사용자 인터페이스 사용자 테스트가 모바일 앱과 웹 사이트의 사용자 테스트와 어떻게 다른지에 대해 자세히 설명한다. 저-정확도(low-fidelity) 테스트 방법, 원격 및 실험실 테스트 방법을 다룬다. 또한 자동차 및 기타 다른 유형의 기기의 음성 사용자 인터페이스를 테스트하는 방법을 소개한다.
7장, ‘음성 사용자 인터페이스 완료! 다음 작업은?’에서는 음성 사용자 인터페이스가 ‘실전’일 때 필요한 방법론에 대해 간략히 설명한다. 또한 성능을 이해하고 개선하기 위해 분석할 수 있는 정보와 방법을 다룬다. 그러나 (7장을 읽기 위해) 출시할 때까지 기다리지는 말자. 시스템이 아직 개발되는 동안 무엇을 기록해야 하는지 아는 것이 중요하다.
8장, ‘음성 지원 기기 및 자동차’에서는 7장, ‘음성 사용자 인터페이스 완료! 다음 작업은?’에서 다루지 않았던 음성 사용자 인터페이스에 중점을 둔다. ‘기기’ 절에서는 가정용 비서 기기와 웨어러블을 다루고 ‘자동차 및 자율 차량’ 절에서는 자동차 디자인의 도전 과제와 모범 사례를 살펴본다. 8장에는 이 분야의 전문가들이 기여했다.
일부 디자이너는 독립 실행형 시스템으로 음성 사용자 인터페이스를 만드는 반면, 다른 디자이너는 아마존에코(Echo)의 단일 기술과 같은 기존 플랫폼을 사용한다. 특히 기존 플랫폼 위에 구축하는 데 중점을 둔 독자에게 관련된 내용은 2장, ‘기본 음성 사용자 인터페이스 디자인 원칙’, 4장, ‘음성 인식 기술’, 5장, ‘고급 음성 사용자 인터페이스 디자인’이다.

상세 이미지

저자/역자 소개

지은이의 말

최근 음성 사용자 인터페이스(VUI)가 주목을 끌고 있다. 하지만 어떻게 사용자와 실제 대화가 가능한 시스템을 구축할 수 있을까? 모바일 앱, 장난감 또는 홈 어시스턴트를 기획하고 있다면, 이 책은 당신에게 기본 음성 사용자 인터페이스 디자인 원칙을 안내하고, 올바른 음성 인식 엔진을 선택하는 데 도움을 줄 뿐 아니라, 음성 사용자 인터페이스 성능을 측정하는 방법을 소개하고 그것을 통해 시스템 개선을 할 수 있게 도와줄 것이다. 이 책은 제품 기획자, UX 디자이너, 음성 사용자 인터페이스 디자이너들에게 고급 디자인 설계에 대해 소개하고, 이를 통해 음성 사용자 인터페이스를 실용적일 뿐만 아니라 훌륭하게 설계할 수 있도록 도울 것이다.

지은이 소개

캐시 펄(Cathy Pearl)

센서리(Sensely) 사의 UX 책임자로, 대화형의 공감 능력을 지닌 가상 간호 아바타를 만들고 있다. 뉘앙스 사와 마이크로소프트 사에 근무할 당시 은행, 항공사, 헬스케어 회사, 포드의 싱크를 위한 VUI를 디자인했다. 볼리오(Volio)에서는 사용자가 에스콰이어 잡지의 라이프스타일 칼럼리스트에게 조언 얻기, 산타클로스와 얘기하기, 스탠드업 코미디언과 웃기 등과 같은 대화형 아이패드 앱을 만들었다.

옮긴이의 말

불과 10여 년까지만 해도 명령어를 얼마나 정확히 알고 분당 몇 단어를 타이핑할 수 있는지가 컴퓨터를 능숙하게 다루는가의 척도였다.
기기가 정한 방식에 맞춰 사람이 기기에게 익숙해져야 했던 시대가 지나고 기기가 사람을 알아보고 스스로 다가오는, 앞으로의 시대가 기대된다. 효율적인 타이핑이 줄임말과 신조어를 만들어낸 것과 같이 음성 사용자 인터페이스 시대가 가져올 우리 삶의 소소한 변화들도 궁금하다. 더불어 ‘나는 기기와 어떻게 소통하고 싶은지’에 대한 고민도 필요한 것 같다

옮긴이 소개

김명선

전자공학 및 네트워크를 공부했고 전자회사의 선행 디자인 연구소에 재직 중이다. 새로운 것을 배우고 뭔가 만드는 것을 좋아한다. 개발자로 일하면서도 새로운 것을 만드는 일에 적극적으로 나서는 한편, 다양한 분야에 도전하고자 노력하고 있다.

김선영

한국과 미국에서 산업디자인학을 전공하고 석사 졸업 후 미국 대학에서 산업디자인학과 학부생들과 대학원생들에게 제품 디자인과 그래픽 디자인을 가르치다가 현재는 한국으로 돌아와 전자회사 선행 연구소에서 고객과 트랜드 연구를 통해 신제품과 사업을 기획하는 일을 하고 있다.

목차

목차
  • 1장. 쉐이더 개발 과정
    • VUI의 역사
      • VUI의 두 번째 시대
      • 왜 음성 사용자 인터페이스인가?
        • 속도
        • 핸즈프리
        • 직관성
        • 공감
        • 공공 장소
        • 컴퓨터에게 말하는 어색함
        • 문자 메시지를 선호하는 사용자
        • 사생활 보호
    • 대화형 사용자 인터페이스
    • VUI 디자이너란?
      • 챗봇
    • 결론

  • 2장. 음성 사용자 인터페이스 기본 디자인 원칙
    • 모바일 기기 대 IVR 시스템 설계
    • 대화형 디자인
    • 사용자 기댓값 설정
    • 디자인 도구
      • 샘플 대화
      • 비주얼 목업
      • 흐름
      • 프로토타이핑 도구
    • 확인
      • 명시적 확인
      • 암시적 확인
    • 방법1: 3단계 신뢰도(Three-Tiered Confidence)
    • 방법2: 암시적 확인
    • 방법3: 비언어적 확인
    • 방법4: 일반적 확인
    • 명령 제어형 대 대화형
    • 명령 제어형
      • 대화형
    • 대화형 마커
    • 에러 처리
    • 잘못 인식된 경우
      • 에스컬레이팅 에러
    • 사용자를 비난하지 말 것
    • 초보 사용자와 전문 사용자
    • 지속적인 맥락 추적
    • 도움말 및 기타 유니버설
    • 대기
    • 명확성
    • 디자인 문서
      • 프롬프트
      • 문법/핵심 문구
    • 접근성
      • 짧게 하라
      • 더 빨리 말하라!
      • 언제든지 중단할 수 있게 하라
      • 맥락을 제공하라
    • 뭐하고 있었지?
    • 텍스트 음성 변환의 개인화
  • 다른 방식의 접근성
  • 결론

  • 3장. 페르소나 아바타, 배우 그리고 비디오 게임
    • 페르소나
    • VUI는 눈에 보여야 하는가?
    • 아바타 사용하기: 하지 말아야 할 것
    • 아바타 사용하기(또는 영상 녹화): 해야 할 것
    • 스토리텔링
    • 팀워크
    • 비디오 게임
    • UI에서는 언제 비디오를 사용해야 하는가?
    • 시각적 VUI의 모범 사례
    • 사용자들이 그들 스스로를 봐야 하는가?
    • GUI에서는 어떠해야 하는가?
    • 에러 처리하기
    • 차례대로 말하기와 끼어들기
    • 참여도 유지 및 인식의 환상
    • 시각적 피드백(아바타 제외)
    • 목소리 선택하기
    • 아바타의 장점
    • 아바타의 단점
    • 불쾌의 골짜기
    • 결론

  • 4장. 음성 인식 기술
    • 엔진 선택하기
    • 끼어들기
    • 시간 초과
      • 발화 종료 시간 초과
      • 발화 시간 제한 없음
    • 너무 말이 많은 경우
    • N-베스트 목록
    • 음성 인식의 도전 과제
    • 소음
    • 다중 스피커
    • 어린이
    • 이름, 철자, 글자와 숫자의 혼합
    • 정보 보호
    • 결론

  • 5장. 고급 음성 사용자 인터페이스 디자인
    • 음성 입력 기반 분류(Branching)
    • 제한된 응답
    • 오픈 스피치
    • 입력의 범주화(Categorization)
    • 와일드카드 및 논리적 표현
    • 명확화
    • 충분하지 않은 정보
    • 너무 많은 정보의 제공
    • 부정(否定) 처리
    • 의도와 대상 포착하기
    • 대화 관리
    • 사용자를 내버려두지 말 것
    • VUI가 인식한 것을 표시할 것인가?
    • 감성 분석과 감정 탐지
    • 문자 음성 변환과 녹음된 음성 비교
    • 발화자 인증
    • 기동어
    • 맥락
    • 고급 멀티 모달
    • 부트스트랩 데이터 세트
      • 웹 사이트 데이터
      • 콜센터 데이터
      • 데이터 수집
    • 고급 NLU
      • 데보라 다힐, 모바일 2016
    • 결론

  • 6장. 음성 사용자 인터페이스 사용자 테스트
    • VUI의 특수 고려 사항
    • 사용자 및 사용 사례에 대한 사전 조사
      • 쓸데없이 시간을 낭비하지 마라
    • 실제 사용자와 함께 연구 설계하기
      • 과제 정의(Task Definition)
      • 실험 참가자 선택하기
      • 물어볼 질문
      • 개방형 답변(문답형 질문)
      • 살펴봐야 할 사항
    • 초기 단계 테스트
      • 샘플 대화
    • 산타클로스와 얘기하세요
      • 목업
      • 오즈의 마법사 테스트
      • 위대하고 강력한 오즈
        • 문자 메시지 사용하기
        • 생략된 작업에 집중하기
        • 오류 발생시키기
        • VUI가 완성되기 전부터, GUI 테스트하기
      • WOz 테스트와 사용성 테스트의 차이점
    • 사용성 테스트
    • 다음 단계
    • 자동차, 기기, 로봇의 VUIS 테스트
      • 자동차
      • 기기와 로봇
    • 결론

  • 7장. 당신의 VUI가 완성됐다
    • 출시 전 검증
      • 대화 흐름 검증
      • 인식 검증
    • 인식 검증
      • 부하 검증
    • 성과 측정
      • 임무 완수율
      • 중도 이탈률
      • 기타 추적해야 할 항목들
      • VUI 소요 시간
      • 끼어들기
      • 음성 대 GUI
      • 잦은 시간 초과와 불일치
      • 탐색
      • 지연
      • 전체 통화 녹음
    • 정보 수집(logging)
    • 전사(轉寫)
    • 출시 단계
      • 파일럿(시범 서비스)
    • 설문
    • 분석
      • 신뢰 임곗값
      • 발화 종료 시간 초과
      • 중간 결괏값 대 최종 결괏값
      • 맞춤 사전
    • 프롬프트
    • 도구
      • 회귀 테스트
    • 결론

  • 8장. 음성 지원 기기 및 자동차
    • 기기들
      • 홈 어시스턴트
      • 스크린이 없는 기기의 VUI 설계하기
        • 짧게 유지할 것
        • 자연스럽게 유지할 것
        • 피드백을 제공할 것
        • 모호한 것을 위해 디자인할 것
        • 수정을 지원할 것
        • 시기의 중요성
        • 목록의 어려움
        • TTS(문자 음성 변환)의 제약 사항
      • 시계/밴드/이어폰
      • 다른 기기들
    • 자동차 및 자율주행차
      • 자동차 VUI의 도전 과제들
      • 자동차 안을 위한 디자인
      • 부주의 운전
      • 기기 전환
      • 인터랙션 모드
      • 자동차 결론
  • 도서 오류 신고

    도서 오류 신고

    에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

    오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

    (예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안