Top

R 데이터 구조와 알고리즘 [효율적인 데이터 구조와 알고리즘으로 애플리케이션의 속도와 성능을 높이자]

  • 원서명R Data Structures and Algorithms (ISBN 9781786465153)
  • 지은이PKS 프라카시(PKS Prakash), 아슈튜니 스리 크리슈나 라오(Achyutuni Sri Krishna Rao)
  • 옮긴이김우현
  • ISBN : 9791161750200
  • 30,000원
  • 2017년 07월 07일 펴냄
  • 페이퍼백 | 316쪽 | 188*235mm
  • 시리즈 : acorn+PACKT

책 소개

소스 코드 파일은 여기에서 내려 받으실 수 있습니다.

본문에 쓰인 컬러 이미지는 여기에서 내려 받으세요.

요약

아홉 가지 정렬 알고리즘의 장단점, 스택과 큐를 배열로 구현했을 때와 링크드 리스트로 구현했을 때의 차이점 등을 R 사용자들이 쉽게 이해할 수 있도록 설명한다. 여러 가지 인덱싱 구조와 함께 최신 기술인 그래프 데이터 구조를 다루며, 현대적인 프로그래밍 기법인 무작위 알고리즘과 함수형 데이터 구조에 대해서도 설명한다. R 사용자가 아니더라도 다양한 알고리즘과 데이터 구조의 상호작용에 대해 관심이 있다면 이 책을 통해 쉽게 접근할 수 있을 것이다.

이 책에서 다루는 내용

■ 데이터 구조와 알고리즘의 합리성 이해
■ 프로그램의 연산 능력을 특징짓는 알고리즘의 점근 분석 및 경험적 분석 이해
■ 배열 기반 및 링크드 리스트 기반 데이터 구조의 기초 지식
■ 정렬 알고리즘 분석
■ 해싱과 검색 알고리즘
■ 선형 인덱싱 및 트리 기반 인덱싱 이해
■ 위상 정렬, 최단 거리 문제, 그리고 프림 알고리즘을 포함한 그래프 구현
■ 동적 계획법(배낭 문제)과 무작위 알고리즘 이해

이 책의 대상 독자

이 책은 데이터 구조를 효율적으로 사용하고자 하는 R 개발자를 위한 것이다. R에 대한 기본 지식을 알고 있어야 한다.

이 책의 구성

1장, ‘시작하기’에서는 R 기초 수립에 중요한 데이터 구조 관련 배경 지식과 그 중요성을 알아본다.
2장, ‘알고리즘 분석’에서는 알고리즘 분석을 위한 동기 부여, 기본 표기법, 기초적인 기법에 대해 설명한다.
3장, ‘링크드 리스트’에서는 링크드 리스트의 기초를 세우고, 선형 링크드 리스트, 이중 링크드 리스트, 원형 링크드 리스트 등과 같은 링크드 리스트의 다양한 형태를 알아본다.
4장, ‘스택과 큐’에서는 배열과 링크드 리스트 기반의 스택과 큐를 소개하고 R에서 구현해본다.
5장, ‘정렬 알고리즘’에서는 삽입 정렬, 버블 정렬, 선택 정렬, 쉘 정렬 등 다양한 정렬 알고리즘에 대해 설명하고, 서로 다른 알고리즘을 비교해서 보여준다.
6장, ‘검색 옵션 탐색’에서는 벡터 및 링크드 리스트를 포함한 리스트에 대한 검색 처리에 대해 상세히 알아본다. 또한, 자기조직화 리스트와 해시 개념도 살펴본다.
7장, ‘인덱싱’에서는 디스크에서 파일을 구조화하고 대용량의 데이터를 체계화하는 데 핵심적인 인덱싱 개념을 설명한다. ISAM, 2-3 트리, B-트리, B+ 트리 등을 자세히 살펴본다.
8장, ‘그래프’에서는 그래프 데이터 구조 및 구현을 위한 기초를 정립한다. 또한, 순회, 최단 경로 문제, 최소 비용 신장 트리 알고리즘에 대해서도 알아본다.
9장, ‘프로그래밍과 무작위 알고리즘’에서는 정적인 데이터 구조에서 무작위 스킵 리스트와 같은 무작위 데이터 구조로 개념을 확장해 살펴본다. 또한, 프로그래밍 개념과 여러 가지 애플리케이션을 학습한다.
10장, ‘함수형 데이터 구조’에서는 함수형 데이터 구조와 지연된 평가에 대해 소개한다. 그리고 R에서 함수형 스택과 함수형 큐를 다룬다.

저자/역자 소개

지은이의 말

데이터 구조는 특정 데이터를 효율적으로 체계화하고 처리하는 방식을 나타낸다. 데이터 구조는 문제 해결에 매우 중요하며, 재사용 가능한 코드를 작성할 수 있는 완벽한 솔루션을 제공한다. 이 책은 분석 및 인텔리전스 분야에서 일하고 있는 R 사용자들이 데이터 구조에 대한 역량을 강화하는 것에 목적을 두고 있다. R은 벨 연구소(예전에는 AT&T, 지금은 루슨트 테크놀러지)에서 개발한 것으로, 통계적인 처리와 시각화를 위해 매우 잘 설계된 언어이자 개발 환경이다. 이 책은 독자들이 알고리즘의 계산 효율성과 자원 사용 관점에서 최적화된 알고리즘을 설계할 수 있게 해줄 것이다. 먼저 여러 가지 데이터 구조와 알고리즘과의 관계를 설명하고, 알고리즘 분석과 평가에 대해 논의한 후, 알고리즘을 작성하는 프로세스를 학습한다. 그리고 고전적인 데이터 구조뿐만 아니라 함수형 데이터 구조의 통합성을 이해할 수 있게 설명한다. 리스트, 스택, 큐, 딕셔너리와 같은 데이터 구조의 기초와 함께 인덱싱, 정렬, 검색까지 더 깊은 주제도 다룬다. 또한, 그래프, 동적 계획법, 무작위 알고리즘과 같은 주제도 이야기한다. 이 책의 목표는 R을 사용한 데이터 구조의 개념을 수립하는 것이다.

지은이 소개

PKS 프라카시(PKS Prakash)

미국 위스콘신 매디슨(Wisconsin-Madison) 대학에서 산업 및 시스템 엔지니어링으로 박사 학위를 받았다. 그리고 영국 워릭(Warwick) 대학교에서 두 번째 공학 박사 학위를 받았다. 헬스케어, 제조업, 제약업, 전자상거래 분야 등 다양한 영역의 선두 기업에서 비즈니스와 관련된 예측 모델링, 가상 계측, 예방적인 유지보수, 근본 원인 분석, 프로세스 시뮬레이션, 사기 탐지, 조기 경보 시스템 구축 등의 업무에서 데이터 과학자로 일해 왔다. 현재 Dream11 기업에서 부사장 및 실무 책임자로 일하고 있다. Dream11은 세계에서 가장 큰 판타지인 크리켓, 축구, 카바디 게임을 제공하는 기업이다. 제조업과 헬스케어 분야에서 경영 효율성 향상을 위한 연구 및 관리, 소프트웨어 도구, 고급 알고리즘에 대한 글을 IEEE-Trans, EJOR, IJPR 같은 주요 저널에 폭넓게 기고했다. 『Evolutionary Computing in Advanced Manufacturing』에서 한 개 장을 쓴 공동 저자이며, ‘Intelligent Approaches to Complex Systems’을 편집했다.

아슈튜니 스리 크리슈나 라오(Achyutuni Sri Krishna Rao)

싱가포르의 국립 대학에서 기업 비즈니스 분석(데이터 과학)으로 석사 학위를 받았다. 데이터 과학자로서 제조업, 헬스케어 및 제약업 분야에서 일했다. R의 열렬한 지지자이며, 오픈소스 커뮤니티에서 활발히 활동 중이다. 프리랜서며, 기술 블로그(http://rcodeeasy.blogspot.com) 운영과 마라톤을 열정적으로 한다. 현재 선두적인 컨설팅 회사에서 데이터 과학 컨설턴트로 활동하고 있다.

옮긴이의 말

알고리즘과 데이터 구조를 명확히 알고 이 둘을 조화롭게 사용하면 애플리케이션의 속도와 성능을 향상시킬 수 있다. 알고리즘을 처음 대하는 사람이라도 이 책을 통해 기초적인 알고리즘 분석 기법을 이해할 수 있으며, 어떤 알고리즘의 성능이 좋고 나쁜지 판단할 수 있게 될 것이다.
그 뒤에 이어지는 링크드 리스트와 스택, 큐를 다루는 부분은 조금 어려울 수도 있지만, 개발자들이 매우 많이 사용하는 데이터 구조이기 때문에 익숙한 부분도 많을 것이다.
이 책에서 핵심적인 부분은 정렬 알고리즘, 검색과 인덱싱, 그래프 알고리즘을 다루고 있는 5장부터 8장까지라고 생각된다. 많이 사용하는 아홉 가지 정렬 알고리즘을 그림으로 알기 쉽게 보여주고 있으며, 그 동작 원리와 성능의 장단점을 자세히 설명하고 있다.
또한, 관계형 데이터베이스에서 주로 사용하는 인덱싱의 개념이 어떻게 발전해 현재까지 오게 되었는지 알 수 있다. 최근 들어 더 중요해지고 있는 그래프 데이터 구조에 대한 내용도 상당히 유용할 것이다.
각 알고리즘과 데이터 구조에 대해 이 책에서는 R 코드로 예제를 실행해 볼 수 있지만, 굳이 일일이 실행해 보지 않아도 전체적인 내용을 이해하는 데 어려움은 없을 것이다. 또한, R 언어를 모르는 사람이라도 코드 이외의 부분만 읽어보면 핵심적인 내용을 충분히 배울 수 있다.

옮긴이 소개

김우현

대학생 시절 선배와 함께 창업을 한 후 20년 가까이 소프트웨어 개발자로 살아오다가 데이터 분석 분야에서 인생 후반기를 위한 새로운 길을 만들어 가고 있다. 현재 국민대학교 경영대학원에서 빅데이터 MBA 과정에 재학 중이며, 숙명여자대학교 나노/바이오 전산화학 연구센터에서 머신 러닝 연구원으로 일하고 있다.

목차

목차
  • 1장. 시작하기
    • 데이터 구조 소개
    • 추상 데이터 타입과 데이터 구조
    • 문제와 알고리즘과의 관계
    • R 기초
      • R 설치
      • R의 기본 데이터 구조
      • R의 연산자
      • R의 제어문
        • If 조건문
        • If...else 조건문
        • Ifelse 함수
        • for 루프
        • 중첩 for 루프
        • While 루프
        • 루프 내에서 사용하는 특수한 명령문
        • 반복 루프
    • R의 1등급 함수
    • 연습문제
    • 요약

  • 2장. 알고리즘 분석
    • 데이터 구조로 시작하기
    • R에서의 메모리 관리
      • R에서의 시스템 런타임
      • 최선, 최악, 평균적인 경우
      • 컴퓨터 vs. 알고리즘
      • 알고리즘 점근 분석
        • 상한 또는 빅 오 표기법
        • 하한 또는 빅 오메가 표기법
        • 빅 세타 표기법
        • 단순화 규칙
        • 분류 규칙
      • 프로그램의 계산능력 추정
        • 요소 1 - 할당 연산자
        • 요소 2 - 단순 루프
        • 요소 3 - 복잡한 루프
        • 요소 4 - 조건문을 가진 루프
        • 요소 5 - 재귀 명령문
      • 문제 분석
      • 공간 한계
    • 연습문제
    • 요약

  • 3장. 링크드 리스트
    • R의 데이터 타입
      • 벡터와 원자 벡터
      • 요소 데이터 타입
        • 팩터
        • 매트릭스
        • 배열
        • 데이터 프레임
        • 리스트
    • R에서의 객체지향 프로그래밍
    • 링크드 리스트
      • 선형 링크드 리스트
      • 이중 링크드 리스트
      • 원형 링크드 리스트
    • 배열 기반 리스트
    • 리스트 작업 분석
    • 연습문제
    • 요약

  • 4장. 스택과 큐
    • 스택
      • 배열 기반 스택
      • 링크드 스택
      • 배열 기반 스택과 링크드 리스트 기반 스택 비교
      • 재귀 함수 구현
      • 배열 기반 큐
      • 링크드 큐
      • 배열 기반 큐와 링크드 리스트 기반 큐 비교
    • 딕셔너리
    • 연습문제
    • 요약

  • 5장. 정렬 알고리즘
    • 정렬 관련 용어와 표기법
    • 세 가지 Θ(n²) 정렬 알고리즘
      • 삽입 정렬
      • 버블 정렬
      • 선택 정렬
      • 교환 정렬의 비용
    • 셸 정렬
    • 병합 정렬
    • 퀵 정렬
    • 힙 정렬
    • 버킷 정렬과 기수 정렬
    • 정렬 알고리즘의 경험적인 비교
    • 정렬의 하한
    • 연습문제
    • 요약

  • 6장. 검색 옵션 탐색
    • 정렬되지 않은 벡터와 정렬된 벡터에 대한 검색
    • 자기조직화 리스트
      • 휴리스틱 1 - 카운트
      • 휴리스틱 2 - 전진이동
      • 휴리스틱 3 - 전치
    • 해싱
      • 해시 함수
      • 오픈 해싱
      • 클로즈드 해싱
        • 버킷 해싱
        • 선형 탐사
      • 클로즈드 해싱 분석
      • 삭제
    • 연습문제
    • 요약

  • 7장. 인덱싱
    • 선형 인덱싱
    • ISAM
    • 트리 기반 인덱싱
    • 2-3 트리
    • B-트리
      • B+ 트리
      • B-트리 분석
    • 연습문제
    • 요약

  • 8장. 그래프
    • 용어와 표현들
    • 그래프 구현
    • 그래프 순회
      • 깊이 우선 탐색
      • 너비 우선 탐색
      • 위상 정렬
    • 최단 경로 문제
      • 단일 소스 최단 경로
    • 최소 비용 신장 트리
      • 프림 알고리즘
      • 크루스칼 알고리즘
    • 연습문제
    • 요약

  • 9장. 프로그래밍과 무작위 알고리즘
    • 동적 계획법
      • 배낭 문제
      • 모든 쌍 최단 경로
    • 무작위 알고리즘
      • 큰 값을 찾기 위한 무작위 알고리즘
      • 스킵 리스트
      • 스킵 리스트의 확률론적 분석
    • 연습문제
    • 요약

  • 10장. 함수형 데이터 구조
    • 함수형 데이터 구조
      • 지연된 평가
      • 함수형 스택
      • 함수형 큐
        • 빠른 완전 지속성 큐
        • 느린 지속성 큐와 양방향 큐
    • 요약

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안