Comming Soon

클라우드 솔루션을 위한 생성형 AI [안전성, 확장성, 책임성을 고려한 최신 클라우드 LLM 솔루션 설계]

  • 원서명Generative AI for Cloud Solutions: Architect modern AI LLMs in secure, scalable, and ethical cloud environments (ISBN 9781835084786)
  • 지은이폴 싱, 아누라그 시리시 카루파르티
  • 옮긴이김상필, 박태호
  • ISBN : 9791194409267
  • 32,000원
  • 2025년 04월 30일 펴냄
  • 페이퍼백 | 372쪽 | 188*235mm
  • 시리즈 : 클라우드 컴퓨팅

책 소개

요약

마이크로소프트의 솔루션 아키텍트 퐁 싱과 아누라그 카루파티가 저술한 《클라우드 솔루션을 위한 생성형 AI》는 AI 기술의 기초 원리부터 실제 활용 방안, 그리고 미래 전망에 이르기까지 방대한 내용을 체계적으로 다루며 핵심적인 지침을 제공하는 책이다.

먼저 이 책은 생성형 AI와 클라우드 컴퓨팅의 통합이라는 중요한 주제로 논의를 시작하여, 대규모 언어 모델(LLM)과 트랜스포머 모델의 발전 과정을 상세히 설명한다. 이어서 미세 조정(fine-tuning) 및 검색 증강 생성(RAG)을 통해 모델 성능을 개선하는 방법과 효과적인 프롬프트 엔지니어링 기법을 구체적으로 소개하며, LLM 기반 애플리케이션의 개발, 운영, 확장 전략 및 배포 방법에 대해서도 심층적으로 탐구한다.

이러한 기술 구현 논의와 더불어, 이 책은 생성형 AI 도입 시 고려해야 할 보안 및 개인정보 보호 문제와 그 해결 방안을 제시한다. 또한 레드팀 활동, 감사, 보고와 같은 실질적인 보안 관리 개념을 다루고, AI 솔루션 개발 과정에서 책임 있는 AI 원칙 준수의 중요성을 강조하며 딥페이크 문제와 글로벌 규제 동향까지 폭넓게 살펴본다. 더 나아가, 소규모 언어 모델(SLM)의 부상, 엣지 디바이스와의 통합, 양자 컴퓨팅의 영향 등 생성형 AI의 미래 트렌드도 심도 있게 분석한다.

이렇게 다져진 이론과 전망을 바탕으로, 책은 실제적인 활용 사례와 개발 관점에 초점을 맞춘다. LLM을 활용한 텍스트 생성, 콘텐츠 제작, 가상 비서 구축 등 구체적인 적용 사례를 제시하여 독자의 이해를 돕는다. 또한 개발자 입장에서 AI 애플리케이션을 구축하고 운영 관리하는 방법, 자율 에이전트와 API를 효과적으로 활용하는 전략, 그리고 대규모 AI 애플리케이션 확장을 위한 아키텍처 설계 및 오류 처리 전략까지 상세하게 설명한다.

결론적으로 이 책은 개발자, 아키텍트, 데이터 과학자, 그리고 기획자 등 다양한 분야의 전문가들이 생성형 AI와 챗GPT에 대한 깊이 있는 이해를 갖추고, 습득한 지식을 기업이나 조직의 실무에 효과적으로 적용할 수 있도록 돕는 유용한 안내서가 될 것이다.

이 책의 대상 독자

이 책은 생성형 AI 기술의 기초 원리부터 클라우드 환경에서의 구체적인 응용 방법까지 폭넓게 다룬다. 생성형 AI에 대한 사전 지식이 거의 없거나 전혀 없는 독자도 쉽게 접근할 수 있도록 기본적인 내용부터 차근차근 설명한다.

주요 대상 독자는 솔루션 아키텍트, 클라우드 개발자, 데이터 과학자, 기술 관리자, IT 비즈니스 리더와 같은 기술 전문가이다. 이들은 이 책을 통해 효과적이고 확장 가능한 AI 솔루션 구축 전략을 배울 수 있다.

그뿐만 아니라 AI 기술을 통해 비즈니스 혁신과 가치 창출을 모색하는 기업 및 조직에게도 유용하다. 또한 챗GPT와 같은 최신 AI 트렌드에 대한 이해를 넓히고자 하는 일반 독자 역시 필요한 지식과 통찰을 얻을 수 있다.

이 책의 구성

1. 시작: 생성형 AI와 클라우드의 만남
생성형 AI와 클라우드 컴퓨팅의 통합을 소개하는 것으로 시작하여, 전체 내용을 체계적으로 설명한다.

2. 핵심 기술: 대규모 언어 모델의 이해
먼저 모델의 계층 구조를 살펴보고, 자연어 처리(NLP)의 발전 과정과 트랜스포머 모델의 등장을 포함하여 대규모 언어 모델(LLM)의 복잡한 개념을 깊이 있게 탐구한다.

3. 모델 성능 향상: 미세 조정, RAG, 프롬프트 엔지니어링
이어서 모델의 지식을 보강하고 성능을 개선하기 위한 미세조정(fine-tuning) 및 검색 증강 생성(RAG)과 같은 핵심 기술을 설명한다. 더 나아가, 원하는 결과물을 효과적으로 생성하기 위한 프롬프트 엔지니어링 기법도 소개한다.

4. 실제 적용: 개발 프레임워크와 전략
실제 애플리케이션 개발 및 배포 단계에서는 확장성, 보안, 안전성 확보의 중요성을 강조하며, 책임 있는 AI 원칙을 준수하는 개발 프레임워크와 전략을 중점적으로 다룬다.

5. 미래 전망: 생성형 AI의 다음 단계
마지막으로 생성형 AI 기술의 미래 발전 방향에 대한 전망을 제시하며 내용을 마무리한다.

저자/역자 소개

옮긴이의 말

최근 모든 기업과 산업 분야에서 생성형 AI를 기반으로 사업을 시작하는 추세입니다. 이 혁신적인 기술은 전례 없는 속도로 산업, 경제, 비즈니스, 개인에 이르기까지 사회 전반에 빠르게 확산되고 있습니다. 특히 챗GPT와 같은 강력한 대화형 챗봇의 등장으로 생성형 AI에 대한 관심과 활용도가 더욱 높아지고 있습니다. 이 책은 생성형 AI에 대한 기본적인 지식을 습득하고, AI 기술을 중심으로 성공적인 클라우드 솔루션을 구축하는 데 필요한 핵심 사항들을 다룹니다. 생성형 AI 분야는 전례 없이 빠른 속도로 발전하고 있어서 실제 업무에 적용할 경우에는 최신 자료를 다시 확인해야 합니다. 하지만 클라우드 환경에서 생성형 AI를 활용한 솔루션을 구축하는 데 필요한 모든 제반 사항을 빠짐없이 다루고 있기 때문에 꼭 한 번 일독을 권하고 싶습니다.

한국 IT 업계에 종사하는 사람으로서, 이 책을 통해 생성형 AI 기술을 체계적으로 살펴보고 깊이 있게 탐구할 수 있어 매우 즐겁게 번역할 수 있었습니다. 독자 여러분께서도 개발자, 아키텍트 또는 IT 전문가로서 이 책을 통해 저와 같은 즐거움을 느끼시기를 바랍니다.

옮긴이 소개

김상필

지난 20년 이상 한국의 엔터프라이즈 기업들과 함께 일하면서 기술적인 조언을 하고 있다. 최근 10년간은 AWS Korea 및 MongoDB Korea에서 솔루션즈 아키텍트 및 솔루션즈 아키텍트 매니저로 일하면서 퍼블릭 클라우드를 도입하고, 완전 관리형 서비스를 도입하는 여정에 도움을 주고 있다.

박태호

소프트웨어 개발과 관련된 다양한 경험을 바탕으로 서비스가 성장하면서 발생하는 문제들을 해결하는 것에 보람과 재미를 느끼며, 새로운 것을 배우고 익히는 것을 좋아한다. 넓고 다양한 분야의 지식을 탐구하고 있으며, 최근에는 AI 관련 프로젝트에서 TPM으로 일하면서 생성형 AI를 실무에 적용하는 과정을 함께하고 있다.

지은이 소개

폴 싱Paul Singh

현재 마이크로소프트에서 수석 클라우드 솔루션 아키텍트(CSA, Cloud Solution Architect)로서 10년 넘게 근무하고 있다. 처음 CSA 역할이 만들어졌을 때 10명 중 한 명으로 선발된 폴은 그 이후로 국가채용위원회에 참여하고, 최초의 Azure 아키텍처 시험을 만드는 데 도움을 주는 등 이 역할을 형성하는 데 기여해 왔다. 그 과정에서 많은 영예와 상을 받았으며, 30개 이상의 다양한 기술 자격증을 취득하고 복잡한 시나리오와 솔루션으로 대형 클라우드 고객들을 지원하기도 했다.

아누라그 시리시 카루파르티Anurag Sirish Karuparti

마이크로소프트 Azure에서 AI를 전문으로 하는 시니어 클라우드 솔루션 아키텍트다. 시러큐스 대학교에서 정보 관리(데이터 과학) 석사 학위를 받았으며 컴퓨터 공학에 대한 배경 지식을 갖고 있다. 업계에서 10년 이상의 경력을 쌓은 뒤 클라우드, 데이터 및 고급 분석 분야에서 신뢰할 수 있는 전문가로 자리 잡았다. 여러 개의 Azure 자격증을 보유하고 있으며 주요 클라우드 플랫폼에서 인증을 취득했다. 경력 전반에 걸쳐 AI의 힘을 활용해 혁신을 주도하고 비즈니스를 변화시키는 최신 솔루션을 성공적으로 설계하고 구현해 왔다. 마이크로소프트에 입사하기 전에는 EY 및 PwC와 같은 컨설팅 회사의 신규 기술 분야에서 매니저로 일하며 많은 경험을 쌓았다.

목차

목차
  • [1부] 클라우드의 힘과 언어 혁신의 통합

  • 1장. 클라우드 컴퓨팅과 생성형 AI의 만남: 무한한 가능성의 연결
  • 대화형 AI의 진화
    • 대화형 AI란 무엇인가?
    • 대화형 AI의 진화
  • 생성형 AI 소개
    • 2022-23년 생성형 AI의 부상
    • 기초 모델
    • LLM
    • LLM의 핵심 속성
    • 생성형 AI, 기초 모델, LLM 간의 관계
  • 자세히 살펴보기 - 오픈 소스 대 폐쇄 소스/독점 모델
  • 인기 모델, 작업 및 비즈니스 애플리케이션
    • 텍스트
    • 이미지
    • 오디오
    • 비디오
  • 확장성, 비용 최적화 및 보안을 위한 클라우드 컴퓨팅
  • 비전에서 가치로 - 프로덕션으로 가는 여정 탐색하기
  • 요약
  • 참고 자료

  • 2장. NLP의 진화와 트랜스포머: NLP와 LLM 살펴보기
  • NLP의 진화와 트랜스포머의 부상
    • RNN과 CNN의 주요 단점
    • NLP와 LLM에서 생성형 AI의 강점
    • 트랜스포머는 어떻게 작동하나?
    • 트랜스포머의 장점
    • 대화 프롬프트 및 완료 - 내부
  • 프롬프트 및 완료 흐름 간소화
  • LLM의 현재, 진행 상황 및 확장
    • 트랜스포머 아키텍처의 환경 살펴보기
    • AutoGen
  • 요약
  • 참고 자료

  • [2부] LLM 맞춤화를 위한 기술

  • 3장. 미세 조정: 도메인별 LLM 애플리케이션 구축하기
  • 미세 조정이란 무엇이며 왜 중요한가?
    • 애플리케이션 미세 조정
    • 사전 교육 및 미세 조정 프로세스 살펴보기
  • 모델 미세 조정을 위한 기술
    • 전체 미세 조정
    • PEFT
  • RLHF - 모델을 사용자의 가치에 맞추기
  • 미세 조정된 모델 성능을 평가하는 방법
    • 평가 지표
    • 벤치마크
  • 미세 조정 성공의 실제 사례
    • InstructGPT
  • 요약
  • 참고 자료

  • 4장. RAG를 풍부하게: 외부 데이터로 AI 수준 높이기
  • 벡터 DB 필수 요소에 대한 심층 분석
    • 벡터 및 벡터 임베딩
    • 벡터 검색 전략
    • HNSW와 FAISS를 사용해야 하는 경우
    • 기사 추천 시스템
  • 벡터 스토어
    • 벡터 DB란 무엇인가
    • 벡터 DB 제한 사항
    • 벡터 라이브러리
    • 벡터 DB와 기존 데이터베이스 - 주요 차이점 이해
    • 벡터 DB 예제 시나리오 - 벡터 DB를 활용한 음악 추천 시스템
  • 일반적인 벡터 DB 애플리케이션
  • RAG에서 벡터 DB의 역할
    • 첫째, 큰 질문 – 왜?
    • RAG란 무엇이며, LLM에 어떻게 도움이 될까?
    • 벡터 DB의 중요한 역할
  • RAG의 비즈니스 애플리케이션
  • 청킹 전략
    • 청킹이란 무엇인가?
    • 청킹이 필요한 이유?
    • 인기 있는 청킹 전략
    • 청킹 고려 사항
  • Azure Prompt Flow를 사용한 RAG 평가
  • 사례 연구 - 다국적 기업의 글로벌 채팅 애플리케이션 배포
  • 요약
  • 참고 자료

  • 5장. 효과적인 프롬프트 엔지니어링 기법: AI를 통한 지혜의 발견
  • 프롬프트 엔지니어링의 필수 요소
    • 챗GPT 프롬프트 및 완료
    • 토큰
  • 프롬프트 엔지니어링이란 무엇인가?
    • 좋은 프롬프트 디자인의 요소
    • 프롬프트 파라미터
    • 챗GPT 역할
  • 효과적인 프롬프트 엔지니어링을 위한 기술
    • N샷 프롬프트
    • 생각의 사슬 프롬프트
    • 프로그램 지원 언어 모델
    • 프롬프트 엔지니어링 모범 사례
    • 추가 팁과 요령
  • 프롬프트 엔지니어링을 위한 윤리적 지침
  • 요약
  • 참고 자료

  • [3부] 생성형 AI 애플리케이션의 개발, 운영, 확장

  • 6장. LLM 기반 앱 개발 및 운영하기: 개발 프레임워크 및 LLMOps 살펴보기
  • 코파일럿 및 에이전트
  • 생성형 AI 애플리케이션 개발 프레임워크
    • 시맨틱 커널
    • LangChain
    • LlamaIndex
  • 자율 에이전트
  • 에이전트 협업 프레임워크
    • Autogen
    • TaskWeaver
    • AutoGPT
  • LLMOps - 프로덕션 환경에서 LLM 앱 운영하기
    • LLMOps란 무엇인가?
    • LLMOps가 필요한 이유는?
    • LLM 수명 주기 관리
    • LLMOps의 필수 구성 요소
    • LLMOps의 이점
    • MLOps와 LLMOps 비교
    • 플랫폼 - LLMOps에 Prompt Flow 사용
    • 모든 것을 종합하기
    • LLMOps - 사례 연구 및 모범 사례
  • 요약
  • 참고 자료

  • 7장. 클라우드에 챗GPT 배포하기: 아키텍처 설계 및 확장 전략
  • 제한 사항 이해
  • 클라우드 확장 및 디자인 패턴
    • 스케일링이란 무엇인가?
    • TPM, RPM, PTU 이해
    • 디자인 패턴 확장
    • 지수 백오프를 사용한 재시도 - 특별한 확장 기법
    • Azure APIM의 속도 제한 정책
  • 모니터링, 로깅, HTTP 응답 코드
    • 모니터링 및 로깅
    • HTTP 응답 코드
  • 비용, 교육, 지원
    • 비용
    • 교육
    • 지원
  • 요약
  • 참고 자료

  • [4부] 안전하고 보안성 있는 AI 구축 - 보안 및 윤리적 고려 사항

  • 8장. 생성형 AI를 위한 보안 및 개인 정보 보호 고려 사항: 안전한 구축 및 보안 LLM
  • 생성형 AI의 보안 위험 이해 및 완화
  • 새로운 보안 위협 - 공격 벡터와 향후 과제 살펴보기
    • DoS 모델
    • 탈옥 및 프롬프트 주입
    • 학습 데이터 오염
    • 안전하지 않은 플러그인(어시스턴트) 디자인
    • 안전하지 않은 출력 처리
  • 조직에서 보안 제어 적용하기
    • 콘텐츠 필터링
    • 관리되는 ID
    • 키 관리 시스템
  • 개인 정보 보호란 무엇인가?
    • 클라우드에서의 개인 정보 보호
  • 생성형 AI 시대의 데이터 보안
  • 레드 팀 구성, 감사, 보고
    • 감사
    • 보고
  • 요약
  • 참고 자료

  • 9장. AI 솔루션의 책임 있는 개발: 정직성과 배려로 구축하기
  • RAI 설계 이해
    • RAI란 무엇인가?
  • RAI의 핵심 원칙
    • 윤리적이고 설명 가능한
    • 공정성 및 포용성
    • 신뢰성 및 안전성
    • 투명성
    • 개인 정보 보호 및 보안
    • 책임
  • RAI 원칙으로 LLM 과제 해결
    • 지적 재산권 문제(투명성 및 책임)
    • 환각(신뢰성 및 안전성)
    • 유해성(공정성 및 포용성)
  • 증가하는 딥페이크 우려
    • 딥페이크란 무엇인가?
    • 딥페이크의 실제 사례
    • 사회에 미치는 악영향
    • 딥페이크 식별 방법
    • 완화 전략
  • RAI 우선 접근 방식을 사용한 애플리케이션 구축
    • 아이디어 발굴/탐색 루프
    • 구축/확장 루프
    • 운영화/배포 루프
    • AI 아키텍트의 역할과 리더십
  • AI, 클라우드, 법률 - 규정 준수 및 규제 이해
    • 규정 준수 고려 사항
    • 글로벌 및 미국 AI 규제 환경
    • AI에 관한 바이든 행정명령
  • RAI의 스타트업 생태계
  • 요약
  • 참고 자료

  • [5부] 생성형 AI - 다음 단계는?

  • 10장 생성형 AI의 미래: 트렌드와 새로운 사용 사례
  • 멀티모달 상호 작용의 시대
    • GPT-4V와 그 이상 - 이 LMM에 대해 자세히 알아보기
    • 비디오 이해를 위한 비디오 프롬프트
    • 비디오 생성 모델 - 먼 꿈일까?
    • AI가 냄새를 맡을 수 있는가?
  • 산업별 생성형 AI 애플리케이션
  • SLM의 부상
  • 지능형 에지 디바이스와 생성형 AI 통합
  • 새로운 트렌드와 2024-2025년 예측
  • 양자 컴퓨팅에서 AGI까지 - 챗GPT의 미래
    • AGI란 무엇인가?
    • 양자 컴퓨팅 및 AI
    • AGI가 사회에 미치는 영향
  • 요약
  • 참고 자료

도서 오류 신고

도서 오류 신고

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안