파이썬 AI 애플리케이션 개발 [LLM과 벡터 데이터베이스로 구현하는 맞춤형 지능형 서비스]

원서명Building AI Intensive Python Applications: Create intelligent apps with LLMs and vector databases (ISBN 9781836207252)
지은이라셸 파머(Rachelle Palmer), 벤 펄머터(Ben Perlmutter), 아쉬윈 강가다르(Ashwin Gangadhar), 니콜라스 라루(Nicholas Larew), 시그프리도 나르바에스(Sigfrido Narváez), 토마스 뤼크슈티스(Thomas Rueckstiess), 헨리 웰러(Henry Weller), 리치먼드 알라케(Richmond Alake), 슈밤 란잔(Shubham Ranjan)
옮긴이테크 트랜스 그룹 T4
감수자아레크 보루츠키(Arek Borucki), 크리스 부시(Chris Bush), 콜린 데이(Colleen Day), 로뱅 타코네(Robin Taconet)

ISBN : 9791194409502
33,000원 (eBook 25,600원)
2025년 12월 26일 펴냄
페이퍼백 | 396쪽 | 188*235mm
시리즈 : 데이터 과학

판매처

교보문고 YES24 알라딘

eBook 판매처

교보문고 리디북스 알라딘 YES24

책 소개
저자/역자 소개
목차
관련 블로그 글
도서 오류 신고

책 소개

소스 코드 안내

이 책의 소스 코드는 에이콘출판사 공식 깃허브에서 제공합니다. 아래 링크에서 다운로드할 수 있습니다.
https://github.com/AcornPublishing/9791194409502

책 소개

"LLM API만 연동하면 끝일까? 진짜 문제는 그다음부터 시작된다."
MongoDB에서 AI와 벡터 검색을 직접 만들고 운영하는 전문가 9명이 전하는 실전 노하우

ChatGPT가 세상을 바꾸고 있다는 건 누구나 안다. 덕분에 너도나도 LLM API를 자사 서비스에 도입하기 시작했다. 그런데 막상 출시하고 나면 뭔가 이상하다. 분명 똑같은 LLM을 쓰는데, 왜 우리 서비스에서는 엉뚱한 답변이 나오고, 없는 정보를 지어내고, 예상치 못한 오류가 발생하는 걸까?

API를 호출하는 건 어렵지 않다. 하지만 그것만으로 실제 서비스에 투입할 수 있는 AI 애플리케이션을 만들 수 있다고 생각한다면, 조만간 한계에 부딪히게 될 것이다. 이 책은 바로 그 한계를 넘는 방법을 알려준다.

이 책의 강점은 저자진에 있다. MongoDB 머신러닝 연구 그룹을 이끄는 토마스 뤼크슈티스, 아틀라스 벡터 검색을 총괄하는 헨리 웰러, 매주 수천 명이 사용하는 MongoDB AI 챗봇을 직접 구축한 벤 펄머터와 니콜라스 라루 등 MongoDB에서 AI와 벡터 검색을 실제로 만들고 운영하는 전문가 9명이 함께 집필했다. 이론이 아닌, 실제 서비스 현장에서 검증된 노하우가 담겨 있다.

Python 기초 지식만 있으면 충분하다. 생성형 AI 시대에 단순한 API 사용자를 넘어, AI 애플리케이션의 구조를 이해하고 직접 구축할 수 있는 개발자로 성장하고 싶다면 이 책에서 시작해보자.

내용 소개

AI 애플리케이션을 만드는 모범 사례와 실전 기술 완전 정복

이 책은 LLM, 벡터 데이터베이스, 파이썬 프레임워크로 구성된 생성형 AI 스택의 작동 원리를 처음부터 끝까지 설명한다. 단순히 개념을 나열하는 데 그치지 않고, 각 기술이 실제 애플리케이션에서 어떻게 맞물려 돌아가는지를 보여준다.

데이터를 어떻게 준비해야 하는지, 어떤 모델을 선택해야 하는지, 미세 조정은 어떻게 해야 하는지 등 현장에서 바로 적용할 수 있는 모범 사례를 익힌다. 환각 현상이나 데이터 유출 같은 골치 아픈 문제를 해결하기 위해 검색 증강 생성(RAG)을 MongoDB Atlas와 함께 구현하는 방법도 단계별로 안내한다.

무엇보다 이 책은 많은 입문서가 다루지 않는 영역까지 파고든다. LLM이 내놓은 결과를 어떻게 평가해야 하는지, AI 오류는 어떻게 진단하고 수정하는지, 성능은 어떻게 최적화하는지를 구체적으로 설명한다. 이 부분을 알아야 실제 서비스에서 안정적으로 작동하는 AI 애플리케이션을 만들 수 있다.

이 책을 읽고 나면 실제 가치를 제공하는 AI 애플리케이션을 직접 구축할 역량을 갖추게 될 것이다.

이 책에서 다루는 내용

• LLM, 벡터 데이터베이스, 파이썬 프레임워크로 구성된 생성형 AI 스택의 구조와 작동 원리
• 벡터 데이터베이스의 역할과 AI 애플리케이션 성능 향상을 위한 활용법
• MongoDB Atlas를 활용한 벡터 검색과 RAG 구현
• LLM 출력 품질을 측정하고 개선하는 평가 방법
• 환각, 데이터 유출 등 자주 발생하는 문제와 해결 전략

도서 소개 영상

저자/역자 소개

지은이 소개

라셸 파머^{Rachelle Palmer}
MongoDB의 개발자 데이터베이스 경험(Developer Database Experience)과 개발자 교육(Developer Education) 부문의 제품 리더이며 드라이버 클라이언트 라이브러리, 문서, 프레임워크 통합, MongoDB 대학(MongoDB University)을 감독한다. 자바, PHP, Rust, 파이썬, Node.js, 루비(Ruby)로 MongoDB용 샘플 애플리케이션을 구축했다. 2013년 MongoDB에 합류했으며, 이전에는 기술 서비스 엔지니어링 팀의 이사로서 MongoDB 아틀라스(MongoDB Atlas)에 각종 지원과 클라우드 운영(CloudOps)을 제공하는 팀을 구성하고 관리했다.

벤 펄머터^{Ben Perlmutter}
MongoDB 교육 AI 팀의 책임 엔지니어이며 LLM, 임베딩 모델, 벡터 데이터베이스 등의 AI 기술을 사용해 MongoDB 교육 경험을 개선했다. 그의 팀은 MongoDB AI 챗봇을 구축해 검색 증강 생성을 사용함으로써 매주 수천 명의 사용자가 MongoDB를 배울 수 있도록 지원한다. 이전에는 기술 중심 문서를 작성하는 데 특화된 테크니컬 라이터로 일했다.

아쉬윈 강가다르^{Ashwin Gangadhar}
전자상거래, HR 분석, 재무에 관한 데이터 기반 솔루션 분야에서 10년 이상의 경험을 쌓아온 MongoDB의 책임 솔루션 아키텍트다. 제어와 신호 처리 석사 학위를 보유하고 있으며 검색 관련성, 컴퓨터 비전, NLP를 전문으로 한다. 또한 학습에 대한 지속적인 열정을 바탕으로 새로운 기술과 혁신 솔루션을 탐구하고 있다. 인도 벵갈루루에서 태어나고 자랐으며 여행, 요리를 통한 문화 탐구, 기타 연주를 즐긴다.

니콜라스 라루^{Nicholas Larew}
MongoDB의 교육 AI 팀에 몸담고 있는 책임 엔지니어다. MongoDB의 AI 챗봇과 챗봇 기능을 강화하는 오픈소스 프레임워크를 개발하고 있으며 MongoDB의 콘텐츠 생성과 데이터 세트 큐레이션 작업을 담당한다. AI와 관련해 일하기 전에는 문서를 작성하고 유지 관리하는 일을 했으며, MongoDB 제품 개발자의 샘플 애플리케이션을 유지 보수했다.

시그프리도 나르바에스^{Sigfrido Narváez}
MongoDB의 수석 솔루션 아키텍트로서 AI 프로젝트, 데이터베이스 마이그레이션, 애플리케이션 현대화를 담당했다. 그의 고객은 엔터테인먼트, 게임, 금융 등의 분야에서 미국과 라틴 아메리카 전역에 걸쳐 있다. 2015년 ‘MongoDB 마스터’로 선정된 바 있으며 GDC, QCon, re:Invent 콘퍼런스에서 MongoDB 아틀라스와 선도적인 AI 기술을 사용해 파이썬과 다른 언어로 구축한 샘플 앱을 공유했다.

토마스 뤼크슈티스^{Thomas Rueckstiess}
MongoDB의 책임 과학자이자 머신러닝 연구 그룹 책임자다. 신경망과 강화 학습, 트랜스 포머, 정형 데이터 모델링(structured data modeling)을 전문으로 하는 머신러닝 박사 학위를 갖고 있다. 2012년 MongoDB에 입사했으며, 이전에는 MongoDB 컴파스(MongoDB Compass)와 아틀라스 차트(Atlas Charts)의 수석 엔지니어였다.

헨리 웰러^{Henry Weller}
아틀라스 벡터 검색(Atlas Vector Search)의 전담 제품 관리자로, 쿼리 기능과 서비스의 확장성을 담당하고 사용자를 위한 모범 사례를 개발하는 데 주력하고 있다. 아틀라스 벡터 검색을 2023년에 공개 평가판에서 일반 제품으로 전환해 출시하는 데 기여했고, 서비스의 핵심 기능 제공을 계속 주도하고 있다. 2022년 MongoDB에 합류했으며, 이전에는 데이터 엔지니어이자 백엔드 로보틱스 소프트웨어 엔지니어였다.

리치먼드 알라케^{Richmond Alake}
MongoDB의 AI/ML 개발자 애드버케이트(Developer Advocate)로, AI 애플리케이션 구축 개발자를 위한 기술 학습 콘텐츠를 제작했다. 머신러닝 아키텍처, 데이터 파이프라인 최적화, 딥러닝을 통한 모바일 경험 개발 등을 아우르는 기술적 배경 및 경험을 갖고 있다. GenAI와 컴퓨터 비전을 전문으로 하며, AI 도메인 전반에 걸친 실용적인 애플리케이션과 효율적인 구현에 중점을 둔다. 또한 개발자에게 AI 솔루션 모범 사례도 가이드하고 있다.

슈밤 란잔^{Shubham Ranjan}
MongoDB 파이썬 버전의 제품 관리자이자 MongoDB의 AI 이니셔티브에 기여하는 핵심 멤버다. 파이썬 개발자이며, 데이터 과학과 머신러닝에서 경쟁 프로그래밍에 이르기까지 다양한 주제를 다루는 700개 이상의 기술 문서를 게시했다. 2019년 MongoDB에 합류한 이후 소프트웨어 엔지니어를 거쳐 여러 제품의 제품 관리자로 승진하면서 여러 역할을 수행했다.

옮긴이 소개

테크 트랜스 그룹 T4
최신 IT 테크놀로지에 대한 리서치를 목적으로 하는 스터디 그룹이다. 엔터프라이즈 환경에서 오픈소스를 활용한 프레임워크 구축에 관심이 많으며 알고리듬, 양자 컴퓨팅, OpenCV, 머신러닝 등의 기술에 주목하고 있다. 또한 다양한 오픈소스 기반 플랫폼의 개발 및 활용에 많은 관심을 갖고 있다. 역서로는 『그래프 알고리즘』(에이콘, 2021), 『OpenCV 4 마스터 3/e』(에이콘, 2020), 『양자 컴퓨팅 발전과 전망』(에이콘, 2020) 등이 있다.

1장. GenAI 시작하기
기술적 요구 사항
용어 정의
GenAI 스택
____파이썬과 GenAI
____OpenAI API
____벡터 검색을 사용한 MongoDB
GenAI의 중요 기능
____왜 GenAI를 사용하는가?
____GenAI의 윤리와 위험
요약
2장. 지능형 애플리케이션의 블록 구축
기술적 요구 사항
지능형 애플리케이션 정의
____지능형 애플리케이션 블록 구축
LLM - 지능형 애플리케이션의 추론 엔진
____LLM 추론 엔진의 사용 사례
____LLM의 다양한 기능
____멀티모달 언어 모델
____AI 개발의 패러다임 이동
임베딩 모델과 벡터 데이터베이스 - RAG를 위한 외부 지식 저장소
____임베딩 모델
____벡터 데이터베이스
____모델 호스팅
사용자 지능형 애플리케이션
____샘플 애플리케이션 - RAG 챗봇
____소프트웨어 엔지니어링의 지능형 애플리케이션 관련 시사점
요약
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
1부. AI의 기초: LLM, 임베딩 모델, 벡터 데이터베이스, 애플리케이션 설계
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
3장. 대규모 언어 모델
기술적 요구 사항
확률적 프레임워크
____n-그램 언어 모델
언어 모델링의 머신러닝
____인공 신경망
____인공 신경망 훈련
자연어 처리의 ANN
____토큰화
____임베딩
____확률 분포 예측
순차적 데이터 처리
____순환 신경망
____트랜스포머 아키텍처
LLM의 모범 사례
____LLM의 진화 분야
____프롬프트, 미세 조정 및 RAG
요약
4장. 임베딩 모델
기술적 요구 사항
임베딩 모델이란?
____임베딩 모델은 LLM과 어떻게 다를까?
____임베딩 모델과 LLM을 사용해야 하는 경우
____임베딩 모델의 종류
임베딩 모델 선택하기
____작업 요구 사항
____데이터 세트 특성
____계산 리소스
____벡터 표현
____임베딩 모델 리더보드
____임베딩 모델 개요
____항상 임베딩 모델이 필요한가?
____LangChain에서 코드 실행
모범 사례
요약
5장. 벡터 데이터베이스
기술적 요구 사항
벡터 임베딩이란?
____벡터 유사도
____정확한 검색과 대략적인 검색 방법
____검색 측정
그래프 연결성
____작은 세계 탐색
____탐색이 가능한 작은 세계를 검색하는 방법
____계층적 탐색이 가능한 작은 세계
벡터 데이터베이스의 필요성
____벡터 검색이 AI 모델을 개선하는 방법
사례 연구 및 실제 적용 사례
____Okta - 자연어 액세스 요청(시맨틱 검색)
____One AI - 언어 기반 AI(비즈니스 데이터를 사용한 RAG)
____Novo Nordisk - 자동 임상 연구 생성(고급 RAG/RPA)
벡터 검색 모범 사례
____데이터 모델링
____적용
요약
6장. AI/ML 애플리케이션 설계
기술적 요구 사항
데이터 모델링
____임베딩을 사용한 데이터 보강
____검색 사용 예 고려하기
데이터 스토리지
____데이터베이스 클러스터의 유형 판별
____IOPS 결정
____RAM 결정
____최종 클러스터 구성
____성능과 가용성 대 비용
데이터 흐름
____정적 데이터 원본 처리
____벡터 임베딩으로 보강한 운영 데이터 저장하기
신규성과 유지
____실시간 업데이트
____데이터 수명주기
____새로운 임베딩 모델 채택
보안 및 RBAC
AI/ML 애플리케이션 설계를 위한 모범 사례
요약
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
2부. 사용자 파이썬 애플리케이션 만들기: 프레임워크, 라이브러리, API, 벡터 검색 엔진
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
7장. 유용한 프레임워크, 라이브러리, API
기술적 요구 사항
AI/ML 파이썬
AI/ML 프레임워크
____LangChain
____유사도 점수를 사용한 LangChain 시맨틱 검색
____사전 필터링을 사용한 시맨틱 검색
____LangChain으로 기본 RAG 솔루션 구현하기
____LangChain 프롬프트 템플릿과 체인
주요 파이썬 라이브러리
____pandas
____PyMongoArrow
____PyTorch
AI/ML API
____OpenAI API
____허깅 페이스
요약
8장. AI 애플리케이션에서 벡터 검색 구현하기
기술적 요구 사항
MongoDB 아틀라스 벡터 검색을 사용한 정보 검색
____파이썬의 벡터 검색 튜토리얼
____LangChain을 사용한 벡터 검색 튜토리얼
RAG 아키텍처 시스템 구축
____청크와 문서 분할 전략
____간단한 RAG
____고급 RAG
요약
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
3부. AI 애플리케이션의 최적화: 확장, 미세 조정, 문제 해결, 모니터링 및 분석
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
9장. LLM 출력 평가
기술적 요구 사항
LLM 평가란?
____LLM 구성 요소와 엔드 투 엔드 평가
모델 벤치마킹
____평가 데이터 세트
____기준선 정의
____사용자 피드백
____합성 데이터
평가 메트릭
____어설션 기반 메트릭
____통계 메트릭
____LLM 기반 평가
____RAG 메트릭
____인적 검토
____가드레일로서의 평가
요약
10장. 시맨틱 데이터 모델을 개선해 정확도 향상하기
기술적 요구 사항
임베딩
____다양한 임베딩 모델로 실험하기
____임베딩 모델 미세 조정
임베딩 메타데이터
____메타데이터 형식 지정
____정적 메타데이터 포함
____프로그래밍 방식의 메타데이터 추출
____LLM으로 메타데이터 생성
____쿼리 임베딩 및 수집 콘텐츠 임베딩에서 메타데이터 포함하기
검색 증강 생성 최적화
____쿼리 변형
____사전 필터링을 위한 쿼리 메타데이터 추출
____수집된 데이터 형식 지정
____고급 검색 시스템
요약
11장. GenAI의 일반적인 실패
기술적 요구 사항
환각
____환각의 원인
____환각의 의미
아첨
____아첨의 원인
____아첨의 의미
데이터 유출
____데이터 유출의 원인
____데이터 유출의 의미
비용
____비용 유형
____토큰
GenAI 애플리케이션의 성능 문제
____계산 부하
____모델 제공 전략
____높은 I/O 작업
요약
12장. GenAI 애플리케이션 수정 및 최적화
기술적 요구 사항
기준선
____훈련과 평가 데이터 세트
____퓨샷 프롬프팅
____검색과 순위 재지정
____늦은 상호작용 전략
____쿼리 재작성
테스트와 레드 팀 구성
____테스트
____레드 팀 구성
정보 후처리
다른 해결 방법
요약

그냥 데이터 넣으면 되는 거 아니야?

그렇게 간단하면 좋겠지만, 문제가 있어요. AI한테 회사 자료를 그냥 던져주면 엉뚱한 대답을 하거든요. 심지어 없는 내용을 지어내기도 해요. 이걸 '환각(Hallucination)'이라고 불러요.

개인적으로 쓸 때야 "또 틀렸네" 하고 넘기면 돼요. 그런데 고객 문의에 AI가 존재하지 않는 환불 정책을 안내한다면? 생각만 해도 아찔하죠.

이 문제를 해결하는 방법이 있어요

바로 RAG(Retrieval-Augmented Generation)예요. 이름은 어려워 보이지만, 원리는 간단해요.

AI가 대답하기 전에 먼저 관련 자료를 찾아보게 하는 거예요. 오픈북 시험이랑 비슷해요. 기억에만 의존하는 게 아니라, 실제 문서를 보고 대답하는 거죠. 그러니까 엉뚱한 소리를 할 일이 확 줄어들어요.

이 방법을 쓰면 AI가 회사 내부 문서, 제품 매뉴얼, 고객 데이터를 참고해서 대답할 수 있어요. 요즘 기업들이 AI 서비스를 만들 때 가장 많이 쓰는 방식이에요.

개념은 알겠는데, 막상 만들려면 막막해요

직접 만들어보려고 하면 낯선 용어들이 쏟아져요. 벡터 데이터베이스가 뭐지? 임베딩 모델은 뭐지? 시맨틱 검색은 또 뭐지? 하나씩 찾아보다 보면 시간이 훌쩍 가요. 개념을 이해했다고 해도 이걸 어떻게 연결해서 하나의 서비스로 만드는지는 또 다른 문제예요.

게다가 만들었다고 끝이 아니에요. 운영하다 보면 문제가 계속 생겨요.

"검색 결과가 질문과 맞지 않아요."
"응답 속도가 너무 느려요."
"API 비용이 생각보다 많이 나와요."

이런 문제들을 하나씩 해결하다 보면 또 시간이 가요.

이 책이 처음부터 끝까지 알려줘요

『파이썬 AI 애플리케이션 개발』은 RAG 기반 AI 서비스를 만들고 싶은 분들을 위한 책이에요.

MongoDB에서 실제로 AI 서비스를 설계하고 운영하는 전문가 9명이 함께 썼어요. 벡터 데이터베이스 선택부터 임베딩 모델 적용, 검색 정확도 개선, 비용 최적화까지, 실무에서 마주치는 문제들을 어떻게 해결하는지 구체적으로 다뤄요.

특히 대부분의 책이 '만드는 법'에서 끝나는데, 이 책은 '만들고 나서 생기는 문제'까지 다루는 게 가장 큰 장점이에요.

우리 회사 데이터를 아는 AI, 이제 직접 만들어보세요.

👉 교보문고에서 구매하기 👉 알라딘에서 구매하기 👉 예스24에서 구매하기

크리에이티브 커먼즈 라이센스 이 저작물은 크리에이티브 커먼즈 코리아 저작자표시 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.

도서 오류 신고

이름

e-mail

도서명

신고내용

에이콘출판사에 관심을 가져 주셔서 고맙습니다. 도서의 오탈자 정보를 알려주시면 다음 개정판 인쇄 시 반영하겠습니다.

오탈자 정보는 다음과 같이 입력해 주시면 됩니다.

(예시) p.100 아래에서 3행 : '몇일'동안 -> 며칠동안

개인정보수집ㆍ이용에 동의합니다.

파이썬 AI 애플리케이션 개발 [LLM과 벡터 데이터베이스로 구현하는 맞춤형 지능형 서비스]

판매처

eBook 판매처

책 소개

저자/역자 소개

목차

관련 블로그 글

그냥 데이터 넣으면 되는 거 아니야?

이 문제를 해결하는 방법이 있어요

개념은 알겠는데, 막상 만들려면 막막해요

이 책이 처음부터 끝까지 알려줘요

도서 오류 신고