기술 문서

v1.0.0

브랜즈모어 하이브리드 RAG 시스템

엔터프라이즈급 검색 정확도를 제공하는 차세대 RAG 솔루션

핵심 기술 스택

브랜즈모어 RAG 시스템은 최신 AI/ML 기술과 검색 알고리즘을 통합하여 엔터프라이즈급 성능을 제공합니다.

벡터 데이터베이스
Qdrant 1.15.5

고성능 벡터 검색 엔진으로 HNSW(Hierarchical Navigable Small World) 알고리즘 기반 인덱싱을 지원합니다.

Named Vectors: 다중 벡터 타입 지원
Cosine Similarity: 의미론적 거리 측정
Sparse Vectors: BM25 키워드 검색
임베딩 모델
다중 임베딩 모델 지원

기업의 필요에 따라 다양한 임베딩 모델을 선택하거나 멀티 모델로 사용할 수 있습니다. Foundation 모델부터 한국어 특화 상용 모델까지 유연하게 구성 가능합니다.

기본 모델: OpenAI text-embedding-3-small (1536차원)
Foundation 모델: BGE-m3-ko, Qwen3-Embedding 등
한국어 특화: Upstage Embedding Ko (상용, 비용 발생)
모델 유연성: 요구사항에 맞는 최적 모델 선택
멀티 모델: 여러 임베딩 모델 동시 사용 가능
비용 최적화: 작업별로 가장 효율적인 모델 선택
검색 알고리즘
Hybrid Search + RRF

Dense 벡터와 Sparse 벡터를 RRF(Reciprocal Rank Fusion)로 결합하여 검색 정확도를 극대화합니다.

Dense: 의미론적 유사도 검색
Sparse: BM25 키워드 매칭
RRF: k=60 재순위화
Federated Search (연합 검색)

여러 독립적인 컬렉션이나 데이터 소스를 통합하여 검색하는 기술입니다. 각 소스의 검색 결과를 병합하여 종합적인 답변을 제공합니다.

멀티 컬렉션 지원: 여러 벡터 DB 컬렉션 동시 검색
결과 병합: RRF 또는 Weighted Fusion으로 통합
점수 정규화: 서로 다른 컬렉션의 스코어 통일
확장성: 도메인별/용도별 컬렉션 분리 관리
LLM 생성 모델
OpenRouter 통합 - 다중 LLM 지원

OpenRouter를 통해 Foundation LLM부터 최신 모델까지 대부분의 주요 LLM을 지원합니다. Claude, GPT, Gemini, Llama 등 다양한 모델을 선택하여 사용할 수 있습니다.

모델 유연성: 애플리케이션 요구사항에 맞는 최적 모델 선택
비용 최적화: 작업별로 가장 효율적인 모델 선택 가능
장애 대응: 한 모델 장애 시 즉시 다른 모델로 전환
기본 모델: Claude Haiku 4.5 (속도 최적화)
고급 모델: Claude Opus, GPT-4, Gemini Pro 등 지원
출처 추적: 자동 인용 및 참조 정보 제공

추가 기술 스택

문서 처리

  • • PDF: pdf-parse → 개선된 pdf2json → pdf-to-text → OCR (4단계 구조화 파싱)
  • • DOCX: Mammoth
  • • PPTX: node-pptx-parser
  • • CSV: Papa Parse + 타입 추론
  • • Excel: XLSX/XLS 지원 (xlsx)
  • • JSON, TXT, MD

🧠 3단계 AI 분석 파이프라인

  • • Phase 1: 문서 구조 분석 (LLM)
  • • Phase 2: 지능형 청킹 + 태깅
  • • Phase 3: 청크 심층 분석 (LLM)
  • • 풍부한 메타데이터 생성
  • → 시맨틱 그룹 청킹 (CSV/Excel)

관측 & 모니터링

  • • Langfuse (LLM Observability)
  • • Vercel Analytics
  • • Custom Metrics
  • • Performance Tracking

핵심 기능

브랜즈모어 RAG 시스템은 엔터프라이즈 환경에 최적화된 다음과 같은 핵심 기능을 제공합니다.

하이브리드 검색

Dense(의미론적) + Sparse(키워드) 검색을 RRF(Reciprocal Rank Fusion)로 결합하여 최적의 검색 결과를 제공합니다.

  • OpenAI text-embedding-3-small (1536차원)
  • BM25 기반 Sparse 벡터
  • RRF를 통한 결과 재순위화
Named Vectors 지원

Qdrant의 Named Vectors를 활용하여 하나의 포인트에 여러 벡터 타입을 저장하고 효율적으로 검색합니다.

  • text-dense: 의미론적 검색
  • text-sparse: 키워드 검색
  • 단일 콜렉션으로 관리 간소화
🧠 LLM 기반 적응형 청킹
차별화된 핵심 기술

일반적인 RAG 시스템과 달리, 브랜즈모어는 3단계 AI 분석 파이프라인을 통해 문서를 지능적으로 처리합니다. LLM을 활용한 구조 분석과 청크별 심층 분석으로 풍부한 메타데이터를 생성하고, 검색 정확도를 극대화합니다.

Phase 1: 문서 구조 분석

LLM이 전체 문서를 분석하여 섹션 구조, 개체, 키워드, 복잡도를 추출합니다.

Phase 2: 지능형 청킹

단순 청킹 후 Phase 1의 구조 정보를 태깅하고, 청크 최적화(병합/분할)를 수행합니다.

Phase 3: AI 심층 분석

각 청크를 전체 문서 맥락에서 분석하여 요약, 키워드, 중요도, 의미적 역할, 관계 등을 추출합니다.

  • 시맨틱 그룹 청킹: CSV/Excel 카테고리별 그룹화
  • 메타데이터 구조: 문서/청크/구조/의미/검색 최적화 정보
  • 자동 전략 선택: 문서 타입별 최적 청킹 전략
실시간 RAG 생성

검색된 컨텍스트를 LLM에 전달하여 정확하고 맥락있는 답변을 실시간으로 생성합니다.

  • Claude Haiku 4.5 (OpenRouter)
  • 컨텍스트 기반 답변 생성
  • 출처 추적 및 관련도 표시

시스템 아키텍처

브랜즈모어 RAG 시스템은 다음과 같은 레이어로 구성됩니다.

1. 문서 처리 레이어
파일 업로드 → 파싱 → 청킹 → 임베딩

지원 파일 형식: PDF, DOCX, PPTX, TXT, MD, CSV, JSON, XLSX, XLS

청킹 전략: 3단계 AI 파이프라인 (구조 분석 → 지능형 청킹 → 심층 분석)

특화 청킹: CSV/Excel 시맨틱 그룹 청킹 (카테고리별 자동 그룹화)

임베딩 모델: OpenAI text-embedding-3-small (1536차원)

하이브리드 임베딩: Dense + Sparse (BM25) 병렬 생성

2. 벡터 저장소 레이어
Qdrant Named Vectors 기반

Named Vectors: text-dense (1536차원, Cosine 거리), text-sparse (BM25)

메타데이터 구조: 문서/청크/구조/의미/검색 최적화 정보

AI 분석 메타데이터: 요약, 키워드, 중요도, 의미적 역할, 관계, 인사이트

인덱싱: HNSW (Hierarchical Navigable Small World)

3. 검색 레이어
하이브리드 검색 + RRF 재순위화

검색 모드: Dense, Sparse, Hybrid (Named Vectors 활용)

재순위화: RRF (Reciprocal Rank Fusion, k=60)

타이밍 메트릭: 임베딩 생성, 벡터 검색, 응답 시작/완료 시간 추적

결과 제한: 5개 (기본값, 조정 가능)

4. LLM 생성 레이어
검색 결과 기반 답변 생성

LLM 플랫폼: OpenRouter (다중 LLM 지원)

기본 모델: Claude Haiku 4.5 (속도 최적화)

지원 모델: Claude, GPT, Gemini, Llama 등 주요 Foundation LLM

모델 선택: 요구사항에 따라 유연하게 변경 가능

컨텍스트 크기: 검색된 상위 5개 청크

시스템 프롬프트: 브랜즈모어 전용 RAG 어시스턴트

출력: 구조화된 답변 + 출처 정보

기술 스택

프론트엔드
  • • Next.js 16 (App Router)
  • • React 19
  • • TypeScript 5
  • • Tailwind CSS 4.1
  • • shadcn/ui
백엔드
  • • Next.js API Routes
  • • Qdrant 1.15.5
  • • OpenAI API
  • • OpenRouter API
  • • Node.js
인프라
  • • Vercel (배포)
  • • Qdrant Cloud
  • • OpenAI Platform
  • • OpenRouter
  • • GitHub

성능 지표

실제 운영 환경에서 측정된 성능 지표입니다.

95%

응답 정확도

<500ms

평균 검색 시간

50%

검색 시간 단축

24/7

지식 접근성

산업별 활용 사례

다양한 산업군에서 브랜즈모어 RAG 시스템을 활용하고 있습니다.

제조업
기술 문서 및 매뉴얼 검색
수천 페이지의 기술 문서와 작업 매뉴얼에서 필요한 정보를 즉시 찾아 작업 효율성을 높입니다.
금융업
규정 및 정책 문서 조회
복잡한 금융 규제와 내부 정책 문서를 빠르게 검색하여 컴플라이언스 업무를 지원합니다.
IT/소프트웨어
기술 지식베이스 구축
개발 문서, API 레퍼런스, 트러블슈팅 가이드를 통합하여 개발자 생산성을 향상시킵니다.
고객 지원
CS 자동화 및 챗봇
FAQ 및 고객 문의 이력을 학습하여 80% 이상의 문의를 자동으로 처리합니다.

지금 바로 시작하세요

브랜즈모어 RAG 시스템을 직접 체험하고, 귀사의 비즈니스에 어떻게 적용할 수 있는지 확인해보세요.