0512 수업
SQL vs NoSQL
- SQL
| DB | 특징 |
| PostgreSQL | 확장성과 안정성이 뛰어난 오픈소스 RDBMS |
| MySQL | 가볍고 빠르며 대규모 동시접속 처리에 강함 |
| Oracle / MS SQL Server | 엔터프라이즈급, 대형 금융기관에서 선호 |
- NoSQL
| DB | 특징 |
| MongoDB | 문서 기반(JSON 형태), 유연한 스키마 |
| Cassandra | 대규모 수평확장, 고가용성 |
| Redis | 인메모리(초고속), 키-값 저장 |
왜 NoSQL을 쓰는가?
- 유연한 스키마: 데이터 구조가 자주 바뀌는 초기 스타트업 환경에 적합
- 수평 확장(Scale-Out): 서버를 추가하면 처리량이 선형적으로 증가
- AI/ML 모델 서빙: 이상거래탐지(FDS), 신용평가 모델의 빠른 feature 조회
사례 1 - 케이뱅크(K Bank)의 MySQL 활용
- 왜 MySQL을 선택했는가?
빠른 서비스를 중요하게 생각해 속도가 빠른 MySQL 선택
온라인 DDL로 무중단 테이블 변경 달성
하지만 MySQL에서는 보안이 약함 → Oracle Premier Support로 보안 향상
사례 2 - 한국신용데이터(KCD)의 Databricks 활용
"소상공인을 위한 데이터 기반 의사결정 플랫폼"
한국평가정보, 캐시노트(포스기) 등 다양한 서비스 → 포스 시스템 시장에 대한 PM 수요 증가
운영 효율화를 중요시하는 기업
- 캐시노트(Cashnote)란?
- 한국신용데이터가 운영하는 소상공인 매출 관리 앱
- 8개 카드사 매출, 현금 매출, 세금계산서를 한눈에 조회
- 신용점수 관리, 정부 보조금 안내, 식자재 공동구매(캐시노트 마켓) 등 제공
- 계속 성장중
- Databricks 도입 후 성과
| 지표 | 개선 수치 |
| 파이프라인 관리 비용 절감 | 90% 이상 |
| Unity Catalog를 통한 클러스터 유지비 절감 | 70% 이상 |
| 클러스터 실행 비용 최적화 | 50% 이상 |
- 핵심 기술 도입 내용
1. Delta Lake: 대용량 고객 데이터를 Delta 테이블로 마이그레이션 → 데이터 지연(latency) 대폭 감소, 기존 15분 → 거의 실시간
2. Unity Catalog: 모든 배치 작업과 클러스터에 owner, team, category 태그 부착 → 조직 차원의 리소스 소비 가시성 확보
3. Auto Loader: File Notification 모드로 데이터 수집 자동화 → 20분 단위 배치 처리로 비용 최적화
4. 데이터 계보 자동 생성: 변경/오류 발생 시 영향 범위를 즉시 파악하고 과녈ㄴ 사용자에게 자동 통보
5. 표준 언어 지원: SQL, Scala, Python 등 범용 언어로 개발 → 신규 입사자 온보딩 시간 대폭 단축
사례 3 - 당근페이 '브로쿼리(Broquery)'
AI가 SQL을 대신 써주는 시대
비개발 직군의 데이터 접근 장벽을 깨고자 함
- 브로쿼리란?
- 당근페이 내부에서 사용하는 AI 기반 Text-to-SQL 챗봇
- '브로콜리'를 모티브로 한 캐릭터 + 데이터 관련 질문(쿼리)을 해결해주는 Bro
- Slack에서 자연어로 질문하면 1분 이내에 SQL 쿼리 + 결과 데이터 + 시각화까지 제공
- 브로쿼리 도입 효과
1. 의사결정 속도 향상: 누구나 직접 데이터 조회 → 빠른 인사이트 도출
2. 데이터 접근성 증가: SQL을 몰라도 자유롭게 분석 가능
3. 데이터 리터러시 강화: 직접 데이터를 다루면서 분석 역량이 자연스럽게 향상
4. 엔지니어 리소스 절감: 반복 요청 업무 감소 → 본연의 개발 업무에 집중
5. 데이터 중심 문화 정착: 자율적 데이터 활용 → 데이터 기반 의사결정 문화로 변화
실무 금융 분석가가 반드시 알아야 할 SQL 5선
1. SELECT - 데이터 진입점
2. JOIN - 분산된 금융 데이터 결합
3. GROUP BY + 집계함수 - 숫자 요약의 꽃
4. CASE - 금융 로직 분류
내 생활 속 핀테크 찾아보기
"이 산업의 데이터가 금융과 어떻게 연결될 수 있을까?"
"기능이 있다"에서 멈추지 말고, 이 기능을 운영하기 위해 회사 안에서 어떤 일이 생기는지 생각하기
생각의 순서: 돈의 흐름 → 데이터 객체, 상태값 떠올리기
기업이 페이를 만드는 이유: 기업에서 현금 자산을 확보할 수 있기 때문
다른 도메인들의 케이스를 찾아서 핀테크 기업에 녹이는 방식 중요
1. 돈의 흐름 이해하기
실제 핀테크 서비스에서 돈이 어떻게 움직이는지
2. 실제 사례 분석
현업에서 어떤 데이터를 왜 모으고, 그 데이터가 어떻게 비즈니스 가치를 만드는지
3. 간단한 기획 실습
직접 "돈이 되는 데이터"를 수집하기 위한 서비스를 기획해보는 시간
'구름 핀테크 교육' 카테고리의 다른 글
| [11일차] 데이터 추적 설계, 서비스 지표 & 퍼널 설계 (0) | 2026.05.15 |
|---|---|
| [9일차] 생성형 AI, LLM, RAG (0) | 2026.05.13 |
| [7일차] SQL 작성 (Google Cloud BigQuery) (0) | 2026.05.11 |
| [6일차] CRUD, 노션 활용 (0) | 2026.05.08 |
| [5일차] 마이데이터, 데이터 구조화 실습 (0) | 2026.05.08 |