AI 활용중급
AI 데이터 분석 코드
AI Data Analysis · AI 통계 분석 · Text-to-SQL
Python(pandas/Polars), SQL, 시각화 도구를 AI 코드 생성으로 활용하여 비즈니스 데이터에서 인사이트를 추출하는 영역이다. AI는 분석 코드 생성을 가속하지만, 잘못된 가설 검정·생존자 편향·심슨의 역설 같은 통계적 오류를 자동 탐지하지 못한다.
- •AI 할루시네이션율 9.2%, 틀릴 때 정답 대비 34% 더 확신하는 어조로 응답
- •A/B 테스트 위양성률 26.4%(이론 5%) — 다중 비교 보정 필수 (Netflix)
- •Text2SQL 스키마 링킹 오류율 15~20%, GA4 API 1,000행 초과 시 무경고 절삭
- •심슨의 역설: AI가 자동 탐지하지 못하는 가장 위험한 통계 함정