Welcome
데이터 사이언스 개론, 2025 1학기
강의 정보
강사: 조성균
email: sk.cho@snu.ac.kr
수업 시간: 월, 수 3:00 ~ 4:20PM
면담 시간: 수업 후
Website: dgds101.modellings.art
과제: Notice, eclass
질문: Communicate/Ask
강의 개요
데이터 분석은 오랜 역사를 거쳐 통계학의 영역에서 발전해왔고, 양적연구를 기반으로하는 여러 분야에서 핵심적인 역할을 한 반면, 인공지능의 하위 분야로 연구되어온 기계학습은 방대한 데이터와 더불어 최근에 그 유용성이 크게 부각되면서 이 두 분야는 데이터 사이언스라는 큰 틀에서 통합되고 있습니다. 이러한 광범위한 주제에 대해 각 기법의 핵심적 아이디어와 응용 예시에 초점을 맞추고, 더 세부적인 주제들을 탐구하기 위한 초석을 제공하고자 합니다. 또한 구체적인 예들을 직접 코딩하여 어느 정도 데이터 분석 기술의 기초를 갖추도록 과제를 통해 학습할 기회도 제공됩니다.
- 전통적 통계와 기계 학습에서 추구하는 바를 이해하고,
- 데이터로부터 패턴과 의미를 추론하는 방식을 이해하며,
- 기계/통계적 학습의 응용 가능성에 대해 파악합니다.
참고도서
- Python Data Science Handbook by Jake VanderPlas: code on GitHub
- An Introduction to Statistical Learning by James, Witten, Hastie, Tibshirani, Taylor: code on GitHub
- Python for Data Analysis (3e) by Wes McKinney: code on Github
3판 번역서: 파이썬 라이브러리를 활용한 데이터 분석
수업 활동
출석 (10%), 일반과제 (20%), 중간고사 (35%), 기말고사 (35%)
수업 계획
1주. 데이터 사이언스 소개
2주. 데이터 분석의 두 문화 1: 전통적 통계
3주. 데이터 분석의 두 문화 2: 기계 학습
4주. 파이썬 기초
5주. 탐색적 분석 및 시각화
6주. 선형 모형(linear model) 소개
7주. 선형 모형의 활용: 해석과 의미의 추론
8주. 중간고사
9주. 기계 학습 기본 1
10주. 기계 학습 기본 2
11주. 분류(classification) 1: 로지스틱(logistic) 모형
12주. 분류(classification) 2: Generative 모형
13주. Tree-based 모형
14주. 비지도 학습(unsupervised learning)
15주. 기말고사