Intro to Data Science
  • Home
  • Introduction
    • Overview
    • Two Cultures
    • Causal Inference
  • Python Basics
    • Python Setup
    • NumPy & pandas
    • Data Inspection
    • Subsetting
  • EDA
    • Visualize
    • Explore
    • Wrangling
  • Linear Models
    • Model Basics
    • Implementations
    • Regression Analysis
  • ML Basics
    • Introduction
    • Regularization
    • Implementations
    • K-Nearest Neighbors
  • Classification
    • Logistic Regression
    • Generative Models
  • Trees

Welcome

  • Welcome

  • Introduction
    • Overview
    • Two Cultures
    • Causal Inference

  • Python Basics
    • Python Setup
    • NumPy & pandas
    • Data Inspection
    • Subsetting

  • Exploratory Data Analysis
    • Visualize
    • Explore
    • Wrangling

  • Linear Models
    • Model Basics
      • Implementations
    • Regression Analysis

  • Machine Learning Basics
    • Introduction
    • Regularization
      • Implementations
    • K-Nearest Neighbors
  • Classification
    • Logistic Regression
    • Generative Models
  • Tree-based Models

  • Communicate
    • Ask

On this page

  • 강의 정보
  • 강의 개요
    • 참고도서
  • 수업 활동
  • 수업 계획

Welcome

데이터 사이언스 개론, 2025 2학기

Author

Sungkyun Cho

Published

September 3, 2025

강의 정보

강사: 조성균
email: sk.cho@snu.ac.kr
수업 시간: 월, 수 1:00 ~ 2:20PM
면담 시간: 수업 후
Website: dgds101.modellings.art

과제: eclass
질문: Communicate/Ask

강의 개요

데이터 분석은 오랜 역사를 거쳐 통계학의 영역에서 발전해왔고, 양적연구를 기반으로하는 여러 분야에서 핵심적인 역할을 한 반면, 인공지능의 하위 분야로 연구되어온 기계학습은 방대한 데이터와 더불어 최근에 그 유용성이 크게 부각되면서 이 두 분야는 데이터 사이언스라는 큰 틀에서 통합되고 있습니다. 이러한 광범위한 주제에 대해 각 기법의 핵심적 아이디어와 응용 예시에 초점을 맞추고, 더 세부적인 주제들을 탐구하기 위한 초석을 제공하고자 합니다. 또한 구체적인 예들을 직접 코딩하여 어느 정도 데이터 분석 기술의 기초를 갖추도록 과제를 통해 학습할 기회도 제공됩니다.

  • 전통적 통계와 기계 학습에서 추구하는 바를 이해하고,
  • 데이터로부터 패턴과 의미를 추론하는 방식을 이해하며,
  • 기계/통계적 학습의 응용 가능성에 대해 파악합니다.

참고도서

  • Python Data Science Handbook by Jake VanderPlas: code on GitHub
  • An Introduction to Statistical Learning by James, Witten, Hastie, Tibshirani, Taylor: code on GitHub
  • Python for Data Analysis (3e) by Wes McKinney: code on Github
    3판 번역서: 파이썬 라이브러리를 활용한 데이터 분석
  • LLMs: ChatGPT, Claude, Gemini, Grok, DeepSeek

수업 활동

출석 (10%), 중간고사 (45%), 기말고사 (45%)

수업 계획

1주. 데이터 사이언스 소개
2주. 데이터 분석의 두 문화 1: 전통적 통계
3주. 데이터 분석의 두 문화 2: 기계 학습
4주. 인과 추론 1
5주. 인과 추론 2
6주. 선형 모형(linear model) 소개
7주. 선형 모형의 활용: 해석과 의미의 추론
8주. 중간고사
9주. 기계 학습 기본 1: 모델링과 정규화
10주. 기계 학습 기본 2: 모형의 평가
11주. 분류(classification) 문제 1: 로지스틱(logistic) 모형
12주. 분류(classification) 문제 2: 모형의 선택과 평가
13주. 딥러닝 소개
14주. 비지도 학습(unsupervised learning)
15주. 기말고사

This work © 2024 by Sungkyun Cho is licensed under CC BY-NC-SA 4.0