머신 러닝: 회귀 모델

머신 러닝: 회귀 모델

Instructor: Carlos Guestrin

Included with

Learn more

8 modules

Gain insight into a topic and learn the fundamentals.

2 weeks to complete

at 10 hours a week

Flexible schedule

Learn at your own pace

8 modules

Gain insight into a topic and learn the fundamentals.

2 weeks to complete

at 10 hours a week

Flexible schedule

Learn at your own pace

Skills you'll gain

Details to know

Shareable certificate

Add to your LinkedIn profile

Assessments

15 assignments

Taught in Korean

See how employees at top companies are mastering in-demand skills

Learn more about Coursera for Business

logos of Petrobras, TATA, Danone, Capgemini, P&G and L'Oreal

There are 8 modules in this course

사례 연구 - 주택 가격 예측

첫 번째 사례 연구 주택 가격 예측에서는 입력 특성(면적, 방 및 화장실 개수 등)에서 연속적인 값(가격)을 예측하는 모델을 만듭니다. 이는 회귀를 적용할 수 있는 많은 장소 중 하나일 뿐입니다. 그 외 다른 응용의 범위는 의약품에 대한 건강 효과, 금융 분야에서의 주가, 고성능 컴퓨터 전력 사용 예측에서부터 유전자 발현에 중요한 조절기를 분석하는 것까지 다양합니다. 본 강의에서는 예측 및 특성 선택 태스크를 위한 정규화된 선형 회귀 모델에 대해 알아봅니다. 매우 큰 특성의 집합을 처리하고 다양한 복잡도 모델 중 선택할 수 있습니다. 또한 이상치와 같은 데이터의 양상이 선택한 모델과 예측값에 주는 영향도 분석합니다. 이와 같은 모델을 피팅하기 위해 큰 데이터 세트에 따라 확장하는 최적화 알고리즘을 구현해 봅니다. 학습 목표: 본 강의를 끝내면 여러분은: -회귀 모델의 입력과 출력을 설명할 수 있습니다. -데이터를 모델링할 때 편향과 분산을 비교 및 대조할 수 있습니다. -최적화 알고리즘을 사용하여 모델 매개변수를 예상할 수 있습니다. -교차 검증을 사용하여 매개변수를 조정할 수 있습니다. -모델의 성능을 분석할 수 있습니다. -희소성의 개념과 라쏘가 희소 해로 이어지는 방법을 설명할 수 있습니다. -모델 중 선택할 방법을 배포할 수 있습니다. -모델을 활용하여 예측을 형성할 수 있습니다. -주택 데이터 세트를 사용하여 가격을 예측하는 회귀 모델을 구축할 수 있습니다. -이와 같은 기술을 Python에서 구현할 수 있습니다.

회귀는 가장 중요하고 널리 사용되는 머신 러닝 및 통계 도구 중 하나입니다. 데이터의 특성과 관측된 연속 값 응답 간의 관계를 학습하여 여러분의 데이터에서 예측할 수 있습니다. 회귀는 주가 예측에서 유전자 조절 네트워크 이해에 이르기까지 방대한 응용이 가능합니다. 본 강의에 대한 소개에서는 앞으로 다룰 주제와 여러분이 이미 알고 있다고 가정하는 배경지식 및 리소스에 대한 개요를 제공합니다.

What's included

5 videos3 readings

5 videos Total 20 minutes

환영합니다! 2 minutes
강의에서는 무엇을 다루나요? 4 minutes
강의 전반부 개요 5 minutes
강의 후반부 개요 6 minutes
필요한 배경지식 4 minutes

3 readings Total 30 minutes

머신 러닝 전문 과정 관련 중요 업데이트 10 minutes
이번 모듈의 슬라이드 10 minutes
읽기 자료: 필요한 소프트웨어 도구 10 minutes

본 강의는 가장 기본적인 회귀 모델인 데이터에 선을 피팅하는 것에서부터 시작합니다. 데이터의 단일 일변량 특성의 예측을 형성하기 위한 이 단순 모델을 ‘단순 선형 회귀’라고 부릅니다. 본 모듈에서는 높은 수준의 회귀 작업을 설명한 다음 이와 같은 개념을 단순 선형 회귀 사례를 통하여 전문화합니다. 폐쇄형 해와 경사 하강이라는 반복적인 최적화 알고리즘을 모두 사용하여 단순 회귀 모델을 형식화하고 모델을 데이터에 피팅하는 방법을 배웁니다. 이 적합 함수를 기반으로 예상된 모델 매개변수 및 형태 예측을 해석합니다. 또한 외부 관측치에 대한 적합의 민감도를 분석합니다. 면적을 통해 주택 가격을 예측하는 사례 연구의 맥락에서 이 모든 개념을 검토합니다.

What's included

25 videos5 readings2 assignments

25 videos Total 122 minutes

주택 가격 예측 사례 연구 1 minute
회귀 기초: 데이터 및 모델 9 minutes
회귀 기초: 작업 3 minutes
회귀 ML 블록 다이어그램 5 minutes
단순 선형 회귀 모델 2 minutes
주어진 선을 사용할 때의 비용 7 minutes
적합선의 사용 7 minutes
적합선의 해석 6 minutes
최소제곱 최적화 목적 함수의 정의 4 minutes
분석적으로 최댓값 또는 최솟값 찾기 7 minutes
1D 함수의 최대화: 모범 예시 3 minutes
언덕 등반을 통한 최댓값 찾기 7 minutes
언덕 하강을 통한 최솟값 찾기 4 minutes
학습률 및 수렴 기준의 선택 6 minutes
하강: 다차원 도함수 6 minutes
경사 하강: 다차원 언덕 하강 6 minutes
RSS의 경사 계산 7 minutes
접근 방법 1: 폐쇄형 해 6 minutes
접근 방법 2: 경사 하강 7 minutes
접근 방법의 비교 2 minutes
높은 레버릿지 지점의 영향: 데이터의 탐색 5 minutes
높은 레버릿지 지점의 영향: 도심의 제거 7 minutes
높은 레버릿지 지점의 영향: 고급 도심의 제거 3 minutes
비대칭 비용 함수 4 minutes
간단한 복습 1 minute

5 readings Total 50 minutes

이번 모듈의 슬라이드 10 minutes
선택 읽기 자료: 폐쇄형 해에 대한 모범 답안 10 minutes
선택 읽기 자료: 경사 하강에 대한 모범 답안 10 minutes
노트북을 다운로드하여 진행합니다 10 minutes
주택 데이터에 단순 선형 회귀 모델 피팅 10 minutes

2 assignments Total 60 minutes

단순 선형 회귀 30 minutes
주택 데이터에 단순 선형 회귀 모델 피팅 30 minutes

단순 선형 회귀를 넘어서는 다음 단계는 데이터의 다중 특성이 예측을 형성할 때 사용되는 ‘다중 회귀’를 고려하는 것입니다. 보다 구체적으로 본 모듈에서는 단일 변수(예: '면적')와 관측된 응답(예: '주택 매매가') 사이 보다 복잡한 관계의 모델을 구축하는 방법을 배웁니다. 이때 데이터에 다항을 피팅하거나 응답 값의 계절적 변화를 포착하는 등의 작업이 포함됩니다. 또한 여러 입력 변수(예: '면적', '방 개수', '화장실 개수')를 통합하는 방법도 배웁니다. 그다음 이와 같은 모든 모델이 선형 회귀 프레임워크 내에서 여전히 다중 ‘특성’을 사용하여 변환하는 방법을 설명할 수 있습니다. 이 다중 회귀 프레임워크 내에서 데이터에 모델을 피팅하고, 예상된 계수를 해석하며, 예측을 형성할 수 있습니다. 또한 다중 회귀 모델을 피팅하기 위한 경사 하강 알고리즘도 구현합니다.

What's included

19 videos5 readings3 assignments

19 videos Total 87 minutes

다중 회귀 도입 1 minute
다항 회귀 4 minutes
모델링 계절성 8 minutes
계절성을 볼 수 있는 곳 3 minutes
입력이 하나인 일반 특성의 회귀 3 minutes
다중 입력 사용의 동기 부여 5 minutes
표기법의 정의 3 minutes
다중 입력 특성의 회귀 4 minutes
다중 회귀 적합의 해석 7 minutes
벡터 표기법으로 단일 관측치 모델 다시 쓰기 7 minutes
행렬 표기법으로 모든 관측치에 대한 모델 다시 쓰기 5 minutes
D-차원 곡선의 비용 계산 10 minutes
RSS의 경사 계산 3 minutes
접근 방법 1: 폐쇄형 해 4 minutes
폐쇄형 해 토론 5 minutes
접근 방법 2: 경사 하강 2 minutes
특성별 업데이트 9 minutes
경사 하강 접근 방법의 알고리즘 요약 4 minutes
간단한 복습 1 minute

5 readings Total 50 minutes

이번 모듈의 슬라이드 10 minutes
선택 읽기 자료: 행렬 대수학 복습 10 minutes
주택 가격 예측을 위한 다양한 다중 회귀 모델 탐색 10 minutes
Numpy 튜토리얼 10 minutes
다중 회귀를 위한 경사 하강 구현 10 minutes

3 assignments Total 90 minutes

다중 회귀 30 minutes
주택 가격 예측을 위한 다양한 다중 회귀 모델 탐색 30 minutes
다중 회귀를 위한 경사 하강 구현 30 minutes

이와 같은 모델의 매개변수 추정을 위한 선형 회귀 모델과 알고리즘에 대해 배웠으니 이제 새 데이터 예측에 여기서 고려한 방법을 얼마나 잘 수행하고 있는지 평가할 수 있습니다. 또한 가능한 모델 중 가장 성능이 좋은 모델을 선택할 수 있습니다. 본 모듈은 모델 선택 및 평가의 중요한 주제를 다루고 있습니다. 이와 같은 분석의 이론적 측면과 실제적 측면을 모두 검토합니다. 먼저 예측의 ‘손실’을 측정하는 개념을 살펴보고 이를 통해 학습, 검정 및 일반화 오차를 정의합니다. 이와 같은 오차 측정의 경우 모델 복잡도에 따라 오차가 어떻게 달라지고 예측 성능에 대한 유효성 평가를 구성할 때 오차가 어떻게 사용되는지 분석합니다. 이는 머신 러닝의 기본인 편향-분산 트레이드오프에 대한 중요한 논의로 이어집니다. 마지막으로 먼저 모델 중에서 선택한 다음 선택한 모델의 성능을 평가하는 방법을 고안합니다. 본 모듈에 설명된 개념은 이번 강의에서 다루는 회귀 설정을 훨씬 뛰어넘는 모든 머신 러닝 문제의 핵심입니다.

What's included

14 videos2 readings2 assignments

14 videos Total 93 minutes

성능 평가 도입 1 minute
‘손실’이란 무슨 뜻일까요? 4 minutes
학습 오차: 훈련 세트에 대한 오차 평가 8 minutes
일반화 오차: 어디에 이용할까요 8 minutes
시험 오차: 무엇을 계산할 수 있을까요 5 minutes
과적합의 정의 3 minutes
학습/검정 분리 2 minutes
기약 오차 및 편향 6 minutes
분산 및 편향-분산 트레이드오프 7 minutes
오차 및 데이터양 6 minutes
오차의 세 가지 원인에 대한 공식적인 정의 14 minutes
오차의 세 가지 원인에 대한 공식적인 도출 20 minutes
모델 선택, 피팅 및 평가에 대한 학습/검증/검증 분리 8 minutes
간단한 복습 1 minute

2 readings Total 20 minutes

이번 모듈의 슬라이드 10 minutes
다항 회귀 10 minutes

2 assignments Total 60 minutes

성능 평가하기 30 minutes
편향-분산 트레이드오프 탐색 30 minutes

모델 복잡도가 증가함에 따라 모델의 성능이 어떻게 변화하는지 살펴보았으며, 복잡한 모델이 훈련 데이터에 대해 과적합해지는 잠재적 문제를 설명할 수 있습니다. 이 모듈에서는 이 문제를 자동으로 처리하기 위한 매우 간단하지만 아주 효과적인 기술을 살펴보겠습니다. 이 방법을 ‘릿지 회귀’라고 합니다. 복잡한 모델에서 시작하지만 훈련 데이터에 대한 적합도 측정은 물론 과적합 함수로부터 해의 편향을 크게 하는 항까지 통합하는 방식으로 모델을 피팅합니다. 이를 위해 과적합 함수의 증상을 살펴보고 이를 사용하여 수정된 최적화 목적 함수에 쓸 정량적 측정값을 정의합니다. 릿지 회귀 목적 함수에 피팅하기 위해 폐쇄형 및 경사 하강 알고리즘을 모두 도출합니다. 이와 같은 형태는 다중 회귀를 위해 도출한 기존 알고리즘에서 약간 수정된 형태입니다. 과적합을 방지하는 편향의 강도를 선택하기 위해 ‘교차 검증’이라는 일반적인 방법을 살펴봅니다. 교차 검증 및 경사 하강을 모두 구현하여 릿지 회귀를 피팅하고 정규화 상수를 선택합니다.

What's included

16 videos5 readings3 assignments

16 videos Total 85 minutes

다항 회귀에서의 과적합 증상 2 minutes
과적합 데모 7 minutes
보다 일반적인 다중 회귀 모델의 과적합 4 minutes
적합도 및 계수의 크기 균형 조절 7 minutes
결과 릿지 목적 함수와 극한 해결책 6 minutes
릿지 회귀가 편향 및 분산의 균형을 맞추는 방법 2 minutes
릿지 회귀 데모 9 minutes
릿지 계수 경로 4 minutes
릿지 목적 함수의 경사 계산 5 minutes
접근 방법 1: 폐쇄형 해 6 minutes
폐쇄형 해 토론 6 minutes
접근 방법 2: 경사 하강 10 minutes
교차 검증을 통한 조정 매개변수 선택 4 minutes
K 겹 교차 검증 6 minutes
편향 값 처리 방법 6 minutes
간단한 복습 2 minutes

5 readings Total 50 minutes

이번 모듈의 슬라이드 10 minutes
노트북을 다운로드한 후 다음을 따라 합니다 10 minutes
노트북을 다운로드한 후 다음을 따라 합니다 10 minutes
다항식 회귀에서 L2 페널티의 효과 관찰 10 minutes
경사 하강을 통한 릿지 회귀 구현 10 minutes

3 assignments Total 90 minutes

릿지 회귀 30 minutes
다항식 회귀에서 L2 페널티의 효과 관찰 30 minutes
경사 하강을 통한 릿지 회귀 구현 30 minutes

기본적인 머신 러닝 작업은 모델에 포함할 특성의 집합을 선택하는 것입니다. 본 모듈에서는 다중 회귀의 맥락에서 이 개념을 살펴보고 특성을 이처럼 선택하는 것이 예측을 형성하는 데 있어 해석 가능성과 효율성에 어떤 중요성을 갖는지 살펴볼 수 있습니다. 시작하기 전 여러 특성의 부분 집합을 포함하여 열거한 모델을 탐색하는 방법을 알아봅니다. 완전 탐색과 탐욕 알고리즘을 모두 분석합니다. 그리고 명시적 열거 대신 릿지 회귀와 유사하게 암시적으로 특성 선택을 수행하는 라소 회귀로 전환합니다. 복잡한 모델은 훈련 데이터에 대한 적합도 측정값 및 릿지에 사용된 것과 다른 과적합 측정값을 기반으로 피팅합니다. 이 라쏘 방법은 수많은 영역에서 그 영향력을 발휘했으며 이 방법의 근간이 되는 개념은 머신 러닝과 통계를 근본적으로 변화시킨 바 있습니다. 또한 라쏘 모델을 피팅하기 위한 좌표 하강 알고리즘을 구현합니다. 좌표 하강은 또 다른 일반적인 최적화 기술로 머신 러닝의 여러 영역에서 유용하게 사용됩니다.

What's included

22 videos4 readings3 assignments

22 videos Total 126 minutes

특성 선택 태스크 4 minutes
모든 부분 집합 6 minutes
모든 부분 집합의 복잡도 3 minutes
탐욕 알고리즘 7 minutes
탐욕 전진적 단계 알고리즘의 복잡도 3 minutes
특성 선택에도 정규화를 사용할 수 있을까요? 4 minutes
임계처리 릿지 계수? 5 minutes
라쏘 목적 함수 및 그 계수의 경로 7 minutes
릿지 비용의 시각화 8 minutes
릿지 해의 시각화 6 minutes
라쏘 비용 및 해의 시각화 8 minutes
라쏘 데모 5 minutes
라쏘 목적 함수의 차이 4 minutes
좌표 하강 6 minutes
특성의 정규화 3 minutes
최소제곱법에 대한 좌표 하강(정규화된 특성) 9 minutes
라쏘에 대한 좌표 하강(정규화된 특성) 5 minutes
수렴 및 기타 라쏘 솔버 평가 3 minutes
라쏘에 대한 좌표 하강(정규화되지 않은 특성) 2 minutes
라쏘 좌표 하강 업데이트 도출 19 minutes
페널티 강도 및 라쏘와 관련된 기타 실질적인 문제 선택 6 minutes
간단한 복습 4 minutes

4 readings Total 40 minutes

이번 모듈의 슬라이드 10 minutes
노트북을 다운로드한 후 다음을 따라 합니다 10 minutes
특성 선택을 위한 라쏘의 사용 10 minutes
좌표 하강을 사용한 라쏘 구현 10 minutes

3 assignments Total 90 minutes

특성 선택 및 라쏘 30 minutes
특성 선택을 위한 라쏘의 사용 30 minutes
좌표 하강을 사용한 라쏘 구현 30 minutes

지금까지는 다항 및 초평면과 같은 매개변수 함수를 전체 데이터 세트에 피팅하는 방법에 초점을 맞추었습니다. 본 모듈에서는 그 대신 ‘비모수’ 방법의 클래스에 주목합니다. 이와 같은 방법을 사용하면 더 많은 데이터가 관측됨에 따라 모델의 복잡도가 증가하고, 로컬에서 관측치를 수락하는 적합이 생성됩니다. 비모수 방법의 간단하고 직관적인 예시인 최근접 이웃 회귀부터 살펴봅니다. 쿼리 지점에 대한 예측은 학습 세트에서 가장 관련성이 높은 관측치를 기반으로 합니다. 이 접근 방법은 매우 간단하지만 특히 대규모 데이터 세트에서 우수한 예측을 제공할 수 있습니다. 알고리즘을 배포하여 최근접 이웃을 검색하고 검색된 이웃을 기반으로 예측을 형성합니다. 이 개념을 기반으로 커널 회귀를 살펴봅니다. 최근접 관측치의 작은 집합을 기반으로 예측을 형성하는 대신, 커널 회귀는 데이터 세트의 모든 관측치를 사용하나 이와 같은 관측치가 예측값에 미치는 영향은 쿼리 지점과의 유사성에 의해 그 가중치가 달라집니다. 무한한 훈련 데이터라는 한계를 두고 이와 같은 방법의 이론적 성능을 분석하며, 이러한 방법이 잘 작동할 때와 그렇지 않을 때를 시나리오로 비교해 봅니다. 또한 이와 같은 기술을 구현하고 실제 행동을 관측합니다.

What's included

13 videos2 readings2 assignments

13 videos Total 63 minutes

모수 회귀의 한계 4 minutes
1-최근접 이웃 회귀 접근 방법 8 minutes
거리 행렬 4 minutes
1-최근접 이웃 알고리즘 3 minutes
k-최근접 이웃 회귀 8 minutes
k-최근접 이웃 실습 4 minutes
가중 k-최근접 이웃 5 minutes
가중 k-NN 회귀부터 커널 회귀까지 7 minutes
모수 모델의 글로벌 피팅 및 커널 회귀 분석의 로컬 피팅 6 minutes
데이터양 증가에 따른 NN의 성능 8 minutes
고차원, 데이터 희소성 및 연산 복합성 문제 3 minutes
k-NN 분류 2 minutes
간단한 복습 1 minute

2 readings Total 20 minutes

이번 모듈의 슬라이드 10 minutes
k-최근접 이웃 회귀를 이용한 주택 가격 예측 10 minutes

2 assignments Total 60 minutes

최근접 이웃 & 커널 회귀 30 minutes
k-최근접 이웃 회귀를 이용한 주택 가격 예측 30 minutes

본 과정을 마치며 지금까지 다룬 내용을 정리합니다. 이는 회귀에 특화된 기술은 물론 전문 과정 전반에 걸쳐 나타날 기본적인 머신 러닝 개념을 모두 아우릅니다. 또한 본 강의에서 다루지 않은 몇 가지 중요한 회귀 기술에 대해 간략히 논의합니다. 마지막으로 나머지 전문 과정에서 여러분이 살펴볼 수 있는 사항에 대한 개요를 설명합니다.

What's included

5 videos1 reading

Instructor

Carlos Guestrin

University of Washington

8 Courses 497,896 learners

Offered by

University of Washington

Why people choose Coursera for their career

Felipe M.

Learner since 2018

"To be able to take courses at my own pace and rhythm has been an amazing experience. I can learn whenever it fits my schedule and mood."

Jennifer J.

Learner since 2020

"I directly applied the concepts and skills I learned from my courses to an exciting new project at work."

Larry W.

Learner since 2021

"When I need courses on topics that my university doesn't offer, Coursera is one of the best places to go."

Chaitanya A.

"Learning isn't just about being better at your job: it's so much more than that. Coursera allows me to learn without limits."

Open new doors with Coursera Plus

Unlimited access to 10,000+ world-class courses, hands-on projects, and job-ready certificate programs - all included in your subscription

Learn more

Advance your career with an online degree

Earn a degree from world-class universities - 100% online

Explore degrees

Join over 3,400 global companies that choose Coursera for Business

Upskill your employees to excel in the digital economy

Learn more

Frequently asked questions

To access the course materials, assignments and to earn a Certificate, you will need to purchase the Certificate experience when you enroll in a course. You can try a Free Trial instead, or apply for Financial Aid. The course may offer 'Full Course, No Certificate' instead. This option lets you see all course materials, submit required assessments, and get a final grade. This also means that you will not be able to purchase a Certificate experience.

When you purchase a Certificate you get access to all course materials, including graded assignments. Upon completing the course, your electronic Certificate will be added to your Accomplishments page - from there, you can print your Certificate or add it to your LinkedIn profile.

Yes. In select learning programs, you can apply for financial aid or a scholarship if you can’t afford the enrollment fee. If fin aid or scholarship is available for your learning program selection, you’ll find a link to apply on the description page.