안녕하세요 pulluper 입니다. 😀
이번 포스팅에서는 Logistic Regression model 에 대하여 알아보겠습니다.
이전의 [Linear Regression] 에서는 종속변수 Y가 연속적 이었습니다. 즉, 철수가 시험공부시간을 예측하는데, 예측점수 y는 0~100 까지의 연속적인 data입니다. 그런데, 만약 이번에는 종속변수가 범주형 (0, 1 혹은 여러 class) 이라면 그대로 Linear Reression 을 사용하기는 문제가 있습니다. 다음 그림에서 x축은 공부 시간이고, y축은 시험에 합격, 불합격을 나타내는 0, 1 의 binary label 입니다.

이를 linear regression 으로 다음과 같은 직선을 얻었다고 가정해 봅시다. y = 0.25x - 0.5 그리고 자료들을 이 직선에 넣었을 때, 0.5 이상인 값들을 합격으로, 그 이하는 불합격으로 판단 할 수는 있습니다.

그런데, 아래 그림과 같이 새로운 data 가 들어왔을 때, 기존의 판단의 근거로 사용했던 직선에서 오른쪽 점선 직선으로 변경이 됩니다, 이를 기준으로 사용하기에는 0.5라는 수치는 판단오류를 너무 많이 나게 합니다. 이렇듯 Linear Regression 은 이상치에 대하여 민감한 단점이 있습니다. 그리고 어느 직선이든 기울기가 0이 아니면 그 범위는

그러면 범주형 data는 어떻게 regression 하면 좋을까요? 바로 logistic regression을 이용하면 됩니다! logit을 알기 전에 먼저 odds 의 개념부터 정리하고 가겠습니다.
Odds란 성공횟수 / 실패횟수 에 관한 비입니다. 예를들어, 주사위를 던질 때, (1, 3)이 나오면 승리하는 것이고, (2, 4, 5, 6) 이 나오면 패배 하는 게임에서
Logit 은 odds 에 log 를 취한것과 같습니다. 이때, 치역이

logit 을 a 라고 가정하고, p에 대하여 정리를 하면, 다음과 같이
그렇다면, linear regression 을

이제 sigmoid 함수를 이용한 output에 대하여, 어떻게 학습을 하는지 알아보겠습니다.
Linear regression 에서 사용했던 OLS/ GD / MLE 를 사용해보겠습니다
OLS (ordinary least square) 를 사용해보려 하는데, 다음과 같은 의견이 있었습니다. sigmoid function 은 OLS 같은 방식을 배제시킨다는.. 따라서 GD, newton 방법, MLE 등을 이용해야 합니다.
How To Solve Logistic Regression Using Ordinary Least Squares?
I was self-learning machine learning. I came upon this section of the Wikipedia page on Logistic regression, where it claims Because the model can be expressed as a generalized linear model (see...
stats.stackexchange.com

MLE
logistic regression은 binary cross entropy 의 loss 를 사용합니다. 이번에 MLE를 통해서 BCE의 유도과정을 알아보겠습니다.
위에서 구한
이는 bernoulli 분포를 가진다고 가정하기 적당합니다. bernoulli 는 확률변수 Y 에 대하여 다음과 같은 pdf를 갖습니다,
이를 정리하면,
이를 정리하면
GD (Gradient Descent)
이제 위에서 구한 binary cross entropy 함수
Quiz
오늘 다뤘던 내용을 마무리 하기전 quiz 로 복습을 해 보겠습니다.
1. odds 란?
2. logit 이란?
3. sigmoid 유도과정은?
4. bernoiulli 분포란?
5. binary cross entropy 를 MLE 를 통해 유도한다면?
이번에는 두가지 클래스 분류를 할 수 있는 Logistic Regression에 대하여 sigmoid 와 binary cross entropy 에 대하여 알아보았습니다. 다음 포스팅에서는 multi class 에 대한 분류를 할 수 있는 softmax regression 에 대하여 알아보겠습니다. 질문과 토론은 항상 환영합니다. 감사합니다~뿅!! 😎😎😎
reference :
https://hyunlee103.tistory.com/12
[머신러닝] Logistic Regression(MLE와 Bayesian inference를 통한 확률론적 접근)
스탠퍼드 머신러닝 3주차인 Logistic Regression 강의를 듣는데, 여기서 사용되는 Cost function이 MLE 기반으로 유도된다는 얘기를 듣고 아예 MLE 기반의 estimator들과 cross-entropy까지 한꺼번에 공부해서 정..
hyunlee103.tistory.com
https://nittaku.tistory.com/478
5-6. 로지스틱 회귀분석(Logistic Regression)
로지스틱 회귀분석 지금까지 학습한 선형 회귀분석 단순/다중은 모두 종속변수Y가 연속형 이었다. 로지스틱회귀분석 은 종속변수가 범주형이면서 0 or 1 인 경우 사용하는 회귀분석이다. 로지스
nittaku.tistory.com
https://csm-kr.tistory.com/35?category=1268905
'Basic ML' 카테고리의 다른 글
[Theme 06] Perceptron, XOR, MLP, Universal Approximation Theorem (3) | 2023.01.24 |
---|---|
[Theme 05] MLE (Maximum likelihood estimation) 을 통한 Loss (0) | 2022.07.05 |
[Theme 04] Multinomial Logistic Regression (Softmax Regression) (0) | 2022.06.30 |
[Theme 02] Linear Regression(선형회귀) (Feat. OLS/GD/MLE) (4) | 2022.04.28 |
[Theme 01] What is Artificial Intelligence / Machine Learning / Deep Learning? (2) | 2022.03.30 |
댓글