Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Java
- 알고리즘
- 오라클
- Python
- 자바 로그 레벨
- 쓰레드 풀
- GIT
- 사이킷런
- 컬렉션 프레임웍
- 컬렉션 인터페이스
- oracle
- db
- 사이킷런 회귀
- conda remove
- WinError5
- URI 원칙
- 스프링 부트3
- 차원증가
- 머신러닝
- h2 데이타베이스
- 셀레니움
- 프로그래머스
- Selenium
- 완주하지못한선수
- streamlit
- 파이썬
- REST API
- 자바 열거형
- 스프링 부트
- openai
Archives
- Today
- Total
목록FP (1)
노트 :
이진 분류 성능 지표 - 정확도, 혼동 행렬(AKA 오차 행렬), ROC곡선
1. 정확도(Accuracy) 혼동 행렬을 알기 위해서는 정확도에 대해 알아야 한다. 정확도는 예측 데이터가 얼마나 정확하게 예측했는 지 나타내는 지표이다.계산법은 아래와 같다. 정확도는 개념과 사용법이 단순하므로 편하게 사용할 수 있다. 그러나 이진 분류 모델의 데이터의 구성에 따라 정확도가 정확하지 않은 지표가 될 수 있다. 예를 들어보자. 코로나 바이러스에 걸린 환자(positive, 1)와 걸리지 않은 정상인(negative, 0)으로 이루어진 데이터가 있다. 새로운 환자의 코로나 바이러스 감염 여부를 확인하고자 할 때, 분류 모델이 예측을 계속해서 '0'으로만 내려도 정확도가 높을 것이다. 여러 변수를 고려하여 정밀 예측을 한 분류 모델보다 정확도가 더 높을 수 있는 이상한 상황이 발생할 수도 ..
ML
2023. 5. 22. 23:13