Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 컬렉션 프레임웍
- 파이썬
- URI 원칙
- 스프링 부트3
- oracle
- 자바 로그 레벨
- h2 데이타베이스
- 셀레니움
- 자바 열거형
- db
- conda remove
- 컬렉션 인터페이스
- 사이킷런
- GIT
- openai
- Python
- 쓰레드 풀
- 프로그래머스
- 스프링 부트
- 사이킷런 회귀
- streamlit
- Java
- 오라클
- 차원증가
- Selenium
- 머신러닝
- WinError5
- 완주하지못한선수
- 알고리즘
- REST API
Archives
- Today
- Total
목록Scikit-Learn (1)
노트 :
Scikit-learn - 데이터 인코딩
머신러닝을 위한 대표적인 인코딩 방식에는 2가지가 있다. ① 레이블 인코딩(Label Encoding) : 카테고리 피처를 숫자 값으로 변환 ② 원-핫 인코딩(One Hot Encoding) : 피처의 개수만큼 칼럼을 만들어 고유값에 해당하는 칼럼에만 1을 표시하고 나머지 칼럼에는 0을 표시 1. 레이블 인코딩 (1) 방식 카테고리 피처인 제품분류를 0~5에 이르는 숫자 값으로 변환한다. (2) 코드 사이킷런의 LabelEncoder 클래스를 임포트한 후, LabelEncoder 객체를 생성한다. 이후 fit()과 transform()의 인자에 리스트로 된 피처를 넣어서 변환한다. 결과값인 label을 출력해보면 ndarray인 [1, 3, 5, 4, 2, 0, 1, 5]가 출력된다. 해당 피처가 어떤 ..
ML
2023. 4. 8. 13:09