Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 알고리즘
- h2 데이타베이스
- 오라클
- 머신러닝
- 자바 열거형
- 완주하지못한선수
- URI 원칙
- GIT
- REST API
- 스프링 부트
- 스프링 부트3
- conda remove
- 컬렉션 인터페이스
- Selenium
- WinError5
- db
- 컬렉션 프레임웍
- 차원증가
- openai
- 쓰레드 풀
- streamlit
- 파이썬
- 사이킷런 회귀
- Python
- 프로그래머스
- 자바 로그 레벨
- 사이킷런
- oracle
- 셀레니움
- Java
Archives
- Today
- Total
목록사이킷런 (2)
노트 :
Scikit-learn - 데이터 인코딩
머신러닝을 위한 대표적인 인코딩 방식에는 2가지가 있다. ① 레이블 인코딩(Label Encoding) : 카테고리 피처를 숫자 값으로 변환 ② 원-핫 인코딩(One Hot Encoding) : 피처의 개수만큼 칼럼을 만들어 고유값에 해당하는 칼럼에만 1을 표시하고 나머지 칼럼에는 0을 표시 1. 레이블 인코딩 (1) 방식 카테고리 피처인 제품분류를 0~5에 이르는 숫자 값으로 변환한다. (2) 코드 사이킷런의 LabelEncoder 클래스를 임포트한 후, LabelEncoder 객체를 생성한다. 이후 fit()과 transform()의 인자에 리스트로 된 피처를 넣어서 변환한다. 결과값인 label을 출력해보면 ndarray인 [1, 3, 5, 4, 2, 0, 1, 5]가 출력된다. 해당 피처가 어떤 ..
ML
2023. 4. 8. 13:09