일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- SQLD
- sklearn
- Python
- Machine Learning
- django
- 레이블 인코딩
- ML
- data preprocessing
- Cartesina Product
- PARTITION BY
- CROSS JOIN
- 사이킷런
- partition
- 명령어
- 기본
- 머신러닝
- SQL
- 원핫인코딩
- Today
- Total
목록전체 글 (54)
Programming Blog
https://sy-log.tistory.com/60 [Pandas] 데이터프레임 중복 확인 및 제거 :: duplicated, drop_duplicates (unhashable type error 해결) 파이썬 데이터프레임 중복 데이터 다루기 Pandas DataFrame duplication (1) 중복되는 행(Row) 제거하기 :: drop_duplicates 데이터프레임에서 중복되는 행 데이터를 제거할 때, pandas의 drop_duplicates 메소드.. sy-log.tistory.com
- 결측값 들어있는 행 제거 df = df.dropna(axis=0) # axis=0 행 기준 [default] - 결측값 들어있는 열 제거 df = df.dropna(axis=1) # axis=1 열 기준 - 특정 컬럼의 행 결측값 제거 df['Column Name'].dropna(axis=0) # axis=0 행 기준 [default] - 특정 컬럼의 열 결측값 제거 df['Column Name'].dropna(axis=1) # axis=1 열 기준
df = df[df['Column Name'].str.contains('condition text')] Column Name : 컬럼명 condition text : 특정 문자
[전화번호 정규표현식] '\d{2,3}-\d{3,4}-\d{4}' [이메일 정규표현식] [a-zA-Z0-9_-]+@[a-z]+.[a-z]+ [한글 정규표현식] [가-힣]+ [영어 정규표현식] [a-zA-Z]+ [문자 정규표현식] [a-zA-Z가-힣]+ [숫자 정규표현식] 숫자가 한 번 이상 나오는 문자 - [0-9]+ - \d+ 숫자가 아닌 부분을 공백으로 - [^0-9] - [^\\d]