일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 사이킷런
- django
- Cartesina Product
- PARTITION BY
- 머신러닝
- data preprocessing
- Machine Learning
- 원핫인코딩
- 기본
- ML
- SQL
- partition
- Python
- SQLD
- sklearn
- CROSS JOIN
- 레이블 인코딩
- 명령어
- Today
- Total
목록SQLD 정리 (4)
Programming Blog
Cartesian Product(곱집합) A와 B를 서로 JOIN할 때, JOIN 조건을 생략하고 두 테이블의 모든 행을 조인 모든 조합으로 많은 결과 출력 > 과부화 가능성 CROSS JOIN 사용 원본 데이터 예제1. CROSS JOIN 미사용 SELECT ENAME, DNAME FROM EMP, DEPT ORDER BY ENAME; 예제2. CROSS JOIN 사용 SELECT ENAME, DNAME FROM EMP CROSS JOIN DEPT ORDER BY ENAME;
EQUI JOIN(등가 조인) 조인 조건이 정확히 일치하는 경우에 사용 > PK(기본키) 와 FK(외래키)를 사용한 조인 조인 조건에 ' = ' 를 이용하는 조인 예제1. 일반적인 EQUI JOIN SELECT * FROM EMP e INNER JOIN DEPT d ON e.deptno = d.deptno; 예제2. USING 문을 사용한 EQUI JOIN SELECT * FROM EMP e INNER JOIN DEPT d USING (deptno); 예제3. 잘못된 USING문 사용 SELECT * FROM EMP e INNER JOIN DEPT d USING (e.deptno = d.deptno); * USING 문에서는 PK(기본키)와 FK(외래키)가 중복되는 속성 이름 1개만 작성한다.
PARTITION 함수 그룹 내 순위 및 그룹별 집계를 구할 때 유용하게 사용할 수 있다. SELECT 순위함수() OVER(PARTITION BY 컬럼명 ORDER BY 컬럼명) FROM 테이블명 SELECT 집계함수() OVER(PARTITION BY 컬럼명) FROM 테이블명 순위함수 ROW_NUMBER RANK DENSE_RANK 집계함수 SUM(합계) AVG(평균) MAX, MIN(최대,최소) COUNT(개수) 활용할 원본 데이터 예제1. 전체 인원의 급여 순위 SELECT deptno "부서", ename "직원이름", sal "급여", RANK() OVER(ORDER BY SAL DESC) AS "순위" FROM EMP; 예제2. 각 부서 내에서 직원의 급여 순위 SELECT deptno "..
데이터 모델링의 중요성 및 유의점 - 중복 : 같은 시간 같은 데이터 제공 - 비유연성 : 사소한 업무변화에 데이터 모델이 수시로 변경되면 안됨 - 비일관성 : 신용 상태에 대한 갱신없이 고객의 납부 이력 정보 갱신 안됨 데이터 모델링 개념적, 논리적, 물리적 모델링 데이터 독립성 요소 외부 스키마 : 개개인 사용자가 보는 개인적 DB 스키마 개념 스키마 : 모든 사용자 관점을 통합한 전체 DB 내부 스키마 : 물리적 장치에서 데이터가 실제적 저장 데이터 독립성 논리적 독립성 : 개념 스키마가 변경되어도 외부 스키마에 영향 x 물리적 독립성 : 내부 스키마가 변경되어도 외부/개념 스키마에 영향 x Mapping(사상) : 상호 독립적인 개념을 연결시켜주는 다리(역할) 데이터 모델링의 3요소 - 어떤 것(..