본문 바로가기

개발공부47

Q. 리뷰내용 분석 필요 데이터: 데이터 모두 mydata002.dataset2 리뷰 ➜ Review Text 카테고리➜ Department Name 나이 ➜ Age 조회방법 1. 'size' 가 포함된 리뷰이면 1 아니면 0으로 분류 ( 컬럼명 N_Size ) 해석 case when 조건문을 이용하여 리뷰에 size 가 포함되어 있으면 1 아니면 0으로 분류한다. size 가 포함되어 있는가? 를 표현할 때, like 연산자를 사용한다. like 연산는 문자열의 패턴을 검색하여 일치하는지 확인해준다. % : 0~무한대 까지의 문자 _ : 한글자 size 앞 뒤에는 다른 내용이 들어가 있어도 상관이 없기 때문에 %size% 로 비교하게 된다. 그리고 컬럼명은 N_size 로 설정한다. 2. 'size' 가 포함된 리뷰의 개.. 2023. 11. 27.
Q. 카테고리와 연령대 별로 평점이 가장 낮은 데이터 조회 필요 데이터 : 데이터 모두 mydata002.dataset2 카테고리, 상품의 소분류 ➜ Department Name 리뷰의 평점 ➜ Rating 나이 ➜ Age 조회방법 1. 카테고리와 연령대 별 평균 평점 조회 해석 카테고리와 연령대별로 묶기 위해 group by 를 이용하여 그룹화 해준다. 연령대를 구할 때 floor() 버림함수를 이용하여 구해준다. 평균 평점을 구하기 위해 avg() 집계함수를 사용하여 조회해준다. 2. (1) 번의 내용으로 연령대별 평균평점을 기준으로 순위 산출하기 (중복 등수 허용 X) 해석 (1) 번의 내용을 서브쿼리로 이용하고 순위를 산출하기 위해 중복 등수를 허용하지 않는 row_number() 함수를 사용한다. 이때, 연령대별로 조회하기 위해 partition by .. 2023. 11. 26.
Q. 카테고리가 'Bottoms' 인 데이터 중 평점이 낮은 상품의 리뷰 조회 필요 데이터 : 전 글에서 생성했던 테이블 mydata002.data_stat 와 mydata002.dataset2 사용 카테고리, 상품의 소분류 ➜ Department Name 상품 id ➜ Clothing ID 리뷰 ➜ review text 조회방법 1. data_stat 테이블에서 카테고리가 Bottoms 인 데이터 조회하기 해석 where 조건절을 이용하여 `Department Name` 이 Bottoms 인 데이터만 추출해준다. 2. (1) 번에서 조회된 데이터를 dataset2 테이블에서 모두 추출하기 해석 dataset2 에서 모든 데이터를 추출하기 위해 dataset2 의 clothingID 가 ( data_stat 에서 카테고리가 'Bottoms' 인 'Clothing ID' ) 안에 속.. 2023. 11. 25.
Q. 카테고리 별 평점이 낮은 주요 5개의 상품 조회 필요 데이터 : 데이터 모두 classicmodels.dataset2 상품의 소분류 (카테고리) ➜ Department Name 상품 번호 ➜ Clothing ID 리뷰의 평점 ➜ Rating 조회방법 1. 카테고리와 상품별로 묶어 평균 평점을 조회해보자 해석 카테고리와 상품별로 묶기 위해 group by 를 이용하여 그룹화를 해준다. 평균 평점을 구하기 위해 avg() 집계함수를 이용하고 컬럼명을 AVG_RT 로 설정해준다. 2. (1) 번의 내용을 이용하여 'Department Name' 별로 평균 평점 기준 순위를 산출하기 이 때, 중복순위는 없어야 하며 평균 평점이 낮은 것이 1등이다. 해석 순위를 산출하기 위해 row_number() 함수를 사용해준다. row_number() 함수는 중복 순위 .. 2023. 11. 24.
자료구조 - 스택 스택이란? 데이터를 차곡차곡 쌓아 올린 형태의 자료구조입니다. 스택에서의 입출력은 맨 위에서만 일어나며, 스택의 중간에서 데이터를 삭제할 수 없습니다. 그렇기 때문에 후입선출이라는 특징을 가지고 있습니다. LIFO (Last In First Out) 후입선출 스택 용어 Stack Top - 스택 상단 Stack Bottom - 스택 하단 element - 스택에 저장되는 요소 empty Stack - 요소가 하나도 없는 공백 상태의 스택 스택의 구현 stack[ ] 배열에 스택의 요소들을 저장한다고 가정했을 때, 스택에 가장 최근 입력된 자료를 가리키는 top 변수가 필요하며 가장 먼저 들어온 요소는 stack[0] 에 가장 최근에 들어온 요소는 stack[top] 에 저장된다. 스택의 연산 공백상태 검.. 2023. 11. 24.
Q. 쇼핑몰 리뷰 관리 & 조회하기 알고 있어야 하는 내용 ) 컬럼명 사이에 공백이 포함된 경우 ` ` 로 컬럼명을 묶어주어야 한다. floor() : 소수점 첫째자리에서 버림을 해주는 버림함수이다. limit : 결과값의 개수를 제한해준다. sum(1) : 일반적인 sum 함수와는 다르다. 모든 행에 1을 적용해 더해진 값을 알려준다. count(*) : 테이블에서의 행의 수를 직접적으로 집계해준다. 전체 몇개에 데이터가 있는지 ! 필요 데이터 : 데이터 모두 classicmodels.dataset2 상품의 소분류 ➜ Department Name 리뷰의 평점 ➜ Rating 나이 ➜ Age 조회방법 1. 상품의 소분류 별로 평점의 평균을 조회해보자 해석 상품의 소분류인 Department Name 컬럼명에는 공백이 포함되어있기 때문에 `.. 2023. 11. 23.