태블로 | 기능과 용어
·
Tableau
(1) 차원(dimension) vs 측정값(metric)측정값은 집계함수(SUM, AVG, COUNT 등)를 활용해서 계산하고 비교합니다.이름설명예시차원(dimension)측정 기준 또는 분석의 기준유저 아이디, 지역, 상품명 등측정값(metric)측정하는 값 또는 항목매출, 리텐션, 전환율 등(2) 연속형과 불연속형차원과 측정값은 연속형과 불연속형으로 구분연속형하나로 연결 되어 이어진 데이터녹색 측정값과 차원불연속형이어지지 않고 각각 구분되는 개별적인 데이터파란색 측정값과 차원(3) 계산된 필드기존 컬럼을 계산해서 새로운 컬럼 생성상단 분석 → [계산된 필드 만들기] 사용 시 원본 데이터에서 새로운 필드 생성 가능(4) 매개변수계산, 필터 또는 참조선에서 상수 값으로 대체할 수 있는 숫자, 날짜 또는..
태블로 | 데이터 전처리, 테이블 관계 만들기
·
Tableau
데이터 전처리하기컬럼 숨기기데이터 유형 변경테이블 관계 만들기4종류의 테이블 병합 방식 (관계, 유니온, 조인, 블렌딩)`관계` : 조인과 달리 관계는 하나의 테이블로 병합하지 않고 테이블간 관계를 설정해서 뷰에서 필드를 사용할 수 있어요.참고 - 관계와 조인의 차이점조인보다 유연하고 동적인 방법으로 효율적이에요. 실무에서는 조인보다 관계를 많이 활용합니다!`유니온` : 테이블 구조가 같은 형태인 경우, 유니온으로 테이블을 병합할 수 있어요.SQL UNION과 비슷한 개념입니다.2023년 10월, 2023년 11월, 2023년 12월 판매 데이터(테이블 구조가 동일한 형식)를 유니온으로 3가지 테이블을 병합할 수 있어요.`조인` : 테이블은 항상 하나의 테이블로 병합됩니다.SQL의 조인과 비슷한 개념으로..
MySQL 풀이 | Customer Who Visited but Did Not Make Any Transactions
·
SQL
문제 1.  Customer Who Visited but Did Not Make Any TransactionsTable: Visits+-------------+---------+| Column Name | Type    |+-------------+---------+| visit_id    | int     || customer_id | int     |+-------------+---------+visit_id is the column with unique values for this table.This table contains information about the customers who visited the mall. Table: Transactions+----------------+------..
은행 고객 이탈 분석 프로젝트 DAY 1
·
Data Analytics Project
주제 : [분류] 은행 고객 이탈여부 분류사용 데이터 : https://www.kaggle.com/datasets/shubhammeshram579/bank-customer-churn-prediction/data프로젝트 목표 : 고객 데이터를 분석하여 이탈 유저를 예측하는 분류 모델을 개발하고, 이를 통해 고객 유형별 리텐션 향상 전략을 수립한다.프로젝트 핵심내용 : 다양한 머신러닝 모델을 활용하여 성과 지표를 분석해 최적의 모델을 선정하고, 고객을 클러스터링한 후 이탈이 예측되는 그룹별 이탈 방지 전략을 제시한다.필수로 담을 내용 : 1. 모델 별 성과 표 2. 고객 클러스터링 => 구체적인 전략 제시 Bank Customer Churn PredictionPredicting customer churn i..
MySQL 풀이 | Product Sales Analysis I
·
SQL
문제 1.  Product Sales Analysis ITable: Sales+-------------+-------+| Column Name | Type  |+-------------+-------+| sale_id     | int   || product_id  | int   || year        | int   || quantity    | int   || price       | int   |+-------------+-------+(sale_id, year) is the primary key (combination of columns with unique values) of this table.product_id is a foreign key (reference column) to Produ..
MySQL 풀이 | Replace Employee ID With The Unique Identifier
·
SQL
문제 1.  Replace Employee ID With The Unique IdentifierWrite a solution to show the unique ID of each user, If a user does not have a unique ID replace just show null.Return the result table in any order.Example 1:Input: Employees table:+----+----------+| id | name |+----+----------+| 1 | Alice || 7 | Bob || 11 | Meir || 90 | Winston || 3 | Jonathan |+----+----------+EmployeeUN..
MySQL 풀이 | Invalid Tweets
·
SQL
문제 1.  Invalid TweetsWrite a solution to find the IDs of the invalid tweets. The tweet is invalid if the number of characters used in the content of the tweet is strictly greater than 15.Return the result table in any order.The result format is in the following example.Example 1:Input: Tweets table:+----------+-----------------------------------+| tweet_id | content |+-..
머신러닝 실습 | 광고 예산에 따른 일일 매출 예측
·
Python
문제 4.  광고 예산에 따른 일일 매출 예측아래와 같은 데이터가 있다고 가정하겠습니다.데이터를 바탕으로 선형 회귀 모델을 훈련시키고, 회귀식을 작성해주세요.독립 변수(X): 광고예산 (단위: 만원)종속 변수(Y): 일일 매출 (단위: 만원)X=[10, 20, 30, 40, 60, 100]Y=[50, 60, 70, 80, 90, 120]회귀식을통해, 새로운 광고예산이 1,000만원일 경우의 매출을 예측(계산)해주세요. 그리고 이에 대한 해석을 간략하게 설명해주세요.결과 제출형태회귀식코드와 결과값해석💡 문제 풀이 `내 풀이`import numpy as npfrom sklearn.linear_model import LinearRegression# 독립 변수(X): 광고예산 (단위: 만원)X=np.array..
통계 실습 | 기초 통계, t검정(단측검정/양측검정), 카이제곱검정
·
Python
문제 1.  기초 통계statistics csv 파일을 읽고, 성별 Review Rating 에 대한 평균과 중앙값을 동시에 구해주세요. 결과는 소수점 둘째자리까지 표현해주세요. 그리고 이에 대한 해석을 간략하게 설명해주세요.결과 제출형태코드와 결과값해석💡 문제 풀이 `내 풀이`# [ 문제1번 ]import pandas as pdimport numpy as np import scipy.stats as statsfrom datetime import datetime, timedeltastatistics = pd.read_csv('statistics.csv')statistics_gender_rating = statistics.groupby('Gender')['Review Rating'].agg(['mean'..
Python 실습 | 학생 성적 관리 시스템
·
Python
문제 2.  학생 성적 관리 시스템다음 요구사항에 맞게 3개의 함수를 작성하세요.학생들의 이름과 성적을 딕셔너리에 저장하고, 출력하는 함수를 작성하세요. (add_student(grades, name, score))성적 평균을 반환하는 함수를 작성하세요. (calculate_average(grades))최고 점수 학생을 반환하는 프로그램 작성하세요. (find_top_students(grades))출력결과를 참고하여, 같은 양식으로 출력되도록 함수를 작성하세요.힌트: 딕셔너리 자료형에서 max와 min값 구하는 방법에 대해 필요한 경우, 아래 링크를 참고하세요. https://note.nkmk.me/en/python-dict-value-max-min/Skeleton codedef add_student(g..