통계 실습 | 파이썬으로 카이제곱검정
·
Python
문제 4.  카이제곱검정출제의도귀무가설과 대립가설을 설정할 수 있다.카이제곱 검정을 이해하고 올바르게 해석할 수 있다.카이제곱 검정 함수에 적절한 전달인자를 넣을 수 있다.문제다음 click_rate 데이터는 헤드라인별 클릭과 클릭하지 않은 수 에 대한 데이터입니다.귀무가설과 대립가설을 설정하세요.카이제곱 검정 수행하여 실제로 클릭률에 대한 차이가 있는지 유의수준 0.05 에서 검정해보세요.Skeleton codeimport pandas as pdfrom scipy import stats# URL 로 데이터 가져오기url = "https://raw.githubusercontent.com/gedeck/practical-statistics-for-data-scientists/master/data/click_..
통계 실습 | 파이썬으로 이표본 t 검정
·
Python
문제 3.  이표본 t 검정출제의도귀무가설과 대립가설을 설정할 수 있다.t검정에 이해하고 올바르게 해석할 수 있다.t검정에 적절한 전달인자를 넣을 수 있다.문제목초에 따른 우유의 생산량을 알아보기위하여 25마리 젖소를 대상으로 3주동안 임의로 추출된 12마리 젖소에게 건조시킨 목초를 주고 13마리 젖소에게는 들판에서 말린 목초를 주었다.두 종류의 모 표준편차는 같다고 가정하고 또한 우유생산량의 자료는 정규분포를 따른다고 가정한다.자연적으로 말린 목초의 사육하는 젖소의 우유생산량이 인공적으로 말린 목초로 사용하는 젖소보다 많다고 할 수 있는지 유의수준 0.05 에서 검정하세요.(단측 검정)Skeleton codeimport numpy as npfrom scipy import statsnature = [44..
통계 실습 | 파이썬으로 신뢰구간 구하기
·
Python
문제 2.  파이썬으로 신뢰구간 구하기출제의도scipy 의 함수를 이용해서 신뢰구간을 구합니다.문제평균이 µ이고 표준편차가 σ = 8인 정규분포를 따르는 모집단에서 크기가 25인 표본을 추출하여 평균을 계산하였더니 x̅가 42.7 이다. 이때 µ에 대한 95% 신뢰 구간을 구하라.Skeleton codeimport scipy.stats as statsimport numpy as np# 주어진 값들sigma = 8 # 모집단의 표준편차n = 25 # 표본 크기x_bar = 42.7 # 표본 평균confidence_level = 0.95 # 신뢰 수준'''여기에 코드를 넣으세요'''# 결과 출력print(f"95% 신뢰 구간: ({lower_bound:.2f}, {upper_bound:.2f})")출..
통계 실습 | 파이썬으로 변동계수 구하기
·
Python
문제 1. 변동계수 구하기출제의도평균과 표준편차를 구하는 함수를 사용할 수 있습니다.모집단과 샘플의 차이를 구분합니다.Numpy 혹은 Pandas를 이용한 변동계수를 계산해봅니다.문제회사 주식에 투자하고자 합니다. 하지만 보수적인 나는 변동성이 크지 않은 회사를 골라 안정적인 투자를 희망합니다. 이를 위해 2가지 회사로 좁혔고 A,B회사의 6일간 주가 데이터를 수집하였습니다. Numpy 혹은 Pandas를 이용하여 회사의 변동계수를 구해봅시다.변수명cv_a_np : a 회사의 변동계수cv_b_np : b 회사의 변동계수Skeleton codeimport numpy as npcom_a = [76300, 77400, 77900, 77200, 76900, 78800]com_b = [6400, 7000, 740..
MySQL 풀이 | Find Customer Referee
·
SQL
문제 1.  Find Customer RefereeTable: Customer+-------------+---------+| Column Name | Type    |+-------------+---------+| id          | int     || name        | varchar || referee_id  | int     |+-------------+---------+In SQL, id is the primary key column for this table.Each row of this table indicates the id of a customer, their name, and the id of the customer who referred them. Find the names ..
통계 공부 | 파이썬으로 정규분포, 이항분포 시각화(matplotlib subplot)
·
Python
실습하면서 도움된 자료 정리파이썬으로 균일분포, 정규분포, 감마분포, 이항분포 그리기 python으로 균일분포, 정규분포, 감마분포, 이항분포 구현하기참고사이트 https://www.datacamp.com/community/tutorials/probability-distributions-python 영어해석 (Tutorial) Probability Distributions in Python Learn about commonly used PROBABILITY DISTRIBUTIONS in MACHINE LEARNING literature. Such as Uniform, Nbinggamel.tistory.com파이썬Matplotlib Subplot 활용해서 그래프 여러개 그리는 방법plt.subplot(O행..
MySQL 풀이 | 고객이 상품 X 구매 시 상품 Y도 함께 구매할 확률 + 미니 분석
·
SQL
문제 3.  고객이 상품 X를 구매할 때 상품 Y도 함께 구매할 확률테이블 설명cart_products 테이블은 쇼핑 카트에서 주문된 아이템에 대한 정보를 담고 있습니다. 테이블 구조는 다음과 같으며, ID, CART_ID, NAME, PRICE는 각각 제품 ID, 주문 번호, 제품 이름, 개별 제품 가격을 나타냅니다.컬럼명 타입 설명IDINT제품 IDCART_IDINT주문 번호NAMEVARCHAR제품 이름PRICEINT제품 가격 (원 단위)분석해야 할 내용은 다음과 같습니다 :데이터 분석팀은 고객이 특정 상품 X를 구매했을 때 상품 Y도 함께 구매할 확률을 분석하고자 합니다. 이를 위해, 쇼핑 카트 데이터에서 서로 다른 두 제품 X와 Y가 같은 주문(CART_ID)에 포함된 주문 수를 확인하려고 합니다..
MySQL 풀이 | 결제 없이 주문한 사용자 찾기 (난이도 중)
·
SQL
문제 2.  결제 없이 주문한 사용자 찾기 (난이도 중)테이블 설명 :payments 테이블은 사용자의 결제 정보를 포함합니다. 테이블 구조는 다음과 같으며, ID, USER_ID, AMOUNT, PAY_DATE, 그리고 PAYMENT_TYPE은 각각 결제 ID, 사용자 ID, 결제 금액, 결제 날짜, 결제 유형(카드, 현금 등)을 나타냅니다.컬럼명 타입 설명IDINT결제 ID (PK)USER_IDVARCHAR사용자 IDAMOUNTINT결제 금액PAY_DATEDATETIME결제 날짜PAYMENT_TYPEINT결제 유형 (0: 현금, 1:카드)orders 테이블은 사용자의 상품 배송 정보를 포함합니다. 테이블 구조는 다음과 같으며, ID, USER_ID, ORDER_DATE, 그리고 ITEM은 각각 주문 ..
MySQL 풀이 | 지역별로 매출이 가장 높은 매장의 매출 찾기 (난이도 하)
·
SQL
문제 1. 지역별로 매출이 가장 높은 매장의 매출 찾기 (난이도 하)stores 테이블은 각 매장에 대한 정보를 담고 있습니다. 테이블 구조는 다음과 같으며, STORE_NAME, REGION_NAME, SALES, EMPLOYEES, OPEN_DATE, TYPE은 각각 매장 ID, 지역 이름, 매출, 직원 수, 개점일, 매장 유형을 나타냅니다.컬럼명 타입 설명STORE_IDVARCHAR매장 ID (PK)REGION_NAMEVARCHAR지역 이름SALESNUMERIC매출EMPLOYEESINT직원 수OPEN_DATEDATE개점일TYPEVARCHAR매장 유형분석해야 할 내용은 다음과 같습니다 :지역별로 매출이 가장 높은 매장의 매출을 조회하는 SQL 문을 작성해주세요.단, 해당 지역에 매장이 두 개 이상인 ..
MySQL 실습 | Recyclable and Low Fat Products
·
SQL
문제 1.  Recyclable and Low Fat ProductsWrite a solution to find the ids of products that are both low fat and recyclable.Return the result table in any order. The result format is in the following example.Example 1:Input: Products table:+-------------+----------+------------+| product_id  | low_fats | recyclable |+-------------+----------+------------+| 0           | Y        | N          || 1   ..