머신러닝 실습 | 광고 예산에 따른 일일 매출 예측
·
Python
문제 4.  광고 예산에 따른 일일 매출 예측아래와 같은 데이터가 있다고 가정하겠습니다.데이터를 바탕으로 선형 회귀 모델을 훈련시키고, 회귀식을 작성해주세요.독립 변수(X): 광고예산 (단위: 만원)종속 변수(Y): 일일 매출 (단위: 만원)X=[10, 20, 30, 40, 60, 100]Y=[50, 60, 70, 80, 90, 120]회귀식을통해, 새로운 광고예산이 1,000만원일 경우의 매출을 예측(계산)해주세요. 그리고 이에 대한 해석을 간략하게 설명해주세요.결과 제출형태회귀식코드와 결과값해석💡 문제 풀이 `내 풀이`import numpy as npfrom sklearn.linear_model import LinearRegression# 독립 변수(X): 광고예산 (단위: 만원)X=np.array..
통계 실습 | 기초 통계, t검정(단측검정/양측검정), 카이제곱검정
·
Python
문제 1.  기초 통계statistics csv 파일을 읽고, 성별 Review Rating 에 대한 평균과 중앙값을 동시에 구해주세요. 결과는 소수점 둘째자리까지 표현해주세요. 그리고 이에 대한 해석을 간략하게 설명해주세요.결과 제출형태코드와 결과값해석💡 문제 풀이 `내 풀이`# [ 문제1번 ]import pandas as pdimport numpy as np import scipy.stats as statsfrom datetime import datetime, timedeltastatistics = pd.read_csv('statistics.csv')statistics_gender_rating = statistics.groupby('Gender')['Review Rating'].agg(['mean'..
Python 실습 | 학생 성적 관리 시스템
·
Python
문제 2.  학생 성적 관리 시스템다음 요구사항에 맞게 3개의 함수를 작성하세요.학생들의 이름과 성적을 딕셔너리에 저장하고, 출력하는 함수를 작성하세요. (add_student(grades, name, score))성적 평균을 반환하는 함수를 작성하세요. (calculate_average(grades))최고 점수 학생을 반환하는 프로그램 작성하세요. (find_top_students(grades))출력결과를 참고하여, 같은 양식으로 출력되도록 함수를 작성하세요.힌트: 딕셔너리 자료형에서 max와 min값 구하는 방법에 대해 필요한 경우, 아래 링크를 참고하세요. https://note.nkmk.me/en/python-dict-value-max-min/Skeleton codedef add_student(g..
Python 실습 | 범주형 변수를 수치형 변수로 바꾸기
·
Python
문제 1.  선행커맨드import seaborn as snsimport pandas as pdSeaborn 라이브러리에서 제공하는 Diamond 데이터셋을 활용하여 다음을 수행하세요:x, y, z 중 하나라도 0인 데이터를 삭제하세요x, y, z 를 곱해 'volume' 칼럼을 생성하세요.범주형 변수인 cut, color, clarity를 머신러닝 모델에 활용할 수 있도록 수치형으로 변환합니다. cut: Fair = 1, Good = 2, Very Good = 3, Premium = 4, Ideal = 5로 인코딩하세요.color: E, I, J, H, F, G, D를 각각 1부터 7로 인코딩하세요.clarity:SI2와 SI1 → 1 (S 그룹),VS1와 VS2 → 2 (VS 그룹),VVS2와 VVS1..
머신러닝 공부 | 선형회귀분석
·
Python
1. 선형회귀 사례몸무게와 키 상관관계를 찾아내기weights = [87,81,82,92,90,61,86,66,69,69]heights = [187,174,179,192,188,160,179,168,168,174]2. 선형회귀 이론공통Y는 종속 변수, 결과 변수X는 독립 변수, 원인 변수, 설명 변수통계학에서 사용하는 선형회귀 식 : $$ Y = \beta_0 + \beta_1X + \varepsilon $$β0 : 편향(Bias)  β1 : 회귀 계수ε : 오차(에러), 모델이 설명하지 못하는 Y의 변동성머신러닝/딥러닝에서 사용하는 선형회귀 식 : $$ Y = wX+b $$w: 가중치b: 편향(Bias)두 수식이 전달하려고 하는 의미는 같아요. 회귀 계수 혹은 가중치를 값을 알면 X가 주어졌을 때 Y를..
Python 실습 | penguins 데이터셋에서 평균보다 작은 데이터 선택하고(transform), 새로운 열 추가해서 조건에 따라 다른 값 넣기 (lambda)
·
Python
문제 2.   Seaborn 라이브러리에서 제공하는 Penguins 데이터셋을 활용하여 다음을 수행하세요:1) Penguins 데이터셋을 불러옵니다.2) bill_length_mm이 species별 bill_length_mm의 평균(”mean_bill_length”)보다 작은 데이터를 선택하세요.3) 선택된 데이터에 새 열을 추가하여, bill_length_mm과 bill_depth_mm을 조합하여 다음과 같은 규칙으로 계산한 값을 저장하세요:bill_length_mm * 0.5 + bill_depth_mm * 0.3 새 열의 이름은 weighted_bill로 지정하세요.4) weighted_bill이 25 이상인 행만 추가로 필터링하여 출력하세요.5) species 값의 문자열 길이가 6보다 크면 "l..
Python 실습 | 윤년/평년 구하기
·
Python
선행 커맨드import seaborn as snsimport pandas as pd문제 1.  윤년이면 True, 윤년이 아니면 False를 출력하는 코드를 작성하세요4로 나누어떨어지는 해는 윤년으로 한다. (2016년, 2020년, 2024년 등등)4와 100으로 나누어떨어지는 해는 평년으로 한다. (1900년, 2100년, 2200년)4, 100, 400으로 나누어떨어지는 해는 윤년으로 한다. (2000년, 2400년)Skeleton Codeyear = int(input("연도를 입력하세요: "))"""코드 입력"""💡 문제 풀이 `내 풀이`year = int(input("연도를 입력하세요: "))if year % 400 == 0 : print(True)elif year % 100 == 0 :..
Python 실습 | 공공데이터포털 오픈API를 파이썬에 연결하는 방법
·
Python
지훈님이 상세하게 설명 정리해주셨다👍👍👍원래는 데이터 분석가가 개발자에게 오픈API 데이터 요청해야 하나, (원래는 개발자의 영역)오픈 API를 불러올 줄 안다면 개발자에게 요청하는 단계를 거치지 않아도 되어 매우 효율적공공데이터포털(https://www.data.go.kr/) 오픈API 사용하기🌐 포털홈페이지 🌐 단계1.회원 가입 후 원하는 데이터 선택2.오픈API → 활용신청3. 홈페이지 우 상단 마이페이지 → 데이터활용 → Open API → 활용신청 현황4. 데이터가 ‘승인되어 활용중인 단계’가 되었는지 확인5. 데이터 선택 후 데이터포맷 유형 중 ‘XML’이 포함되어 있는 지 확인 (XML을 가르쳐주셨음)❗인증키 외부에 공개되지 않게 주의❗6. 인증키 찾기(1) 일반 인증키 (Encod..
통계 실습 | 파이썬으로 중심극한정리(CLT) - 각 분포의 표본의 평균 시각화
·
Python
문제 6.  중심극한정리(CLT) - 각 분포의 표본의 평균 시각화출제의도중심극한 정리를 구현하기 위해 부트스트래핑을 구현할 수 있다.이론을 시뮬레이션하여 간접 증명을 할 수 있다.matplot을 이용하여 데이터를 시각화 할 수 있다.문제numpy.choice 함수를 이용하여 각 분포 평균을 내고 이를 500번 반복하여 표본 평균을 생성해 봅시다. (ex bionmial_data 에서 30개씩 뽑아 500번 반복)표본의 평균들을 히스토그램으로 시각화여 정규분포를 따르는지 확인해봅시다.변수num_samples : 표본추출할 횟수sample_means: 딕셔너리 자료형으로 Binomal, Uniform, Normal 의 Key값을 가지며 해당하는 values들은 각 30개씩 복원추출하여 뽑은 샘플의 평균 값..
통계 실습 | 파이썬으로 중심극한정리(CLT) - 데이터 생성하기
·
Python
문제 5.  파이썬으로 중심극한정리(CLT) 1.데이터 생성하기출제의도이론을 시뮬레이션하여 간접 증명을 할 수 있다.중심극한 정리를 위한 데이터 생성을 scipy 모듈의 rvs 함수를 이용해 할 수 있다.matplot을 이용하여 데이터를 시각화 할 수 있다.문제scipy.stats 모듈에서 다음 분포를 생성하고 히스토그램으로 표현하기(subplots권장)변수이항 분포 샘플 변수명 binomial_data: 확률 0.5의 시행을 10번 시행했을때 성공할 갯수의 1000개의 표본 생성ex 동전 10번 던졌을때 앞면이 나올 수 있는 수는 0부터 10개균등 분포 샘플 변수명 uniform_data : 시작 0, 끝 10의 표본 1000개 생성표준 정규 분포 샘플 변수명 normal_data : 표본 1000개 ..