728x90

프로그래밍 3

코딩기록 1 : L사 구매 고객 별 시각화

# 답안 작성을 위해 필요한 패키지 import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt from matplotlib import font_manager, rc %matplotlib inline # 한글 폰트 설정 import platform your_os = platform.system() if your_os == 'Linux': rc('font', family='NanumGothic') elif your_os == 'Windows': ttf = "c:/Windows/Fonts/malgun.ttf" font_name = font_manager.FontProperties(fname=ttf).g..

코딩기록 2023.12.02

하루하루 코딩이야기 4 : XGBoost 실습 - 위스콘신 유방암 예측

오랜만에 포스팅하는 것 같은데 오늘은 정형데이터를 다룰 때 자주 사용하는 기법 중 하나인 Boosting계열 그 중에서도 XGB 실습을 해보려고 한다. import xgboost print(xgboost.__version__) # xgboost 버전 확인 XGBoost는 전통적인 파이썬 래퍼 방식이 있고 사이킷런 방식이 있다. 순서는 파이썬 래퍼 XGBoost -> 사이킷런 래퍼 XGBoost로 소개하겠다. ### 파이썬 래퍼 XGBoost 적용 - 위스콘신 유방암 예측 import xgboost as xgb from xgboost import plot_importance import pandas as pd import numpy as np from sklearn.datasets import load_b..

코딩이야기 2023.12.01

하루하루 코딩이야기 3 : pd.to_datetime(), Datetime feature 다루기

얼마 전에 데이콘에서 열렸던 현대 AI Challenge의 선박 대기시간 예측 데이터를 일부 활용하여 분석 ship data Loading import pandas as pd import datetime # 선박 대기시간 예측 데이터 - 일부만 발췌 ship = pd.read_csv('ship.csv') ship.ATA = pd.to_datetime(ship['ATA']) ship.head() Datetime column인 ATA column을 datetime 형식으로 변환하고 여러 feature 생성하기 1. 연도 : year, 짝수 해, 윤년 ship['year'] = ship.ATA.dt.year # 연도 column 생성 ship['year_2'] = ship.year.apply(lambda x ..

코딩이야기 2023.11.23