Kaggle API
Installation
pip install kaggle
Credential API Key는 다음과 같이 합니다.
- kaggle.com 접속
- Account -> API -> Create New API Token 버튼 클릭
- ~/.kaggle/kaggle.json 위치에 저장
또는 환경변수로 설정할수도 있습니다.
export KAGGLE_USERNAME=datadinosaur
export KAGGLE_KEY=xxxxxxxxxxxxxx
Python Kaggle API
Download Dataset
아래는 IMDB 데이터 다운로드 받는 방법입니다.
utathya/imdb-review-dataset
요 부분만 Kaggle Dataset에서 URL을 카피앤페이스트 하면 됩니다.
import pandas as pd
import kaggle.api as kaggle
from tempfile import gettempdir
from pathlib import Path
data_path = Path(gettempdir()) / 'imdb' / 'imdb_master.csv'
kaggle.authenticate()
kaggle.dataset_download_files('utathya/imdb-review-dataset', data_path.parent, unzip=True)
df = pd.read_csv(data_path, index_col=0)
df.head()