Installation

pip install kaggle

Credential API Key는 다음과 같이 합니다.

  1. kaggle.com 접속
  2. Account -> API -> Create New API Token 버튼 클릭
  3. ~/.kaggle/kaggle.json 위치에 저장

또는 환경변수로 설정할수도 있습니다.

export KAGGLE_USERNAME=datadinosaur
export KAGGLE_KEY=xxxxxxxxxxxxxx

Python Kaggle API

Download Dataset

아래는 IMDB 데이터 다운로드 받는 방법입니다.
utathya/imdb-review-dataset 요 부분만 Kaggle Dataset에서 URL을 카피앤페이스트 하면 됩니다.

import pandas as pd
import kaggle.api as kaggle
from tempfile import gettempdir
from pathlib import Path
data_path = Path(gettempdir()) / 'imdb' / 'imdb_master.csv'

kaggle.authenticate()
kaggle.dataset_download_files('utathya/imdb-review-dataset', data_path.parent, unzip=True)
df = pd.read_csv(data_path, index_col=0)
df.head()