Google Colab
1. Google Colab
1.1 Session Timeout 우회하기
다음을 실행시켜서 주기적으로 자동으로 버튼을 누르게 만듭니다.
function ClickConnect(){
console.log("Working");
document.querySelector("#top-toolbar > colab-connect-button").shadowRoot.querySelector("#connect").click();
}
var clicker = setInterval(ClickConnect,60000);
끌때는 다음과 같이 합니다.
clearInterval(clicker);
1.2 Mounting Google Drive to Colab
Google Colab notebook이 google drive에 access 할 수 있도록 만듭니다.
Google Colab의 특정 위치에 실제로 구글 드라이브를 USB 마운트 시키듯이 올리는 것 입니다.
튜토리얼 시작전, Google Drive에서 /data 디렉토리를 먼저 만들고 시작합니다.
drive.mount(“/data”) 라는 뜻은 현재 구글 코랩 서버에서 /data 디렉토리에 마운트 시키겠다는 뜻이지, 구글 드라이브의 위치를 가르키는게 아닙니다.
from google.colab import drive
drive.mount('/data')
1.3 Kaggle API
구글 드라이브에 이미 kaggle.json 파일이 존재해야 합니다.
해당 파일은 Kaggle에서 secret으로 다운로드 받을 수 있습니다.
from google.colab import drive
drive.mount('/data')
!pip install kaggle -q
!mkdir -p ~/.kaggle
!cp /data/MyDrive/data/secrets/kaggle.json ~/.kaggle/
!chmod 400 ~/.kaggle/kaggle.json
1.4 Loading Kaggle Dataset
아래는 movielens 예제 입니다.
import pandas as pd
import kaggle.api as kaggle
from tempfile import gettempdir
from pathlib import Path
data_dir = Path(gettempdir()) / 'movielens'
kaggle.authenticate()
kaggle.dataset_download_files('grouplens/movielens-20m-dataset',
data_dir,
unzip=True)