본문 바로가기

DVC

Local 원격저장소를 통해 DVC 사용하기 위와 같은 이유로... 구글 드라이브와의 연동은 결국 포기했다..Colab DVC를 상상했는데.... 흑이전에 GCP에서 진행하였던것과 달리, 이번에는 대신 local환경을 원격저장소로 사용해 보았다! 먼저, dvc파일들을 github에서도 확인할 수 있으면 좋을 것 같아서 git의 원격 저장소를 github로 설정해 주었다.방법은 1. github repository 생성2.  git remote add origin 3. git push -u origin main (github사이트가 켜지면 인증)으로 비교적 간단하다. 이후 git remote -v를 통해 확인해 볼 수 있다. 이제 local 원격저장소로 사용할 디렉터리를 생성해 준 후,dvc remote add -d 를 통해 DVC의 원격저장소를.. 더보기
DVC : Data Version Control DVC의 사용 목적과 방법에 대해 정리해보고자 한다.DVC란?머신러닝 모델을 사용하는 과정에서, 담겨지는 데이터나 이용하는 모델이 지속적으로 바뀌는데, 이에 대한 버전관리를 도와주는 도구로 "데이터를 위한 Git" 이라고 생각하면 이해하기 쉽다. DVC의 작동 방식  Local Cache를 두어, 데이터 중복 방지 및 빠른 데이터 접근을 제공 (해시 기반 관리) Local Workspace와 Local cache에 중복으로 데이터를 저장하는것을 방지하고자,작업공간의 캐시된 데이터에 대해 파일 링크를 생성. reflink(Copy-on-Write),  hardlink, symlink 中 1세 가지 모두 해당 파일 시스템에서 지원하지 않는다면 copy(직접 복사)의 방식을 사용하여 캐시에 저장메타데이터를 ... 더보기