본문 바로가기

인턴

RNN, LSTM, GRU, Transformer model RNN이 무엇인지, 관련 모델들이 어떻게 진화해왔는지에 대해 알아보도록 하자.*본 글에서 수식은 다루지 않습니다. RNN(1986) -> LSTM(1997) -> GRU(2014) -> Transformer model(2017) RNN이란?Recurrent Neural network의 약자로, 순환 신경망이라고도 한다.Nueral network의 주요 아키텍쳐 중 하나이며, 이외로는 CNN, GNN 등이 있다.시계열 데이터나 순차 데이터를 처리하는 데 특화된 신경망 구조이다. 입력 계층 : 처리할 정보를 수신출력 계층 : 결과를 제공은닉 계층 : 데이터 처리, 분석 및 예측위의 3계층으로 보통 구성된다.  Recurrent에서 생각해 볼 수 있듯이, RNN모델은 은닉층의 노드에서 나온 결괏값을 출력층으로.. 더보기
DVC : Data Version Control DVC의 사용 목적과 방법에 대해 정리해보고자 한다.DVC란?머신러닝 모델을 사용하는 과정에서, 담겨지는 데이터나 이용하는 모델이 지속적으로 바뀌는데, 이에 대한 버전관리를 도와주는 도구로 "데이터를 위한 Git" 이라고 생각하면 이해하기 쉽다. DVC의 작동 방식  Local Cache를 두어, 데이터 중복 방지 및 빠른 데이터 접근을 제공 (해시 기반 관리) Local Workspace와 Local cache에 중복으로 데이터를 저장하는것을 방지하고자,작업공간의 캐시된 데이터에 대해 파일 링크를 생성. reflink(Copy-on-Write),  hardlink, symlink 中 1세 가지 모두 해당 파일 시스템에서 지원하지 않는다면 copy(직접 복사)의 방식을 사용하여 캐시에 저장메타데이터를 ... 더보기