[하둡 완벽 가이드] Chapter 8. 맵리듀스 타입과 포맷
맵 리듀스 모델에서 데이터를 어떻게 처리하는지 살펴보자. 맵리듀스의 동작 과정이 생각나지 않는다면, 아래의 포스팅을 한 번 다시 보고 오도록 하자.. [하둡 완벽 가이드] chapter2. 맵리듀스맵리듀스란? 데이터 처리를 위한 프로그래밍 모델 병행성을 고려하여 설계되었으며, 대용량 데이터셋에서 유용함. 자바,루비,파이썬등으로 구동 가능 예제에서 다룰 기상 데이터셋의 특성에 대co-yong.tistory.com 하둡 맵리듀스의 함수 형식은 아래와 같다.map : (K1, V1) -> list(K2, V2)combiner : (K2, list(V2)) -> list(K2, V2)partition : (K2,V2) -> integerreduce: (K2, list(V2)) -> list(K3, V3)위..
더보기