[AWS] S3 버킷의 파일들은 왜 오브젝트라는 이름으로 불리는가?
AWS S3에서 파일을 “오브젝트(Object)”라고 부르는 이유는 S3의 저장 방식과 데이터 모델에 있다.
- 오브젝트 스토리지란?
- S3는 데이터를 파일 시스템 계층 구조로 저장하지 않는다. 대신 데이터를 개별 단위로 (독립적으로) 관리하고 이를 오브젝트라고 부른다.
- 각 오브젝트는 다음을 포함한다.
- 데이터: 실제 파일 데이터
- 메타데이터: 오브젝트에 대한 추가 정보
- 키: 오브젝트를 고유하게 식별하는 식별자
- 파일 시스템과의 차이
- 전통적인 파일시스템에서는 파일이 디렉토리 계층 구조 (트리 구조)로 저장된다.(사실 파일시스템은 트리구조 이외에도 다양한 형태가 있다)
- 하지만 S3에서는 파일이 트리 구조가 아닌 평평한 구조로 저장된다. 즉, 파일들이 디렉토리 계층 구조로 저장되는 것이 아니라 (단순한) 단일 계층 구조로 저장된다.
- 디렉토리 개념 대신 키를 이용해 데이터를 구분하고 계층적으로 보일 수 있도록 에뮬레이팅을 해준다.(folder/file.txt 처럼)
- 오브젝트 스토리지의 장점
- 파일 시스템과 달리 데이터를 평평한 구조로 저장하기 때문에 데이터를 더욱 쉽게 관리할 수 있다. 즉 계층구조를 유지하지 않아도 된다.
- 데이터 접근 속도가 빠르다.(파일 시스템은 데이터를 읽어올 때 트리 구조를 탐색하는 과정이 필요하지만 S3는 평평한 구조이기 때문에 데이터를 더 빠르게 찾을 수 있다.)
- 오브젝트 단위로 분산 저장이 가능하기 때문에 높은 가용성과 내구성을 제공한다.
- 파일 ≠ 오브젝트
- 파일은 파일시스템에서 사용하는 개념이고 오브젝트는 S3에서 사용하는 개념이다.
- 그래서 파일이 아니라 오브젝트라는 이름으로 불린다.
Leave a comment