캐시란?
캐시는 컴퓨터 과학에서
데이터나 값을 미리 복사해 놓는 임시 장소
를 가리킨다. 캐시는 캐시의 접근 시간에 비해 원래 데이터를 접근하는 시간이 오래 걸리는 경우나 값을 다시 계산하는 시간을 절약하고 싶은 경우에 사용한다. 어떻게 작동할까?
캐시의 데이터를 일반적으로 RAM과 같이
빠르게 액세스할 수 있는 하드웨어
에 저장되며, 소프트웨어 구성 요소와 함께 사용될 수도 있다. 캐시의 주요 목적은 더 느린 기본 스토리지 계층에 액세스해야 하는 필요를 줄임으로써 데이터 검색 성능을 높이는 것
이다. 속도를 위해 용량을 절충하는 캐시는 일반적으로 데이터의 하위 집합을 일시적으로 저장한다. 보통 완전하고
영구적인 데이터가 있는 데이터베이스와 대조적
이다. 가장 일반적인 캐싱 유형인 웹 브라우저 캐싱의 경우 웹 브라우저는 로컬 하드 드라이브에 정적 데이터의 복사본을 로컬로 저장한다. 정적 이미지, CSS 파일 및 JavaScript 파일과 같은 작고 정적인 데이터를 로컬에서 관리하는데 적합하다.
발표 카테고리가 운영체제인 만큼 여기서는 웹 캐싱보다 컴퓨터 구조 쪽의 캐시에 대해서 알아보자.
컴퓨터에서 데이터는 어떻게 이동할까?

중앙처리장치(CPU)
주기억장치에서 프로그램 명령어와 데이터를 읽어와 처리하고 명령어의 수행 순서를 제어한다. ALU(산술논리장치), 제어장치, 레지스터로 구성되어있다.
기억장치
주기억장치(RAM ,ROM)와 보조기억장치(하드)로 나뉜다.
입출력장치
키보드,마우스, 프린터, 모니터 등등
시스템 버스
각 구성요소가 다른 구성요소로 데이터를 보낼 수 있도록 통로가 되어준다.
데이터 버스, 주소 버스, 제어 버스 가 있다.
컴퓨터는 기본적으로 읽고 처리한 뒤 저장하는 과정으로 이루어진다.(
read → process → write
)CPU가 주기억장치에서 저장된 데이터를 읽어올 때, 자주 사용하는 데이터를 캐시 메모리에 저장한 뒤, 다음에 이용할 때 주기억장치가 아닌
캐시 메모리
에서 먼저 가져오면서 속도를 향상시킨다.속도라는 장점을 얻지만, 용량이 적기도 하고 비용이 비싸다.(SRAM이 매우 비싸다고 한다)
CPU에는 이러한 캐시 메모리가 2-3개 정도 사용된다. (L1, L2, L3 캐시 메모리라고 부른다. 일반적으로 CPU에서 가장 빠르게 접근할 수 있는 L1메모리부터 데이터를 찾는다.)

캐시 메모리 작동원리
- Direct Mapped Cache
가장 기본적인 구조로, DRAM의 여러 주소가 캐시 메모리의 한 주소에 대응되는 다대일 방식.

캐시 메모리는
인덱스 필드 + 태그 필드 + 데이터 필드
로 구성된다.간단하고 빠른 장점이 있지만, Conflict Miss가 발생하는 단점이 있다.
- Fully Associative Cache
비어있는 캐시 메모리가 있으면, 마음대로 주소를 저장하는 방식이다.
저장할 때는 매우 간단하지만, 찾을 때가 문제다. 조건이나 규칙이 없어서 특정 캐시 Set안에 있는 모든 블럭을 한번에 찾아 원하는 데이터가 있는지 검색해야한다.
CAM
이라는 특수한 메모리 구조를 사용해야하지만 가격이 매우 비싸다- Set Associative Cache
Direct + Fully 방식이다. 특정 행을 지정하고, 그 행안의 어떤 열이든 비어있을 때 저장하는 방식이다. Direct에 비해 검색 속도는 느리지만, 저장이 빠르고 Fully에 비해 저장이 느린 대신 검색이 빠른 중간형이다.
- 시간 지역성
for나 while같은 반복문에 사용하는 조건 변수처럼 한번 참조된 데이터는 잠시후 또 참조될 가능성이 높다.
- 공간 지역성
A[0], A[1]과 같은 연속 접근 시, 참조된 데이터 근처에 있는 데이터가 잠시후 또 사용될 가능성이 높다.
CPU가 요청한 데이터가 캐시에 있으면 Cache Hit, 없어서
DRAM
에서 가져오면 ‘Cache Miss’.캐시 미스의 경우 3가지
- Cold miss
- 해당 메모리 주소를 처음 불러서 나는 미스.
- Conflict miss
- 캐시 메모리에 A와 B데이터를 저장해야 하는데, A와 B가 같은 캐시 메모리 주소에 할당되어 있어서 나는 미스(direct mapped cached에서 많이 발생)
- Capacity miss
- 캐시 메모리의 공간이 부족해서 나는 미스 (Conflict는 주소 할당문제, Capacity는 공간문제)