배열의 인덱스는 왜 0부터 시작할까? + 참조값의 비밀

에듀테크 부트캠프

배열의 인덱스는 왜 0부터 시작할까? + 참조값의 비밀

wy-family 2025. 3. 10. 22:13

배열에서 인덱스가 0부터 시작하는 이유는 여러 가지가 있지만, 가장 핵심적인 이유는 메모리 주소 계산의 효율성 때문이야.

1. 포인터와 오프셋 개념

배열은 메모리에서 연속된 공간을 차지해. 프로그래밍 언어에서 배열의 첫 번째 요소를 가리킬 때, 기본적으로 배열의 시작 주소를 사용해.
예를 들어, arr이라는 배열이 있다고 하자.

복사편집

int arr[5] = {10, 20, 30, 40, 50};

이 배열에서 arr[0]은 배열의 시작 주소(BASE_ADDRESS)에서 0칸 이동한 위치에 있어.
즉, arr[i]의 메모리 주소를 계산할 때:

주소=BASE_ADDRESS+i×ELEMENT_SIZE\text{주소} = \text{BASE\_ADDRESS} + i \times \text{ELEMENT\_SIZE}주소=BASE_ADDRESS+i×ELEMENT_SIZE

위 수식에서 i = 0이면, 추가적인 연산 없이 바로 BASE_ADDRESS를 사용할 수 있어.
만약 인덱스를 1부터 시작하도록 했다면, 모든 요소를 접근할 때마다 -1을 빼주는 추가 연산이 필요해.

2. C언어와 포인터 연산

C 언어에서는 배열 이름이 곧 포인터 역할을 해.
즉, arr 자체가 arr[0]의 주소를 가리키므로, 포인터 연산을 할 때도 자연스럽게 동작해.

복사편집

int *ptr = arr; // arr[0]의 주소를 가리킴

배열의 n번째 요소를 얻으려면 포인터 연산을 사용하면 되는데:

복사편집

*(ptr + i) // arr[i]와 동일

여기서 i = 0이면 ptr + 0이 되고, *ptr을 그대로 사용하면 되니까 추가 연산이 필요 없음.
만약 인덱스가 1부터 시작했다면 *(ptr + (i-1))을 써야 해서 불필요한 연산이 들어가게 돼.

3. 수학적 직관: 0-based indexing이 범위 표현에 유리함

프로그래밍에서 자주 사용되는 범위 (range) 표현을 보면, 0부터 시작하는 게 직관적으로 더 깔끔해.

예를 들어, arr[2:5]처럼 **2번 인덱스부터 5번 인덱스 전까지(즉, 2, 3, 4)**의 요소를 가져오는 연산을 생각해보자.
만약 인덱스가 1부터 시작하면 이런 범위 연산에서 계산이 복잡해지고, 직관성이 떨어질 가능성이 큼.

4. 역사적 배경: C 언어에서 시작된 전통

현재 널리 쓰이는 대부분의 언어(Java, Python, C++, JavaScript 등)가 C 언어의 영향을 받았기 때문이야.
C 언어는 시스템 프로그래밍 언어로 메모리 주소 연산을 직접 수행해야 하는 경우가 많았고, 효율적인 메모리 접근을 위해 0-based indexing이 자연스러웠음.
이런 설계가 이후의 언어에도 그대로 전파된 거지.

🔥 결론: "메모리 주소 + 오프셋" 계산의 효율성!

배열에서 arr[i]를 접근할 때, 주소 계산을 추가 연산 없이 자연스럽게 수행하기 위해 0부터 시작하는 것이 더 효율적이야.
따라서, 메모리와 수학적 직관성을 고려한 설계의 결과라고 보면 돼.

💡 참고: 일부 언어(예: Fortran)는 1-based indexing을 사용하기도 했지만, 성능과 직관성 면에서 0-based가 더 유리해서 대세가 됐어!

나의 말:

배열 인덱스에 음수나, 양의 정수가 아닌 실수값을 넣는다면 어떻게 되는거야?

ChatGPT의 말:

배열 인덱스에는 일반적으로 음수나 실수 값을 사용할 수 없어.
하지만 언어에 따라 다르게 동작할 수도 있어. 하나씩 살펴볼게.

✅ 1. 배열 인덱스에 음수를 넣으면?

음수 인덱스를 사용하면 언어와 환경에 따라 다르게 동작해.

1) C / C++에서 음수 인덱스를 사용하면?

C나 C++에서는 배열이 포인터 기반으로 동작하므로, 음수 인덱스를 사용하면 배열의 시작 주소보다 앞쪽 메모리에 접근할 수 있어.
즉, **예측 불가능한 동작(Undefined Behavior, UB)**이 발생할 가능성이 큼.

복사편집

#include <stdio.h>

int main() {

int arr[5] = {10, 20, 30, 40, 50};

printf("%d\n", arr[-1]); // ⚠️ 정의되지 않은 동작 (UB)

return 0;

}

💥 실행 결과:

경우에 따라 **쓰레기 값(garbage value)**을 출력하거나,
프로그램이 비정상 종료(Segmentation Fault) 될 수도 있음.

2) Python에서는 음수 인덱스가 가능함

Python에서는 음수 인덱스가 배열의 끝에서부터 접근하는 기능으로 사용됨.

python

복사편집

arr = [10, 20, 30, 40, 50]

print(arr[-1]) # 출력: 50 (마지막 요소)

print(arr[-2]) # 출력: 40 (뒤에서 두 번째 요소)

즉, arr[-1]은 arr[len(arr) - 1]과 같은 의미야.

✅ 2. 배열 인덱스에 실수 값을 넣으면?

배열의 인덱스는 정수여야 하므로, 실수를 넣으면 오류가 발생하거나 강제 변환될 수도 있어.

1) C / C++에서 실수 인덱스를 사용하면?

C/C++에서 배열 인덱스는 정수 타입이므로, 실수를 넣으면 컴파일 에러가 발생해.

복사편집

#include <stdio.h>

int main() {

int arr[5] = {10, 20, 30, 40, 50};

printf("%d\n", arr[1.5]); // ❌ 컴파일 에러

return 0;

}

💥 error: array subscript is not an integer
(배열 인덱스는 정수여야 한다는 오류)

하지만 명시적으로 캐스팅하면 실행은 되지만 의도한 동작이 아닐 수도 있어.

복사편집

printf("%d\n", arr[(int)1.5]); // ✅ arr[1]이 됨 (20 출력)

2) Python에서는 실수 인덱스를 사용하면 오류 발생

Python에서는 배열 인덱스가 **정수(int)**여야 해서, 실수를 넣으면 TypeError가 발생해.

python

복사편집

arr = [10, 20, 30, 40, 50]

print(arr[1.5]) # ❌ TypeError: list indices must be integers or slices, not float

하지만 정수로 변환하면 사용할 수 있음.

python

복사편집

print(arr[int(1.5)]) # ✅ 20 (arr[1]이 됨)

3) Java에서는 실수 인덱스를 사용하면 컴파일 오류

Java에서도 배열 인덱스는 정수 타입(int)이어야 해서, 실수를 넣으면 컴파일 에러가 발생함.

java

복사편집

public class Main {

public static void main(String[] args) {

int[] arr = {10, 20, 30, 40, 50};

System.out.println(arr[1.5]); // ❌ 컴파일 오류

}

💥 오류 메시지:
array required, but double found
(배열 인덱스는 정수여야 하지만, 실수가 입력됨)

정수로 캐스팅하면 정상적으로 실행됨.

java

복사편집

System.out.println(arr[(int)1.5]); // ✅ 20 (arr[1]이 됨)

🔥 결론:

언어	음수 인덱스	실수 인덱스
C/C++	가능하지만 UB 발생 (위험)	컴파일 오류 (int로 캐스팅 가능)
Python	배열 끝에서부터 역순 접근	TypeError 발생 (int로 변환해야 함)
Java	컴파일 오류	컴파일 오류 (int로 변환하면 가능)

음수 인덱스: Python에서는 배열 끝에서부터 역순 접근이 가능하지만, C/C++에서는 위험한 동작이 될 수 있음.
실수 인덱스: 대부분의 언어에서 정수형 인덱스만 허용하며, 실수를 넣으면 오류 발생.

⚠️ 배열을 사용할 때는 항상 정수 인덱스를 사용하는 것이 안전함!

나의 말:

나는 자바를 공부 중인데, 자바에서는 그러면 음수 인덱스는 안 되고 실수 인덱스는 int로 캐스팅하면 된다는거구나. 근데 갑자기 궁금한건데, 배열의 인덱스 한 개 한 개의 캐스팅은 될 거 같은데, 배열 전체를 캐스팅하는 것도 가능한가? 배열을 캐스팅하면 배열 내에 있는 모든 인덱스들의 값들도 캐스팅이 될 수 있냐는 질문이야.

ChatGPT의 말:

자바에서 배열 전체를 한 번에 캐스팅하는 것은 불가능해.
즉, 배열 자체를 (int[]), (double[]) 같은 방식으로 변환할 수는 없어.

하지만, 배열의 요소들을 하나씩 변환하는 것은 가능해. 반복문이나 스트림 API를 사용하여 개별 요소를 변환하는 방식을 사용해야 해.

🔹 1. 배열 전체를 한 번에 캐스팅하는 것은 불가능

배열은 객체이므로, (int[]), (double[]) 같은 방식으로 형 변환을 시도하면 컴파일 오류가 발생해.

java

복사편집

public class Main {

public static void main(String[] args) {

double[] doubleArr = {1.5, 2.8, 3.2};

// ❌ 배열 전체를 한 번에 int[]로 캐스팅하는 것은 불가능

int[] intArr = (int[]) doubleArr; // ❌ 컴파일 오류

}

💥 오류 발생:
cannot cast from double[] to int[]
(배열 전체를 한 번에 형 변환할 수 없음)

🔹 2. 반복문을 사용하여 배열 요소 변환

배열 내의 개별 요소를 변환하려면 반복문을 사용해야 해.

java

복사편집

public class Main {

public static void main(String[] args) {

double[] doubleArr = {1.5, 2.8, 3.2};

// 새로운 int 배열 생성

int[] intArr = new int[doubleArr.length];

// 개별 요소 변환

for (int i = 0; i < doubleArr.length; i++) {

intArr[i] = (int) doubleArr[i];

}

// 변환된 배열 출력

for (int num : intArr) {

System.out.print(num + " "); // 출력: 1 2 3

}

✅ 위처럼 반복문을 사용하면 배열 내 모든 요소를 변환 가능.

🔹 3. 자바 8 스트림 API를 활용한 변환

자바 8부터는 Arrays.stream()을 활용하면 더 깔끔하게 변환할 수 있어.

java

복사편집

import java.util.Arrays;

public class Main {

public static void main(String[] args) {

double[] doubleArr = {1.5, 2.8, 3.2};

// 스트림을 이용한 변환

int[] intArr = Arrays.stream(doubleArr)

.mapToInt(d -> (int) d) // 개별 요소를 int로 변환

.toArray();

System.out.println(Arrays.toString(intArr)); // 출력: [1, 2, 3]

}

✅ 스트림 API를 사용하면 코드가 간결해지고 가독성이 좋아짐!

🔥 결론

배열 전체를 (int[]), (double[]) 같은 방식으로 한 번에 캐스팅할 수 없음.
각 요소를 개별적으로 변환해야 하며, 반복문 또는 스트림 API를 사용할 수 있음.
스트림 API(Arrays.stream())를 사용하면 코드가 깔끔해짐.

👉 즉, 배열 자체를 캐스팅하는 것은 불가능하지만, 배열 요소들은 변환 가능! 🚀

나의 말:

배열은 참조형이라서 주소값을 저장한다고 했어. print로 배열이 가지고 있는 주소값을 출력해서 봤는데, 그 값을 보고 컴퓨터는 어떻게 이게 주소값이라는 걸 알수가 있는거야? 무슨 말이냐면, 그냥 문자열에 주소값이랑 똑같은 값을 저장하면, 그게 문자 리터럴 값인지, 주소값인지 어떻게 구분을 하는거야?

ChatGPT의 말:

자바에서 배열이 저장하는 값은 실제 데이터가 있는 메모리 주소야.
그렇다면, 어떻게 컴퓨터는 "이 값이 주소인지, 그냥 숫자인지" 구분할 수 있을까? 🤔

✅ 1. 배열은 참조형(Reference Type)이라 주소값을 저장한다

자바에서 배열은 객체이므로, 변수에는 배열의 **주소(참조 값, reference)**가 저장돼.

java

복사편집

int[] arr = {10, 20, 30};

System.out.println(arr); // 👀 [I@<해시코드> 출력

💡 하지만 우리가 print(arr)를 하면 메모리 주소가 그대로 출력되는 것이 아니라, toString()의 결과가 나와.

✅ 2. 자바가 "주소값"과 "일반 값"을 구분하는 방법

자바는 내부적으로 "이 값이 주소인지 일반 데이터인지"를 데이터 타입을 통해 구분해.

타입	저장되는 값	예제
int, double, char (기본형)	실제 값	int x = 10; (x에는 10 저장)
배열 (int[], double[] 등)	주소값(참조값)	int[] arr = new int[3]; (arr에는 메모리 주소 저장)
객체 (String, ArrayList, HashMap 등)	주소값(참조값)	String s = new String("Hello"); (s에는 "Hello"가 있는 메모리 주소 저장)

즉, 변수가 어떤 데이터 타입인지에 따라 "이 값이 주소인지, 그냥 값인지"가 결정됨.

java

복사편집

int x = 123456; // 기본형 변수, 실제 값 저장

int[] arr = {1, 2}; // 참조형 변수, 주소값 저장

System.out.println(x); // 123456 (실제 값)

System.out.println(arr); // [I@1b6d3586 (주소 기반 해시코드)

자바의 JVM은 변수의 타입을 통해 자동으로 주소값을 판별하기 때문에,
arr을 출력하면 메모리 주소를 의미하는 참조값이라고 인식하고, int라면 그냥 정수로 처리하는 거야.

✅ 3. 같은 값이어도, 참조형과 기본형은 다르게 처리된다

예를 들어, 문자열에 "123456"을 저장하면 정수 123456과 다르게 취급됨.

java

복사편집

String str = "123456";

int num = 123456;

System.out.println(str); // 123456 (문자열)

System.out.println(num); // 123456 (정수)

같은 "123456" 값이어도:

num은 정수(int)라서 그대로 숫자로 출력됨.
str은 참조형(String)이라 JVM이 내부적으로 문자열 객체의 주소를 찾아가서 "123456"을 출력해줌.

✅ 4. 만약 문자열을 메모리 주소처럼 만든다면?

java

복사편집

String fakeAddress = "[I@1b6d3586";

System.out.println(fakeAddress);

위 코드는 단순한 문자열을 출력할 뿐, 진짜 주소값이 아니야!
자바는 변수의 타입을 보고 "이게 실제 메모리 주소인지, 단순한 문자열인지"를 구별하기 때문에,
fakeAddress는 그냥 문자 리터럴로 취급됨.

하지만 배열이나 객체를 출력하면 toString()이 자동으로 호출되면서, 주소값 기반의 해시코드가 생성됨.

java

복사편집

int[] arr = {10, 20, 30};

System.out.println(arr.toString()); // [I@<해시코드>

✅ 5. 메모리 주소를 직접 확인하려면?

자바는 실제 메모리 주소를 직접 보여주지 않고, 대신 "해시코드"를 출력해.

java

복사편집

int[] arr = {10, 20, 30};

System.out.println(arr); // [I@<해시코드>

System.out.println(arr.hashCode()); // 366712642 (10진수 해시코드)

System.out.println(Integer.toHexString(arr.hashCode())); // 15db9742 (16진수 해시코드)

💡 자바는 보안상의 이유로 실제 메모리 주소를 직접 출력하지 않고, hashCode() 값을 대신 보여줌.
이 hashCode()는 객체의 메모리 주소를 기반으로 생성되지만, 직접적인 메모리 주소는 아님.

🔥 결론:

자바는 변수의 데이터 타입을 통해 "이 값이 주소인지, 그냥 값인지"를 판별함.
배열(int[], String[])이나 객체는 "주소(참조값)"를 저장하고, print(arr) 하면 toString()이 자동 호출되어 해시코드가 출력됨.
단순한 문자열에 주소처럼 보이는 값을 넣어도, 자바는 타입을 보고 "이건 문자열이야"라고 구분함.
자바는 보안상 메모리 주소를 직접 출력하지 않고, 대신 hashCode() 기반의 값을 출력함.

✅ 즉, 단순한 숫자가 아니라 변수의 타입을 보고 컴퓨터가 "이건 주소다"라고 자동으로 인식하는 거야! 🚀

'에듀테크 부트캠프' 카테고리의 다른 글

switch는 조건문인데 반복문이기도 한건가? (0)	2025.03.10
자바 반복문과 제어문 완벽 정리: for, while, switch, break, continue 그리고 랜덤값 활용 (0)	2025.03.10
0은 양수일까? 컴퓨터가 0을 처리하는 방식과 에듀테크에서의 의미 (1)	2025.03.08
Java 제어문 완전 정복! 조건문과 반복문을 활용한 실전 예제 (0)	2025.03.07
에듀테크 KDT 과정 시작! Java 기초 학습 기록 📖 (0)	2025.03.06

현재글배열의 인덱스는 왜 0부터 시작할까? + 참조값의 비밀

wy_family

wy-family 님의 블로그 입니다.

백엔드, cd, SpringBoot, restfulapi, 도커, GitLab, restful, 오블완, Django, aws, 서버배포, Rest, CICD, restapi, PostgreSQL, Python, CI, 데브옵스, 가상화, kubernetes, 진로계획, 진로고민, KDT, 자바, java, spring, 쿠버네티스, Docker, 티스토리챌린지, 웹개발,

Today :
Yesterday :

wy_family