Python

1. 개요

이 레퍼런스 설명서는 파이썬 프로그래밍 언어를 설명합니다. 자습서를 목표로 하고 있지 않습니다.

가능한 한 정확하려고 노력하고 있지만, 문법과 어휘 분석 이외의 모든 것에는 형식 규격보다는 자연어를 사용합니다. 이 선택이 평균적인 독자들이 문서를 좀 더 잘 이해하도록 만들지만, 동시에 모호해질 가능성 역시 만듭니다. 결과적으로, 만약 여러분이 화성에서 왔고 이 문서만으로 파이썬을 다시 구현하려고 하면, 아마도 여러 가지를 짐작해야 할 것이고 결국 많이 다른 언어를 만드는 것으로 끝날 것입니다. 반면에, 여러분이 파이썬을 사용하고 있고 언어의 특정 영역에 대한 정확한 규칙에 대해 궁금해하고 있다면 거의 확실히 이곳에서 답을 찾을 수 있습니다. 좀 더 형식화된 정의를 보고 싶다면, 아마도 여러분의 시간을 기부하는 편이 좋습니다 — 그렇지 않으면 클로닝 기계를 발명하거나 :-).

참조 문서에 너무 많은 구현 세부 사항을 넣는 것은 위험합니다. 구현은 변경될 것이고 같은 언어의 다른 구현도 좀 다른 방식으로 동작할 수 있습니다. 반면에 (대안 구현이 점차 지지도를 높여가고 있기는 하지만) CPython 은 가장 널리 사용되는 파이썬 구현이고, 그것의 특별한 경우 들은 때로 언급할 가치가 있습니다. 구현이 추가의 제약을 내포하고 있는 경우는 특히 그렇습니다. 그래서, 텍스트 중간중간 짧은 “구현 노트” 가 튀어나오는 것을 보게 될 것입니다.

모든 파이썬 구현에는 많은 내장 표준 모듈들이 따라옵니다. 이것들은 파이썬 표준 라이브러리 에 기술되어 있습니다. 언어 정의에 주목할 만한 방식으로 관계될 경우 몇몇 내장 모듈들은 따로 언급됩니다.

1.1. 대안 구현들

눈에 띄게 널리 사용되는 파이썬 구현이 존재하기는 하지만, 특정한 관심사를 가진 대상들에게 호소력을 가진 여러 대안 구현들이 존재합니다.

알려진 구현들은:

CPython

원조이기도 하고 가장 잘 관리되고 있는 C로 작성된 파이썬 구현입니다. 언어의 새로운 기능은 보통 여기에서 처음 등장합니다.

Jython

파이썬 자바구현. 이 구현은 자바 응용 프로그램을 위한 스크립트 언어로 사용되거나, 자바 클래스 라이브러리를 활용하는 응용 프로그램을 만드는데 사용될 수 있습니다. 종종 자바 라이브러리의 테스트를 만드는 데 사용되기도 합니다. 더 자세한 정보는 Jython 웹사이트 에서 찾을 수 있습니다.

Python for .NET

이 구현은 실제로는 CPython 구현을 사용하지만, 매니지드(managed) .NET 응용 프로그램이고 .NET 라이브러리를 제공합니다. Bryan Lloyd가 만들었습니다다. 더 자세한 정보는 Python for .NET 홈페이지 에서 제공됩니다.

IronPython

.NET을 위한 대안 파이썬. Python.NET 과는 달리 이것은 IL을 생성하고, 파이썬 코드를 .NET 어셈블리로 직접 컴파일하는 완전한 파이썬 구현입니다. Jim Hugunin 이 만들었는데, Jython 의 원저자이기도 합니다. 자세한 정보는 IronPython 웹사이트 에서 얻을 수 있습니다.

PyPy

완전히 파이썬으로 작성된 파이썬 구현. 스택 리스(stackless) 지원이나 JIT 컴파일러와 같이 다른 구현에서는 찾을 수 없는 고급 기능을 제공합니다. 이 프로젝트의 목표 중 하나는 (파이썬으로 쓰였기 때문에) 인터프리터 수정을 쉽게 만들어서 언어 자체에 대한 실험을 북돋는 것입니다. 자세한 정보는 PyPy 프로젝트의 홈페이지 에서 찾을 수 있습니다.

각 구현은 이 설명서에서 설명되는 언어와 조금씩 각기 다른 방법으로 벗어나거나, 표준 파이썬 문서에서 다루는 범위 밖의 특별한 정보들을 소개합니다. 여러분이 사용 중인 구현에 대해 어떤 것을 더 알아야 하는지 판단하기 위해서는 구현 별로 제공되는 문서를 참조할 필요가 있습니다.

1.2. 표기법

어휘 분석과 문법 설명은 `EBNF <https://en.wikipedia.org/wiki/Extended_Backus%E2%80%93Naur_form>`_와 `PEG <https://en.wikipedia.org/wiki/Parsing_expression_grammar>`_의 혼합된 문법 표기법을 사용합니다. 예를 들어:

name:   letter (letter | digit | "_")*
letter: "a"..."z" | "A"..."Z"
digit:  "0"..."9"

이 예제에서 첫 번째 줄은 nameletter 뒤에 0개 이상 반복되는 letter s, digit s, 그리고 밑줄로 이루어진 시퀀스임을 나타냅니다. letter 는 다시 'a' 부터 'z'A 부터 Z 의 단일 문자 중 어느 것이나이며, digit0 부터 9 까지의 단일 문자입니다.

각 규칙은 이름(정의되는 규칙을 식별)으로 시작하며, 콜론인 : 이 뒤따릅니다. 콜론 오른쪽에 있는 정의는 다음 구문 요소들을 사용합니다:

  • name: 이름은 다른 규칙을 참조합니다. 가능한 경우, 해당 규칙의 정의로 연결되는 링크입니다.

    • TOKEN: 대문자 이름은 :term:`토큰 <token>`을 참조합니다. 문법 정의 목적상, 토큰은 규칙과 동일합니다.

  • "text", 'text': 작은따옴표 또는 큰따옴표 안의 텍스트는 리터럴로 일치해야 합니다(큰따옴표 제외). 따옴표의 유형은 text 의 의미에 따라 선택됩니다:

    • 'if': 작은따옴표 안의 이름은 :ref:`키워드 <keywords>`를 나타냅니다.

    • "case": 큰따옴표 안의 이름은 :ref:`소프트-키워드 <soft-keywords>`를 나타냅니다.

    • '@': A non-letter symbol in single quotes denotes an OP token, that is, a delimiter or operator.

  • e1 e2: 공백으로만 분리된 항목들은 시퀀스를 나타냅니다. 여기서, e1``은 ``e2 뒤에 와야 합니다.

  • e1 | e2: 수직막대는 대안들을 분리하는 데 사용됩니다. 이는 PEG의 “순서가 있는 선택(ordered choice)”을 나타내며, e1 이 일치하면 e2 는 고려되지 않습니다. 전통적인 PEG 문법에서는 수직막대 대신 슬래시인 / 로 작성됩니다. 더 많은 배경 정보와 세부 사항은 PEP 617 을 참조하십시오.

  • e*: 별표는 앞 항목이 0번 이상 반복됨을 의미합니다.

  • e+: 마찬가지로, 더하기 기호는 1번 이상 반복됨을 의미합니다.

  • [e]: 대괄호로 묶인 구문은 0번 또는 1번 발생을 의미합니다. 달리 말하면, 포함된 구문은 선택적입니다.

  • e?: 물음표는 대괄호와 완전히 동일한 의미를 갖습니다: 앞 항목은 선택적입니다.

  • (e): 괄호는 그룹화에 사용됩니다.

다음 표기법은 :ref:`어휘 정의 <notation-lexical-vs-syntactic>`에서만 사용됩니다.

  • "a"..."z": 세 점으로 분리된 두 개의 리터럴 문자는 주어진 (모두 포함하는) ASCII 문자 범위의 임의의 단일 문자를 선택함을 의미합니다.

  • <...>: 꺾쇠괄호 사이의 구문은 일치된 기호에 대한 비형식적 설명을 제공합니다 (예: <이스케이프 문자 "\">``와 같은 모든 ASCII 문자). 또는 근처 텍스트에 정의된 약어입니다 (예: ``<Lu>).

일부 정의에서는 미리 보기 (lookaheads) 도 사용하는데, 이는 주어진 위치에서 특정 요소가 일치해야 하거나(또는 일치하지 않아야 함) 하지만 어떠한 입력도 소비하지 않음을 나타냅니다:

  • &e: 긍정적인 미리 보기 어서션 (즉, e 와 일치해야 함)

  • !e: 부정적인 미리 보기 어서션 (즉, e일치하지 않아야 함)

단항 연산자(*, +, ?)는 가능한 한 강하게 결합하며; 수직막대 (|)는 가장 느슨하게 결합합니다.

공백은 토큰을 분리하는 데에만 의미가 있습니다.

규칙은 일반적으로 한 줄에 포함되지만, 너무 긴 규칙은 묶일 수 있습니다:

literal: stringliteral | bytesliteral
         | integer | floatnumber | imagnumber

또는, 규칙은 첫 번째 줄이 콜론에서 끝나고 각 대안이 새 줄의 수직막대로 시작하도록 포매팅할 수 있습니다. 예를 들어:

literal:
   | stringliteral
   | bytesliteral
   | integer
   | floatnumber
   | imagnumber

이것이 첫 번째 대안이 비어 있다는 것을 의미하지 않습니다.

1.2.1. 어휘 정의와 문법 정의

어휘 분석*과 *문법 분석 사이에는 몇 가지 차이점이 있습니다: 어휘 분석기 스트림에 작동합니다. 그러나 경우에 따라 두 단계 사이의 정확한 경계는 CPython 구현 세부 사항입니다.

두 가지의 실제적인 차이점은 어휘 정의*에서 모든 공백이 중요하다는 것입니다. 어휘 분석기는 :ref:`<whitespace>`와 같이 :data:`token.INDENT` 또는 :data:`~token.NEWLINE`과 같은 토큰으로 변환되지 않은 모든 공백을 버립니다. *문법 정의는 소스 문자 대신 이러한 토큰을 사용합니다.

사용되는 표기법이 거의 같다고 하더라도, 어휘와 문법 정의 간에는 커다란 차이가 있습니다: 어휘 정의는 입력의 개별 문자에 적용되는 반면, 문법 정의는 어휘 분석기가 만들어내는 토큰들에 적용됩니다. 다음 장 (“어휘 분석(Lexical Analysis)”)에서 사용되는 모든 BNF는 어휘 정의입니다; 그 이후의 장에서는 문법 정의입니다.

분실물 보관소