binascii — 바이너리와 ASCII 간의 변환¶
binascii 모듈에는 바이너리와 다양한 ASCII 인코딩된 바이너리 표현 간을 변환하는 여러 가지 방법이 포함되어 있습니다. 일반적으로 이러한 함수들은 직접 사용하지 않고, 대신 base64`와 같은 래퍼 모듈을 사용합니다. :mod:`binascii 모듈에는 상위 수준 모듈에서 사용되는, 더 빠른 속도를 위해 C로 작성된 저수준 함수들이 포함되어 있습니다.
참고
a2b_* 함수는 ASCII 문자만 포함하는 유니코드 문자열을 받아들입니다. 다른 함수는 바이트열류 객체(가령 bytes, bytearray 및 버퍼 프로토콜을 지원하는 다른 객체)만 받아들입니다.
버전 3.3에서 변경: ASCII로만 이루어진 유니코드 문자열은 이제 a2b_* 함수에서 허용됩니다.
binascii 모듈은 다음 함수들을 정의합니다:
- binascii.a2b_uu(string)¶
한 줄의 UU 인코딩된 데이터 string을 바이너리로 역변환하고 바이너리 데이터를 반환합니다. 마지막 줄을 제외하고는, 줄은 보통 45 (바이너리) 바이트를 포함합니다. 줄 데이터 뒤에는 공백 문자가 올 수 있습니다.
- binascii.b2a_uu(data, *, backtick=False)¶
바이너리 data를 ASCII 문자의 줄로 변환합니다, 반환 값은 개행 문자를 포함하는 변환 된 줄입니다. data의 길이는 최대 45이어야 합니다. backtick가 참이면, 0은 스페이스 대신
'`'으로 표현됩니다.버전 3.7에서 변경: backtick 매개 변수가 추가되었습니다.
- binascii.a2b_base64(string, /, *, padded=True, alphabet=BASE64_ALPHABET, strict_mode=False, canonical=False)¶
- binascii.a2b_base64(string, /, *, ignorechars, padded=True, alphabet=BASE64_ALPHABET, strict_mode=True, canonical=False)
base64 데이터 블록을 바이너리로 역변환하고 바이너리 데이터를 반환합니다. 한 번에 한 줄 이상을 전달할 수 있습니다.
선택적 alphabet 은 대체 알파벳을 지정하는 길이 64의
bytes객체여야 합니다.padded 가 true인 경우, 마지막 4개 base 64 알파벳 문자는 ‘=’ 문자로 채워져야 합니다. padded 가 false인 경우, 패딩은 요구되거나 인식되지 않습니다. 즉, ‘=’ 문자는 패딩으로 취급되지 않고 알파벳이 아닌 문자로 처리되어, strict_mode 가 false일 때는 조용히 폐기되거나, ignorechars 에 b’=’ 가 포함되지 않으면 strict_mode 가 true일 때는
Error를 발생시킵니다.ignorechars 를 지정하면, strict_mode 가 true일 때 입력에서 무시할 문자를 포함하는 바이트열류 객체 이어야 합니다. ignorechars 에 패딩 문자
'='가 포함되어 있으면, 인코딩된 데이터 끝 전에 제공되는 패딩 문자들과 초과 패딩 문자들은 무시됩니다. ignorechars 가 지정되면 strict_mode 의 기본값은True이고, 그렇지 않으면False입니다.strict_mode 가 true인 경우, 유효한 base64 데이터만 변환됩니다. 유효하지 않은 base64 데이터는
binascii.Error를 발생시킵니다.유효한 base64:
RFC 4648 를 준수합니다.
base64 알파벳 문자만 포함합니다.
패딩 후 초과 데이터가 포함되어 있지 않습니다 (초과 패딩, 개행 등 포함).
패딩으로 시작하지 않습니다.
canonical 이 true인 경우, 마지막 그룹의 비정규 패딩 비트는
binascii.Error를 발생시켜 RFC 4648 섹션 3.5에 정의된 정규 인코딩을 강제합니다. 이 검사는 strict_mode 와 독립적입니다.버전 3.11에서 변경: strict_mode 매개 변수가 추가되었습니다.
버전 3.15에서 변경: alphabet, canonical, ignorechars, padded 매개 변수가 추가되었습니다.
- binascii.b2a_base64(data, *, padded=True, alphabet=BASE64_ALPHABET, wrapcol=0, newline=True)¶
RFC 4648 에 지정된 대로 바이너리 데이터를 base64 코딩의 ASCII 문자로 된 한 줄(들)로 변환합니다.
:padded 가 True인 경우 (기본값), 인코딩된 데이터의 크기를 4의 배수로 만들기 위해 ‘=’ 문자로 패딩합니다. padded 가 False인 경우, 패딩 문자를 추가하지 않습니다.
wrapcol 이 0이 아닌 경우, 최대 wrapcol 문자마다 개행 문자 (
b'\n') 를 삽입합니다. wrapcol 이 0인 경우 (기본값), 개행 문자를 삽입하지 않습니다.newline 이 true인 경우(기본값), 출력 끝에 개행 문자가 추가됩니다.
버전 3.6에서 변경: newline 매개 변수가 추가되었습니다.
버전 3.15에서 변경: alphabet, padded 및 wrapcol 매개 변수가 추가되었습니다.
- binascii.a2b_ascii85(string, /, *, foldspaces=False, adobe=False, ignorechars=b'', canonical=False)¶
Ascii85 데이터를 바이너리로 다시 변환하고 바이너리 데이터를 반환합니다.
유효한 Ascii85 데이터는 다섯 개씩 묶인 Ascii85 알파벳 문자(마지막 그룹 제외, 마지막 그룹은 2개에서 5개 문자를 가질 수 있음)를 포함합니다. 각 그룹은
0부터2 ** 32 - 1범위의 32비트 바이너리 데이터를 인코딩합니다. 특수 문자z는 4개의 연속된 null 바이트를 인코딩하는 그룹!!!!!의 짧은 형태로 허용됩니다. 단일 문자 최종 그룹은 항상 인코딩 위반으로 거부됩니다.foldspaces 는 ‘y’ 짧은 시퀀스가 4개의 연속된 스페이스 (ASCII 0x20)의 약어로 사용되는지를 지정하는 플래그입니다. 이 기능은 “표준” Ascii85 인코딩에서 지원되지 않습니다.
adobe 는 인코딩된 바이트 시퀀스가 PostScript base-85 문자열 리터럴에서처럼
<~와~>로 프레임화되는지를 제어합니다. adobe 가 true인 경우, 선행<~는 선택적으로 허용되며, 후행~>는 필수 이고, 존재하지 않으면binascii.Error가 발생합니다.ignorechars 는 입력에서 무시할 문자를 포함하는 바이트열류 객체 이어야 합니다. 여기에는 공백 문자만 포함되어야 합니다.
canonical 이 true인 경우, 비정규 인코딩은
binascii.Error를 발생시켜 거부됩니다. 여기서 “정규”라는 것은b2a_ascii85()가 생성할 인코딩을 의미합니다. 즉, 모든 0 그룹에는!!!!!대신z약어가 사용되어야 하고, 부분적인 최종 그룹은 인코더와 동일한 패딩 숫자를 사용해야 합니다.유효하지 않은 Ascii85 데이터는
binascii.Error를 발생시킵니다.Added in version 3.15.
- binascii.b2a_ascii85(data, /, *, foldspaces=False, wrapcol=0, pad=False, adobe=False)¶
바이너리 data를 Ascii85 코딩으로 포맷된 ASCII 문자 시퀀스로 변환합니다. 반환 값은 변환된 데이터입니다.
foldspaces 는 ‘btoa’에서 지원하는 것처럼 4개의 연속 공백(ASCII 0x20) 대신 특별한 짧은 시퀀스 ‘y’를 사용하는 선택적 플래그입니다. 이 기능은 “표준” Ascii85 인코딩에서 지원되지 않습니다.
wrapcol 이 0이 아닌 경우, 최대 wrapcol 문자마다 개행 문자 (
b'\n') 를 삽입합니다. wrapcol 이 0인 경우 (기본값), 개행 문자를 삽입하지 않습니다.pad 가 참이면, 입력 끝에 적용된 0 패딩은
btoa가 수행하는 것처럼 출력 인코딩에 완전히 보존되어 정확히 5바이트의 배수 출력을 생성합니다. 이는 데이터 길이를 보존하지 않기 때문에 PDF에서 사용되는 표준 인코딩의 일부가 아닙니다.adobe\는 인코딩된 바이트 시퀀스가 PostScript base-85 문자열 리터럴에서와 같이
<~\ 및~>\로 프레임화되는지를 제어합니다. 주의할 점은 PDF 문서에서 ASCII85Decode 스트림은~>\로 종료되어야 하지만, 선행<~\를 사용해서는 안 된다는 것입니다.Added in version 3.15.
- binascii.a2b_base85(string, /, *, alphabet=BASE85_ALPHABET, ignorechars=b'', canonical=False)¶
Base85 데이터를 바이너리로 역변환하고 바이너리 데이터를 반환합니다. 한 번에 한 줄 이상을 전달할 수 있습니다.
유효한 Base85 데이터는 Base85 알파벳에서 다섯 개 단위로 포함된 문자로 구성됩니다(마지막 그룹은 두 개에서 다섯 개의 문자를 가질 수 있음). 각 그룹은
0부터2 ** 32 - 1까지 범위의 32비트 이진 데이터를 인코딩합니다. 단일 문자로 구성된 마지막 그룹은 항상 인코딩 위반으로 거부됩니다.선택적 alphabet 는 대체 알파벳을 지정하는 길이 85의
bytes객체여야 합니다.ignorechars\는 입력에서 무시할 문자가 포함된 :term:`바이트열류 객체 <bytes-like object>`입니다.
canonical 가 참이면, 비표준 인코딩은
binascii.Error로 거부됩니다. 여기서 “canonical”은b2a_base85()가 생성할 인코딩을 의미합니다. 부분적인 최종 그룹은 인코더와 동일한 패딩 숫자를 사용해야 합니다.유효하지 않은 Base85 데이터는 :exc:`binascii.Error`를 발생시킵니다.
Added in version 3.15.
- binascii.b2a_base85(data, /, *, alphabet=BASE85_ALPHABET, wrapcol=0, pad=False)¶
바이너리 데이터를 Base85 코딩으로 ASCII 문자 줄로 변환합니다. 반환 값은 변환된 줄입니다.
선택적 alphabet 는 대체 알파벳을 지정하는 길이 85의 bytes-like object 여야 합니다.
wrapcol 이 0이 아닌 경우, 최대 wrapcol 문자마다 개행 문자 (
b'\n') 를 삽입합니다. wrapcol 이 0인 경우 (기본값), 개행 문자를 삽입하지 않습니다.pad 가 참이면, 입력 끝에 적용된 0 패딩은 출력에 유지되며, 이는 항상 5바이트의 배수가 되므로 디코딩 시 데이터 길이가 보존되지 않을 수 있습니다.
Added in version 3.15.
- binascii.a2b_base32(string, /, *, padded=True, alphabet=BASE32_ALPHABET, ignorechars=b'', canonical=False)¶
base32 데이터를 바이너리로 역변환하고 바이너리 데이터를 반환합니다.
유효한 base32 데이터에는 RFC 4648 에서 지정된 base32 알파벳의 문자가 여덟 개 단위로 포함됩니다(필요한 경우, 마지막 그룹은
=로 여덟 문자에 패딩됩니다). 각 그룹은0부터2 ** 40 - 1까지 범위의 40비트 이진 데이터를 인코딩합니다.참고
이 함수는 소문자 문자(표준 base32에서 유효하지 않은)를 해당 대문자 대응문자로 매핑하지 않으며, RFC 4648 에서 허용하는 것처럼
0을O로,1을I/L로 문맥적으로 매핑하지도 않습니다.선택적 alphabet 는 대체 알파벳을 지정하는 길이 32의
bytes객체여야 합니다.padded*가 참이면, 8개 base32 알파벳 문자로 구성된 마지막 그룹은 ‘=’ 문자로 패딩되어야 합니다. *padded*가 거짓이면, ‘=’ 문자는 다른 비알파벳 문자로 처리됩니다( *ignorechars 값에 따라 다름).
ignorechars 는 입력에서 무시할 문자가 포함된 bytes-like object 이어야 합니다. ignorechars 가 패딩 문자
'='를 포함하는 경우, 인코딩된 데이터 끝 이전에 제시된 패딩 문자 및 초과 패딩 문자는 무시됩니다.canonical 가 참이면, 마지막 그룹의 0이 아닌 패딩 비트는
binascii.Error로 거부되며, RFC 4648 섹션 3.5에 정의된 캐노니컬 인코딩이 강제됩니다.유효하지 않은 base32 데이터는 :exc:`binascii.Error`를 발생시킵니다.
Added in version 3.15.
- binascii.b2a_base32(data, /, *, padded=True, alphabet=BASE32_ALPHABET, wrapcol=0)¶
:rfc:`4648`에 지정된 대로 바이너리 데이터를 base32 코딩으로 ASCII 문자 줄로 변환합니다. 반환 값은 변환된 줄입니다.
선택적 alphabet 는 대체 알파벳을 지정하는 길이 32의 bytes-like object 여야 합니다.
padded 가 True인 경우 (기본값), 인코딩된 데이터의 크기를 8의 배수로 만들기 위해 ‘=’ 문자로 패딩합니다. padded 가 False인 경우, 패딩 문자를 추가하지 않습니다.
wrapcol 이 0이 아닌 경우, 최대 wrapcol 문자마다 개행 문자 (
b'\n') 를 삽입합니다. wrapcol 이 0인 경우 (기본값), 개행 문자를 삽입하지 않습니다.Added in version 3.15.
- binascii.a2b_qp(data, header=False)¶
quoted-printable data 블록을 바이너리로 역변환하고 바이너리 데이터를 반환합니다. 한 번에 한 줄 이상을 전달할 수 있습니다. 선택적 인자 header가 있고 참이면, 밑줄(underscore)은 스페이스로 디코딩됩니다.
- binascii.b2a_qp(data, quotetabs=False, istext=True, header=False)¶
바이너리 data를 quoted-printable 인코딩으로 ASCII 문자의 줄로 변환합니다. 반환 값은 변환된 줄입니다. 선택적 인자 quotetabs가 있고 참이면, 모든 탭과 스페이스가 인코딩됩니다. 선택적 인자 istext가 있고 참이면, 개행 문자는 인코딩되지 않지만, 후행 공백은 인코딩됩니다. 선택적 인자 header가 있고 참이면, 스페이스는 RFC 1522에 따라 밑줄로 인코딩됩니다. 선택적 인자 header가 있고 거짓이면, 개행 문자도 함께 인코딩됩니다; 그렇지 않으면 라인 피드(linefeed) 변환이 바이너리 데이터 스트림을 손상할 수 있습니다.
- binascii.crc_hqx(data, value)¶
초기 CRC value로 시작하는, data의 16비트 CRC 값을 계산하고 결과를 반환합니다. 종종 0x1021로 표시되는, CRC-CCITT 다항식 x16 + x12 + x5 + 1을 사용합니다. 이 CRC는 binhex4 형식에서 사용됩니다.
- binascii.crc32(data[, value])¶
초기 CRC value로 시작하는, data의 부호 없는 32비트 체크섬인 CRC-32를 계산합니다. 기본 초기 CRC는 0입니다. 이 알고리즘은 ZIP 파일 체크섬과 일치합니다. 이 알고리즘은 체크섬 알고리즘으로 사용하도록 설계되었으므로, 일반 해시 알고리즘으로 사용하기에 적합하지 않습니다. 다음과 같이 사용하십시오:
print(binascii.crc32(b"hello world")) # 또는, 두 조각으로: crc = binascii.crc32(b"hello") crc = binascii.crc32(b" world", crc) print('crc32 = {:#010x}'.format(crc))
버전 3.0에서 변경: 결과는 항상 부호 없는 값입니다.
- binascii.b2a_hex(data[, sep[, bytes_per_sep=1]])¶
- binascii.hexlify(data[, sep[, bytes_per_sep=1]])¶
바이너리 data의 16진수 표현을 반환합니다. data의 모든 바이트는 해당 2자리 16진수 표현으로 변환됩니다. 따라서 반환된 바이트열 객체의 길이는 data 의 두 배입니다.
비슷한 기능(하지만 텍스트 문자열을 반환하는)을
bytes.hex()메서드를 사용하여 편리하게 액세스할 수도 있습니다.sep이 지정되면, 단일 문자 문자열이나 바이트열 객체여야 합니다. bytes_per_sep 입력 바이트마다 출력에 삽입됩니다. 구분자 배치는 기본적으로 출력의 오른쪽 끝에서부터 계산됩니다. 왼쪽부터 계산하려면, 음수의 bytes_per_sep 값을 제공하십시오.
>>> import binascii >>> binascii.b2a_hex(b'\xb9\x01\xef') b'b901ef' >>> binascii.hexlify(b'\xb9\x01\xef', '-') b'b9-01-ef' >>> binascii.b2a_hex(b'\xb9\x01\xef', b'_', 2) b'b9_01ef' >>> binascii.b2a_hex(b'\xb9\x01\xef', b' ', -2) b'b901 ef'
버전 3.8에서 변경: sep과 bytes_per_sep 매개 변수가 추가되었습니다.
- binascii.a2b_hex(hexstr, *, ignorechars=b'')¶
- binascii.unhexlify(hexstr, *, ignorechars=b'')¶
16진수 문자열 hexstr로 표현된 바이너리 데이터를 반환합니다. 이 함수는
b2a_hex()의 역함수입니다. hexstr는 짝수개의 16진수(대소문자 모두 가능합니다)를 포함해야 하며, 그렇지 않으면Error예외가 발생합니다.ignorechars\는 입력에서 무시할 문자가 포함된 :term:`바이트열류 객체 <bytes-like object>`입니다.
비슷한 기능(공백에 대해 더 느슨하지만 텍스트 문자열 인자만 허용)은
bytes.fromhex()클래스 메서드를 사용하여 액세스할 수도 있습니다.버전 3.15에서 변경: ignorechars\ 매개 변수가 추가되었습니다.
- exception binascii.Error¶
에러 시 발생하는 예외. 이들은 대개 프로그래밍 에러입니다.
- exception binascii.Incomplete¶
불완전한 데이터에서 발생하는 예외. 이들은 일반적으로 프로그래밍 에러가 아니지만, 조금 더 많은 데이터를 읽고 다시 시도하면 처리될 수 있습니다.
- binascii.URLSAFE_BASE64_ALPHABET¶
:rfc:`4648`에 따른 “URL 및 파일명 안전” Base 64 알파벳.
Added in version 3.15.
- binascii.UU_ALPHABET¶
uuencoding 알파벳.
Added in version 3.15.
- binascii.BINHEX_ALPHABET¶
클래식 Mac OS의 BinHex 4 (HQX)에 사용되는 Base 64 알파벳.
Added in version 3.15.
- binascii.BASE85_ALPHABET¶
Base85 알파벳.
Added in version 3.15.
- binascii.ASCII85_ALPHABET¶
Ascii85 알파벳.
Added in version 3.15.