`csv` — CSV 파일 읽기와 쓰기¶

소스 코드: Lib/csv.py

소위 CSV (Comma Separated Values – 쉼표로 구분된 값) 형식은 스프레드시트와 데이터베이스에 대한 가장 일반적인 가져오기 및 내보내기 형식입니다. CSV 형식은 RFC 4180에서 표준화된 방식으로 형식을 기술하기 전에 여러 해 동안 사용되었습니다. 잘 정의된 표준이 없다는 것은 다른 애플리케이션에 의해 생성되고 소비되는 데이터에 미묘한 차이가 존재한다는 것을 의미합니다. 이러한 차이로 인해 여러 소스의 CSV 파일을 처리하는 것이 번거로울 수 있습니다. 그러나 분리 문자와 인용 문자가 다양하기는 해도, 전체 형식은 유사하여 프로그래머에게 데이터 읽기와 쓰기 세부 사항을 숨기면서도 이러한 데이터를 효율적으로 조작할 수 있는 단일 모듈을 작성하는 것이 가능합니다.

csv 모듈은 CSV 형식의 표 데이터(tabular data)를 읽고 쓰는 클래스를 구현합니다. 이 모듈을 통해 프로그래머는 Excel이 사용하는 CSV 형식의 세부 사항을 정확히 알지 못하더라도 “Excel에서 선호하는 형식으로 데이터를 기록”하거나 “Excel에서 생성된 파일의 데이터를 읽어오기” 같은 작업을 수행할 수 있습니다. 또한, 프로그래머는 다른 애플리케이션이 지원하는 CSV 형식을 기술하거나 특정 목적에 맞는 고유한 CSV 형식을 정의할 수도 있습니다.

The csv module’s reader and writer objects read and write sequences. Programmers can also read and write data in dictionary form using the DictReader and DictWriter classes.

PEP 305 - CSV File API: 파이썬에 이 모듈의 추가를 제안한 파이썬 개선 제안.

모듈 내용¶

csv 모듈은 다음 함수들을 정의합니다.

csv.reader(csvfile, /, dialect='excel', **fmtparams)¶

지정된 csvfile의 줄을 처리하는 판독기(reader) 객체를 반환합니다. csvfile은 문자열의 이터러블이어야 하며, 각 문자열은 판독기가 정의한 csv 형식이어야 합니다. csvfile은 보통 파일류 객체이거나 리스트입니다. csvfile가 파일 객체이면, newline=''로 열렸어야 합니다. [1] 특정 CSV 방언(dialect)에만 적용되는 파라미터 집합을 정의하는 데 사용되는 선택적 dialect 매개 변수를 지정할 수 있습니다. Dialect 클래스의 서브 클래스의 인스턴스이거나 list_dialects() 함수가 반환하는 문자열 중 하나일 수 있습니다. 다른 선택적 fmtparams 키워드 인자는 현재 방언의 개별 포매팅 파라미터를 대체 할 수 있습니다. 방언과 포매팅 파라미터에 대한 자세한 내용은 방언과 포매팅 파라미터 절을 참조하십시오.

CSV 파일에서 읽은 각 행은 문자열의 리스트로 반환됩니다. QUOTE_NONNUMERIC 형식 옵션이 지정된 경우를 제외하고는 자동으로 데이터 형 변환을 수행하지 않습니다(해당 옵션이 설정되면 인용되지 않은 필드는 실수형으로 변환됩니다).

간단한 사용 예:

>>> import csv
>>> with open('eggs.csv', newline='') as csvfile:
...     spamreader = csv.reader(csvfile, delimiter=' ', quotechar='|')
...     for row in spamreader:
...         print(', '.join(row))
Spam, Spam, Spam, Spam, Spam, Baked Beans
Spam, Lovely Spam, Wonderful Spam

eggs.csv 이(가) 다음 내용을 포함하는 경우:

Spam Spam Spam Spam Spam |Baked Beans|
Spam |Lovely Spam| |Wonderful Spam|

csv.writer(csvfile, /, dialect='excel', **fmtparams)¶

지정된 파일류 객체에 분리된 문자열로 사용자의 데이터를 변환하는 기록기(writer) 객체를 반환합니다. csvfile은 write() 메서드가 있는 모든 객체일 수 있습니다. csvfile이 파일 객체면, newline=''으로 열렸어야 합니다 [1]. 특정 CSV 방언(dialect)에만 적용되는 파라미터 집합을 정의하는 데 사용되는 선택적 dialect 매개 변수를 지정할 수 있습니다. Dialect 클래스의 서브 클래스의 인스턴스이거나 list_dialects() 함수가 반환하는 문자열 중 하나일 수 있습니다. 다른 선택적 fmtparams 키워드 인자는 현재 방언의 개별 포매팅 파라미터를 대체 할 수 있습니다. 방언과 포매팅 파라미터에 대한 자세한 내용은 방언과 포매팅 파라미터 절을 참조하십시오. DB API를 구현하는 모듈과 가능한 한 쉽게 인터페이스 하기 위해, 값 None은 빈 문자열로 기록됩니다. 이것은 가역 변환이 아니지만, cursor.fetch* 호출에서 반환된 데이터를 전처리하지 않고도, SQL NULL 데이터값을 CSV 파일로 쉽게 덤프할 수 있습니다. 다른 모든 비 문자열 데이터는 기록 전에 str()로 문자열화 됩니다.

간단한 사용 예:

import csv
with open('eggs.csv', 'w', newline='') as csvfile:
    spamwriter = csv.writer(csvfile, delimiter=' ',
                            quotechar='|', quoting=csv.QUOTE_MINIMAL)
    spamwriter.writerow(['Spam'] * 5 + ['Baked Beans'])
    spamwriter.writerow(['Spam', 'Lovely Spam', 'Wonderful Spam'])

eggs.csv 를 생성하며, 내용은 다음과 같습니다.

Spam Spam Spam Spam Spam |Baked Beans|
Spam |Lovely Spam| |Wonderful Spam|

csv.register_dialect(name, /, dialect='excel', **fmtparams)¶: dialect를 name과 연관시킵니다. name은 문자열이어야 합니다. 방언은 Dialect의 서브 클래스 전달, fmtparams 키워드 인자 또는 둘 모두를 사용하여 지정할 수 있는데, 키워드 인자가 dialect의 매개 변수보다 우선합니다. 방언과 포매팅 파라미터에 대한 자세한 내용은 방언과 포매팅 파라미터 절을 참조하십시오.

csv.unregister_dialect(name)¶: 방언(dialect) 등록소에서 name과 관련된 연관된 방언을 삭제합니다. name이 등록된 방언 이름이 아니면 Error가 발생합니다.

csv.get_dialect(name)¶: name과 연관된 방언을 반환합니다. name이 등록된 방언 이름이 아니면 Error가 발생합니다. 이 함수는 불변 Dialect를 반환합니다.

csv.list_dialects()¶: 등록된 모든 방언의 이름을 반환합니다.

csv.field_size_limit()¶
csv.field_size_limit(new_limit): 구문 분석기가 허락하는 현재의 최대 필드 크기를 반환합니다. new_limit가 주어지면, 이것이 새로운 한계가 됩니다.

csv 모듈은 다음 클래스들을 정의합니다.

class csv.DictReader(f, fieldnames=None, restkey=None, restval=None, dialect='excel', *args, **kwds)¶

일반 판독기처럼 작동하지만 각 행(row)의 정보를 키가 선택적 fieldnames 매개 변수로 지정된 dict로 매핑하는 객체를 만듭니다.

fieldnames 매개 변수는 시퀀스입니다. fieldnames를 생략하면, 파일 f의 첫 번째 행에 있는 값들을 fieldnames로 사용하며 결과에서 생략됩니다. fieldnames를 제공하면, 사용되고 첫 번째 행은 결과에 포함됩니다. 필드 이름이 어떻게 결정되는지와 관계없이, 딕셔너리는 원래 순서를 유지합니다.

행에 fieldnames보다 많은 필드가 있으면, 나머지 데이터가 리스트에 저장되고 restkey(기본값은 None)로 지정된 필드 이름으로 저장됩니다. 비어 있지 않은 행에 fieldnames보다 필드 수가 적다면, 빠진 값은 restval(기본값은 None)의 값으로 채워집니다.

다른 모든 선택적 또는 키워드 인자는 하부 reader 인스턴스에 전달됩니다.

fieldnames 에 전달된 인자가 이터레이터인 경우, 해당 인자는 list 로 변환됩니다.

버전 3.6에서 변경: 반환된 행은 이제 OrderedDict 형입니다.

버전 3.8에서 변경: 반환된 행은 이제 dict 형입니다.

간단한 사용 예:

>>> import csv
>>> with open('names.csv', newline='') as csvfile:
...     reader = csv.DictReader(csvfile)
...     for row in reader:
...         print(row['first_name'], row['last_name'])
...
Eric Idle
John Cleese

>>> print(row)
{'first_name': 'John', 'last_name': 'Cleese'}

names.csv 이(가) 다음 내용을 포함하는 경우:

first_name,last_name
Eric,Idle
John,Cleese

class csv.DictWriter(f, fieldnames, restval='', extrasaction='raise', dialect='excel', *args, **kwds)¶

일반 기록기처럼 작동하지만 딕셔너리를 출력 행에 매핑하는 객체를 만듭니다. fieldnames 매개 변수는 키의 시퀀스인데, writerow() 메서드에 전달된 딕셔너리의 값이 f 파일에 기록되는 순서를 식별합니다. 선택적 restval 매개 변수는 딕셔너리에 fieldnames의 키가 빠졌을 때 기록될 값을 지정합니다. writerow() 메서드에 전달된 딕셔너리에 fieldnames에 없는 키가 포함되어 있으면, 선택적 extrasaction 매개 변수가 수행할 작업을 지시합니다. 기본값인 'raise'로 설정되면, ValueError가 발생합니다. 'ignore'로 설정하면, 딕셔너리의 추가 값이 무시됩니다. 다른 선택적 또는 키워드 인자는 하부 writer 인스턴스에 전달됩니다.

DictReader 클래스와 달리 DictWriter 클래스의 fieldnames 매개 변수는 선택 사항이 아닙니다.

fieldnames 에 전달된 인자가 이터레이터인 경우, 해당 인자는 list 로 변환됩니다.

간단한 사용 예:

import csv

with open('names.csv', 'w', newline='') as csvfile:
    fieldnames = ['first_name', 'last_name']
    writer = csv.DictWriter(csvfile, fieldnames=fieldnames)

    writer.writeheader()
    writer.writerow({'first_name': 'Baked', 'last_name': 'Beans'})
    writer.writerow({'first_name': 'Lovely', 'last_name': 'Spam'})
    writer.writerow({'first_name': 'Wonderful', 'last_name': 'Spam'})

names.csv 를 생성하며, 내용은 다음과 같습니다.

first_name,last_name
Baked,Beans
Lovely,Spam
Wonderful,Spam

class csv.Dialect¶

Dialect 클래스는 큰따옴표, 공백, 구분자 등의 처리 방식에 대한 정보를 담고 있는 컨테이너 클래스입니다. 엄격한 CSV 규격이 없기 때문에 서로 다른 애플리케이션은 미묘하게 다른 CSV 데이터를 생성할 수 있습니다. Dialect 인스턴스는 reader 와 writer 인스턴스의 동작 방식을 정의합니다.

사용 가능한 모든 Dialect 이름은 list_dialects`에 의해 반환되며, 이들은 다음과 같이 초기화자(``__init__`()) 함수를 통해 특정 reader 및 writer 클래스에 등록될 수 있습니다:

import csv

with open('students.csv', 'w', newline='') as csvfile:
    writer = csv.writer(csvfile, dialect='unix')

class csv.excel¶: excel 클래스는 Excel에서 생성한 CSV 파일의 일반적인 속성을 정의합니다. 방언 이름 'excel'로 등록됩니다.

class csv.excel_tab¶: excel_tab 클래스는 Excel에서 생성된 TAB 구분 파일의 일반적인 속성을 정의합니다. 방언 이름 'excel-tab'으로 등록됩니다.

class csv.unix_dialect¶: unix_dialect 클래스는 유닉스 시스템에서 생성된 CSV 파일의 일반적인 속성을 정의합니다. 즉, '\n'을 줄 종결자로 사용하고 모든 필드를 인용 처리합니다. 방언 이름 'unix'로 등록됩니다.

Added in version 3.2.

class csv.Sniffer¶

Sniffer 클래스는 CSV 파일의 형식을 추론하는 데 사용됩니다.

Sniffer 클래스는 두 가지 메서드를 제공합니다:

sniff(sample, delimiters=None)¶

지정된 sample을 분석하고 발견된 파라미터를 반영하는 Dialect 서브 클래스를 반환합니다. 선택적인 delimiters 매개 변수를 주면, 가능한 유효한 구분 문자를 포함하는 문자열로 해석됩니다.

다이얼렉트는 샘플을 모든 가능한 매개 변수 조합으로 파싱하고, 샘플을 가장 일관된 수의 필드로 나누는 조합을 선택하여 추론하며, 반환되는 다이얼렉트는 reader() 가 샘플을 파싱하는 방식과 일치합니다. 적절한 조합이 없는 경우(특히 구분자를 찾을 수 없는 단일 열인 경우)에 Error 를 발생시킵니다.

여러 조합이 샘플과 동일하게 잘 맞는 경우(예를 들어 ',' 와 ';' 가 각각 모든 행을 일관되게 분할하는 경우), 구분자 ',', '\t', ';', ' ' 및 ':' 가 빈도에 관계없이 위 순서대로 우선적으로 선택됩니다.

버전 3.16.0a0 (unreleased)에서 변경: 이제 다이얼렉트가 시도 파싱을 통해 추론되므로 이전 Python 버전의 결과와 다를 수 있습니다. 이제 escapechar 매개 변수를 감지할 수 있으며, 요청한 delimiters 는 ASCII에 제한되지 않습니다.

has_header(sample)¶

sample 텍스트(CSV 형식으로 추정합니다)를 분석하고, 첫 번째 행이 일련의 열 머리글로 보이면 True를 반환합니다. 각 열을 검사하면서, 샘플에 헤더가 포함되어 있는지 추정하기 위해 두 가지 주요 기준 중 하나가 고려됩니다:

두 번째부터 n번째 행까지가 숫자 값을 포함함
두 번째부터 n번째 행까지가 문자열을 포함하며, 해당 열의 추정 헤더와 길이가 다른 값이 최소 하나 이상 포함됨

헤더 이후의 21개 행을 샘플링하며, 열과 행 중 절반 이상이 기준을 충족하면 True 를 반환합니다.

참고

이 메서드는 대략적인 휴리스틱을 기반으로 하며, 오탐(false positive)이나 미탐(false negative)을 발생시킬 수 있습니다.

Sniffer 사용 예:

with open('example.csv', newline='') as csvfile:
    dialect = csv.Sniffer().sniff(csvfile.read(1024))
    csvfile.seek(0)
    reader = csv.reader(csvfile, dialect)
    # ... CSV 파일 내용을 여기에서 처리합니다 ...

csv 모듈은 다음 상수를 정의합니다.

csv.QUOTE_ALL¶: writer 객체에 모든 필드를 인용 처리하도록 지시합니다.

csv.QUOTE_MINIMAL¶: writer 객체에게 delimiter, quotechar, '\r', '\n' 또는 lineterminator 에 포함된 문자 중 하나를 포함하는 필드만 인용 처리하도록 지시합니다.

csv.QUOTE_NONNUMERIC¶

writer 객체에 모든 숫자가 아닌 필드를 인용 처리하도록 지시합니다.

reader 객체에게 모든 인용되지 않은 필드를 float 타입으로 변환하도록 지시합니다.

참고

bool, Fraction, 또는 IntEnum 과 같은 일부 숫자 타입은 float 으로 변환할 수 없는 문자열 표현을 가집니다. 이들은 QUOTE_NONNUMERIC 및 QUOTE_STRINGS 모드에서 읽어올 수 없습니다.

csv.QUOTE_NONE¶

writer 객체에게 모든 필드에 대해 인용 처리를 하지 않도록 지시합니다. 출력 데이터에 현재 delimiter, quotechar, escapechar, '\r', '\n' 또는 lineterminator 의 문자가 포함된 경우 그 앞에 현재 escapechar 를 붙입니다. escapechar 가 설정되지 않은 상태에서 이스케이프 처리가 필요한 문자가 나타나면 작성자는 Error 를 발생시킵니다. quotechar 를 None 으로 설정하면 해당 문자의 이스케이프 처리를 방지할 수 있습니다.

reader 객체에게 인용 문자의 특별한 처리를 수행하지 않도록 지시합니다.

csv.QUOTE_NOTNULL¶

writer 객체에게 None 이 아닌 모든 필드를 인용 처리하도록 지시합니다. 이는 QUOTE_ALL 과 유사하지만, 필드 값이 None 인 경우 빈 문자열(인용되지 않음)을 기록한다는 점이 다릅니다.

reader 객체에게 빈 문자열(인용되지 않음)을 None 으로 해석하고, 그 외의 경우에는 QUOTE_ALL 처럼 동작하도록 지시합니다.

Added in version 3.12.

csv.QUOTE_STRINGS¶

writer 객체에게 문자열인 모든 필드를 항상 인용 처리하도록 지시합니다. 이는 QUOTE_NONNUMERIC 과 유사하지만, 필드 값이 None 인 경우 빈 문자열(인용되지 않음)을 기록한다는 점이 다릅니다.

reader 객체에게 빈 문자열(인용되지 않음)을 None 으로 해석하고, 그 외의 경우에는 QUOTE_NONNUMERIC 처럼 동작하도록 지시합니다.

Added in version 3.12.

csv 모듈은 다음 예외를 정의합니다:

exception csv.Error¶: 에러가 감지될 때 모든 함수가 발생시킵니다.

방언과 포매팅 파라미터¶

입력과 출력 레코드의 형식을 더 쉽게 지정할 수 있도록, 특정 포매팅 파라미터가 함께 방언으로 묶입니다. 방언(dialect)은 CSV 파일의 형식을 설명하는 다양한 어트리뷰트를 포함하는 Dialect 클래스의 서브 클래스입니다. reader나 writer 객체를 만들 때, 프로그래머는 문자열이나 Dialect 클래스의 서브 클래스를 dialect 매개 변수로 지정할 수 있습니다. dialect 매개 변수에 추가하여, 또는 대신에, 프로그래머는 아래에서 Dialect 클래스에 대해 정의된 어트리뷰트와 같은 이름을 갖는 개별 포매팅 매개 변수를 지정할 수 있습니다.

방언은 다음 어트리뷰트를 지원합니다:

Dialect.delimiter¶: 필드를 구분하는 데 사용되는 한 문자로 된 문자열. 기본값은 ','입니다.

Dialect.doublequote¶

필드 안에 나타나는 quotechar의 인스턴스를 인용 처리하는 방법을 제어합니다. True일 때, 문자를 두 개로 늘립니다. False일 때, escapechar를 quotechar의 접두어로 사용합니다. 기본값은 True입니다.

출력 시, doublequote가 False이고 아무런 escapechar가 설정되지 않았으면, 필드에 quotechar가 있으면 Error가 발생합니다.

Dialect.escapechar¶

작성자가 이스케이프 처리가 필요한 문자를 처리할 때 사용하는 한 문자짜리 문자열:

quoting 이 QUOTE_NONE 으로 설정된 경우, delimiter, quotechar, '\r', '\n' 및 lineterminator 에 포함된 모든 문자가 이스케이프 처리됩니다.

doublequote 가 False 인 경우 quotechar 가 이스케이프 처리됩니다.

escapechar 자체.

읽을 때, escapechar 는 바로 뒤에 오는 문자의 특별한 의미를 제거합니다. 기본값은 이스케이프 처리를 비활성화하는 None 입니다.

버전 3.11에서 변경: 빈 escapechar 는 허용되지 않습니다.

Dialect.lineterminator¶: writer에 의해 생성된 행을 종료하는 데 사용되는 문자열. 기본값은 '\r\n'입니다.

참고

reader는 '\r'이나 '\n'을 줄 종료로 인식하도록 하드 코딩되어 있으며, lineterminator를 무시합니다. 이 동작은 앞으로 변경될 수 있습니다.

Dialect.quotechar¶: delimiter 나 quotechar 와 같은 특수 문자를 포함하거나, 줄바꿈 문자('\r', '\n' 또는 lineterminator 에 포함된 문자)를 포함하는 필드를 인용 처리하는 데 사용되는 한 문자짜리 문자열입니다. 기본값은 '"' 이며, quoting 이 QUOTE_NONE 인 경우 '"' 의 이스케이프 처리를 방지하기 위해 None 으로 설정할 수 있습니다.

버전 3.11에서 변경: 빈 quotechar 는 허용되지 않습니다.

Dialect.quoting¶: 작성자가 인용을 생성할 때와 읽기 단계에서 인용을 인식하는 시점을 제어합니다. 이 옵션은 QUOTE_* 상수들 중 하나를 취할 수 있으며, quotechar 가 None 이 아니면 기본값으로 QUOTE_MINIMAL 을, 그렇지 않으면 QUOTE_NONE 을 사용합니다.

Dialect.skipinitialspace¶: True 일 때, delimiter 바로 뒤의 공백이 무시됩니다. 기본값은 False 입니다. delimiter=' ' 와 skipinitialspace=True 를 함께 사용하면 따옴표로 묶이지 않은 빈 필드가 허용되지 않습니다.

Dialect.strict¶: True일 때, 잘못된 CSV 입력에서 예외 Error를 발생시킵니다. 기본값은 False입니다.

판독기 객체¶

판독기 객체(DictReader 인스턴스와 reader() 함수에서 반환한 객체)에는 다음과 같은 공용 메서드가 있습니다:

csvreader.__next__()¶: 판독기의 이터러블 객체의 다음 행을 현재 Dialect에 따라 구문 분석하여 리스트(객체가 reader()에서 반환된 경우)나 딕셔너리(DictReader 인스턴스인 경우)로 반환합니다. 보통 이것을 next(reader)처럼 호출합니다.

판독기 객체에는 다음과 같은 공용 어트리뷰트가 있습니다:

csvreader.dialect¶: 구문 분석기가 사용 중인 방언의 읽기 전용 설명.

csvreader.line_num¶: 소스 이터레이터에서 읽은 줄 수. 레코드가 여러 줄에 걸쳐 있을 수 있으므로, 이것은 반환된 레코드 수와 같지 않습니다.

DictReader 객체에는 다음과 같은 공용 어트리뷰트가 있습니다:

DictReader.fieldnames¶: 객체를 만들 때 매개 변수로 전달되지 않았으면, 이 어트리뷰트는 첫 번째 액세스 시나 파일에서 첫 번째 레코드를 읽을 때 초기화됩니다.

기록기 객체¶

writer 객체(DictWriter 인스턴스와 writer() 함수에서 반환한 객체)에는 다음과 같은 공용 메서드가 있습니다. row는 writer 객체의 경우 문자열이나 숫자의 이터러블이어야 하며, DictWriter 객체의 경우 fieldnames를 (str()을 먼저 통과시킴으로써) 문자열이나 숫자로 매핑하는 딕셔너리이어야 합니다. 복소수는 괄호로 둘러싸여 기록됨에 유의하십시오. 이것은 CSV 파일을 읽는 다른 프로그램에서 문제를 일으킬 수 있습니다 (복소수를 지원한다고 가정할 때).

csvwriter.writerow(row, /)¶: row 매개 변수를 현재 Dialect에 따라 포매팅해서, 기록기의 파일 객체에 씁니다. 하부 파일 객체의 write 메서드 호출의 반환 값을 반환합니다.

버전 3.5에서 변경: 임의의 이터러블 지원 추가.

csvwriter.writerows(rows, /)¶: rows(위에서 설명한 row 객체의 이터러블)에 있는 모든 요소를 현재 방언에 따라 포매팅해서, 기록기의 파일 객체에 씁니다.

기록기 객체에는 다음과 같은 공용 어트리뷰트가 있습니다:

csvwriter.dialect¶: 기록기가 사용 중인 방언의 읽기 전용 설명.

DictWriter 객체의 공용 메서드는 다음과 같습니다:

DictWriter.writeheader()¶: (생성자에 지정된 대로) 필드 이름을 담은 행을 현재 방언에 따라 포매팅해서, 기록기의 파일 객체에 씁니다. 내부적으로 사용되는 csvwriter.writerow() 호출의 반환 값을 반환합니다.

Added in version 3.2.

버전 3.8에서 변경: writeheader()는 이제 내부적으로 사용하는 csvwriter.writerow() 메서드에서 반환된 값도 반환합니다.

예제¶

CSV 파일을 읽는 가장 간단한 예:

import csv
with open('some.csv', newline='') as f:
    reader = csv.reader(f)
    for row in reader:
        print(row)

다른 형식의 파일 읽기:

import csv
with open('passwd', newline='') as f:
    reader = csv.reader(f, delimiter=':', quoting=csv.QUOTE_NONE)
    for row in reader:
        print(row)

대응하는 가장 간단한 쓰기 예는 다음과 같습니다:

import csv
with open('some.csv', 'w', newline='') as f:
    writer = csv.writer(f)
    writer.writerows(someiterable)

CSV 파일을 읽기로 여는 데 open()이 사용되므로, 파일은 기본적으로 시스템 기본 인코딩(locale.getencoding()를 참조하세요)을 사용하여 유니코드로 디코딩됩니다. 다른 인코딩을 사용하여 파일을 디코딩하려면 open의 encoding 인자를 사용하십시오:

import csv
with open('some.csv', newline='', encoding='utf-8') as f:
    reader = csv.reader(f)
    for row in reader:
        print(row)

시스템 기본 인코딩 이외의 다른 것으로 쓸 때도 마찬가지입니다: 출력 파일을 열 때 encoding 인자를 지정하십시오.

새로운 방언 등록하기:

import csv
csv.register_dialect('unixpwd', delimiter=':', quoting=csv.QUOTE_NONE)
with open('passwd', newline='') as f:
    reader = csv.reader(f, 'unixpwd')

판독기의 약간 더 고급 사용 — 에러 잡기와 보고:

import csv, sys
filename = 'some.csv'
with open(filename, newline='') as f:
    reader = csv.reader(f)
    try:
        for row in reader:
            print(row)
    except csv.Error as e:
        sys.exit(f'file {filename}, line {reader.line_num}: {e}')

또한, 모듈이 문자열 구문 분석을 직접 지원하지는 않지만, 쉽게 수행할 수 있습니다:

import csv
for row in csv.reader(['one,two,three']):
    print(row)

각주

csv — CSV 파일 읽기와 쓰기¶

모듈 내용¶

방언과 포매팅 파라미터¶

판독기 객체¶

기록기 객체¶

예제¶

분실물 보관소

`csv` — CSV 파일 읽기와 쓰기¶