位置：文档库 > Python > 深入了解python文件读写操作的方法

深入了解python文件读写操作的方法

橘子味晚风上传于 2020-08-01 06:14

《深入了解Python文件读写操作的方法》

在Python编程中，文件读写是基础且核心的操作之一。无论是处理日志文件、配置文件，还是读写CSV、JSON等结构化数据，掌握文件操作的方法都能显著提升开发效率。本文将系统介绍Python文件读写的核心方法，涵盖基础操作、高级技巧及常见问题解决方案，帮助读者构建完整的文件处理知识体系。

一、文件操作基础：打开与关闭

Python通过内置的open()函数实现文件操作，其基本语法为：

file_obj = open(file_path, mode='r', encoding='utf-8')

参数说明：

file_path：文件路径（相对或绝对路径）
mode：打开模式（默认为只读'r'）
encoding：字符编码（推荐显式指定，避免乱码）

常用打开模式：

模式	描述
r	只读（默认）
w	写入（覆盖原有内容）
a	追加（在文件末尾添加）
x	独占创建（文件已存在则报错）
b	二进制模式（如`'rb'`）
+	读写模式（如`'r+'`）

示例：打开文本文件并读取内容

with open('example.txt', 'r', encoding='utf-8') as f:
    content = f.read()
print(content)

使用with语句可自动管理文件资源，无需手动调用close()，避免资源泄漏。

二、文件读取方法详解

Python提供多种文件读取方式，适用于不同场景：

1. 读取全部内容：`read()`

with open('data.txt', 'r') as f:
    full_text = f.read()  # 返回字符串（文本模式）或字节（二进制模式）

特点：一次性加载整个文件，适合小文件；大文件可能导致内存不足。

2. 逐行读取：`readline()`与迭代

方法一：使用readline()

with open('lines.txt', 'r') as f:
    while True:
        line = f.readline()
        if not line:
            break
        print(line.strip())  # 去除行尾换行符

方法二：直接迭代文件对象（推荐）

with open('lines.txt', 'r') as f:
    for line in f:  # 每次迭代返回一行
        print(line.strip())

特点：内存效率高，适合处理大文件。

3. 读取所有行：`readlines()`

with open('multi_line.txt', 'r') as f:
    lines = f.readlines()  # 返回包含所有行的列表
for line in lines:
    print(line.rstrip())

注意：大文件时慎用，可能占用过多内存。

三、文件写入操作

写入操作的核心是write()方法，需注意模式选择：

1. 覆盖写入：模式`'w'`

with open('output.txt', 'w', encoding='utf-8') as f:
    f.write('第一行内容\n')
    f.write('第二行内容\n')

警告：若文件已存在，原有内容将被清空。

2. 追加写入：模式`'a'`

with open('log.txt', 'a', encoding='utf-8') as f:
    f.write('新日志条目\n')

3. 写入多行：`writelines()`

lines = ['Line 1\n', 'Line 2\n', 'Line 3\n']
with open('batch.txt', 'w') as f:
    f.writelines(lines)  # 需自行包含换行符

四、二进制文件操作

处理图片、音频等非文本文件时，需使用二进制模式（'b'）：

# 复制图片文件
with open('source.jpg', 'rb') as src:
    data = src.read()
with open('copy.jpg', 'wb') as dst:
    dst.write(data)

五、高级文件操作技巧

1. 上下文管理器与异常处理

自定义上下文管理器示例：

class FileManager:
    def __init__(self, filename, mode):
        self.filename = filename
        self.mode = mode

    def __enter__(self):
        self.file = open(self.filename, self.mode)
        return self.file

    def __exit__(self, exc_type, exc_val, exc_tb):
        self.file.close()
        if exc_type is not None:
            print(f"发生异常: {exc_val}")

# 使用示例
with FileManager('test.txt', 'w') as f:
    f.write('Hello, World!')

2. 文件路径处理：`os.path`与`pathlib`

Python 3.4+推荐使用pathlib：

from pathlib import Path

# 创建Path对象
file_path = Path('docs') / 'subfolder' / 'file.txt'

# 检查路径是否存在
if file_path.exists():
    print(f"文件大小: {file_path.stat().st_size} 字节")

# 写入文件
file_path.write_text('Pathlib示例内容', encoding='utf-8')

3. CSV文件操作

使用csv模块处理结构化数据：

import csv

# 写入CSV
data = [
    ['Name', 'Age', 'City'],
    ['Alice', '28', 'New York'],
    ['Bob', '32', 'London']
]
with open('people.csv', 'w', newline='', encoding='utf-8') as f:
    writer = csv.writer(f)
    writer.writerows(data)

# 读取CSV
with open('people.csv', 'r', encoding='utf-8') as f:
    reader = csv.reader(f)
    for row in reader:
        print(row)

4. JSON文件操作

import json

# 写入JSON
data = {
    'name': 'John',
    'age': 30,
    'cities': ['New York', 'Paris']
}
with open('data.json', 'w', encoding='utf-8') as f:
    json.dump(data, f, indent=4)  # indent参数美化输出

# 读取JSON
with open('data.json', 'r', encoding='utf-8') as f:
    loaded_data = json.load(f)
print(loaded_data)

六、常见问题与解决方案

1. 编码问题

问题：读取文件时出现UnicodeDecodeError

解决方案：明确指定编码（推荐UTF-8），或尝试常见编码如'gbk'：

try:
    with open('file.txt', 'r', encoding='utf-8') as f:
        content = f.read()
except UnicodeDecodeError:
    with open('file.txt', 'r', encoding='gbk') as f:
        content = f.read()

2. 文件未找到错误

使用try-except捕获FileNotFoundError：

try:
    with open('nonexistent.txt', 'r') as f:
        print(f.read())
except FileNotFoundError:
    print("文件不存在，请检查路径")

3. 大文件处理优化

分块读取大文件（如日志文件）：

chunk_size = 1024 * 1024  # 1MB
with open('large_file.log', 'r') as f:
    while True:
        chunk = f.read(chunk_size)
        if not chunk:
            break
        # 处理每个数据块
        process_chunk(chunk)