要合并多个 CSV 文件并利用结果进行计算,您可以按照以下步骤进行操作:
- 导入所需的模块:
import pandas as pd
import glob
- 使用
glob
模块获取要合并的所有 CSV 文件路径:
file_paths = glob.glob('文件夹路径/*.csv')
这将返回一个包含所有 CSV 文件路径的列表。
- 创建一个空的 DataFrame 用于存储合并后的数据:
merged_data = pd.DataFrame()
- 使用循环遍历每个 CSV 文件,并将其内容合并到
merged_data
中:
for file_path in file_paths:
df = pd.read_csv(file_path) # 读取 CSV 文件为 DataFrame
merged_data = pd.concat([merged_data, df], ignore_index=True) # 合并 DataFrame
请注意,上述代码假定所有 CSV 文件具有相同的列结构,并且您希望将它们按行合并。
- 在得到合并后的
merged_data
后,您可以根据需要进行进一步的计算和分析。例如,计算某一列的总和:
column_sum = merged_data['列名'].sum()
完整的代码示例:
import pandas as pd
import glob
file_paths = glob.glob('文件夹路径/*.csv')
merged_data = pd.DataFrame()
for file_path in file_paths:
df = pd.read_csv(file_path)
merged_data = pd.concat([merged_data, df], ignore_index=True)
column_sum = merged_data['列名'].sum()
print("合并后的数据:")
print(merged_data)
print("列名的总和:", column_sum)
请确保将 '文件夹路径'
替换为包含要合并的 CSV 文件的实际文件夹路径,并将 '列名'
替换为您要计算总和的列的实际列名。