python如何读取excel中的数据,excel怎么提取数据中的部分数据
墨初 知识笔记 44阅读
一文带你实现excel表格的数据提取 今天记录一下如何使用python提取Excel中符合特定条件的数据
01.简单数据类型的提取 序号 a b 11.52.823.24.732.13.644.31.954.13.2
代码如下
在数据处理和分析的过程中我们经常需要从Excel表格中提取特定条件下的数据。Python的pandas库为我们提供了方便的方法来进行数据查询和过滤。
Pandas 是 Python 语言的一个扩展程序库用于数据分析。 Pandas 是一个开放源码、BSD 许可的库提供高性能、易于使用的数据结构和数据分析工具。Pandas 名字衍生自术语 “panel data”面板数据和 “Python data analysis”Python 数据分析。Pandas 一个强大的分析结构化数据的工具集基础是 Numpy提供高性能的矩阵运算。Pandas 可以从各种文件格式比如 CSV、JSON、SQL、Microsoft Excel 导入数据。Pandas 可以对各种数据进行运算操作比如归并、再成形、选择还有数据清洗和数据加工特征。Pandas 广泛应用在学术、金融、统计学等各个数据分析领域。 Pandas应用Pandas 的主要数据结构是 **Series 一维数据**与 DataFrame二维数据这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。

要求提取ab两列中介于2.5到5之间的数据
使用query方法提取数据首先我们将使用query
方法来提取符合条件的数据。query
方法允许我们使用类似SQL的语法进行数据查询。

import pandas as pd# 读取Excel表格df pd.read_excel(data.xlsx) # 将data.xlsx替换为你的文件路径# 使用query方法进行查询query_string 2.5 < x < 5 and 2.5 < y < 5filtered_data df.query(query_string)# 打印提取的数据print(filtered_data)
02.复杂数据类型的数据提取 如下是一个包含70sheet表单的excel工作簿现在要求从该excel中抽取特定的数据列到新表中
import pandas as pdimport openpyxlwb openpyxl.Workbook()# 获取默认工作表ws wb.active# 读取原始Excel文件# df pd.read_excel(SA.xlsx)df pd.read_excel(SA.xlsx, sheet_name[RCD, RPC,RCM,MCV_S,MCV_C,CFV, GCM,SGCS,SGCC,GCSB,GCC_S,GCC,MOV_SO ,MOV_SC,MOV_N,MNV_C,BSV_C,MSV_CSC,MSV_CLC ,MSV_CLO,CAH_N,BAH_N,BAH_L,BAH_OT,MOS_T,MOS_C ,MOS_N,MOS_L,NOPDS,ALA_P,AVIE,SLT8,SLT4,BOOLS ,REALS,EPS,SA,KG,TRAN,SETP,PID,NSD,DV,AMI, DCO,ACO,DCI,ACI6,ACI4,ACI,DM,AM4,AM,SOE,PVI ,DVO,AVO,DVI,AVI8,AVI6,AVI4,AVI])# 创建一个新的Excel文件wb pd.ExcelWriter(new.xlsx)# 遍历每个sheetfor sheet_name, sheet_data in df.items(): # 提取需要的列数据 columns_to_extract [ PN,SN] if all(column in sheet_data.columns for column in columns_to_extract): extracted_data sheet_data[columns_to_extract] # 将提取的数据写入新的Excel文件中的对应sheet extracted_data.to_excel(wb, sheet_namesheet_name, indexFalse) extracted_data.to_excel(new.xlsx, indexFalse)df_extracted pd.read_excel(new.xlsx, sheet_nameNone,engineopenpyxl)# 创建一个新的Excel写入器writer pd.ExcelWriter(merged_1023.xlsx)# 遍历抽取的Excel的每个sheetfor sheet_name, df_sheet in df_extracted.items(): # 将每个sheet写入新的Excel中 df_sheet.to_excel(writer, sheet_name, indexFalse)# 保存并关闭新的Excelwriter.close()wb.close()
详细的注释已经写在上面可以根据自己的需求和条件选择相应的文件进行数据提取
合并结果如下标签: