python如何生成dataframe,Python中生成DataFrame的方法

原创
ithorizon 7个月前 (09-26) 阅读数 65 #Python

Python中生成DataFrame的方法

Python的pandas库提供了生成DataFrame的强大功能,DataFrame是pandas中的一种主要数据结构,用于存储和操作表格数据,下面是一些生成DataFrame的方法:

1、从字典生成DataFrame

可以使用字典来生成DataFrame,其中的键表示列名,值表示列的数据。

import pandas as pd
创建一个字典
data = {'列1': [1, 2, 3], '列2': [4, 5, 6]}
将字典转换为DataFrame
df = pd.DataFrame(data)
打印DataFrame
print(df)

2、从CSV文件生成DataFrame

可以使用pandas的read_csv函数从CSV文件生成DataFrame。

import pandas as pd
读取CSV文件
df = pd.read_csv('文件路径.csv')
打印DataFrame
print(df)

3、从Excel文件生成DataFrame

可以使用pandas的read_excel函数从Excel文件生成DataFrame。

import pandas as pd
读取Excel文件
df = pd.read_excel('文件路径.xlsx')
打印DataFrame
print(df)

4、从SQL数据库生成DataFrame

可以使用pandas的read_sql函数从SQL数据库生成DataFrame。

import pandas as pd
import sqlite3 as sqlite3_module  # 如果使用SQLite数据库,需要导入该模块
连接SQL数据库(这里以SQLite为例)
conn = sqlite3_module.connect('数据库路径.db')  # 如果使用其他数据库,需要更改连接字符串和使用的模块
读取SQL查询结果到DataFrame
df = pd.read_sql('SELECT * FROM 表名', conn)  # 替换'表名'为具体的表名,如果需要查询其他表,也需要更改表名
打印DataFrame并关闭数据库连接
print(df)  # 打印DataFrame内容
conn.close()  # 关闭数据库连接,释放资源,避免内存泄漏等问题,如果长时间不关闭连接,可能会导致资源消耗过多或连接超时等问题,在程序结束后及时关闭连接是非常重要的。


热门