data = https://www.huyubaike.com/biancheng/{"name":["国科图","国科图","文献情报中心","文献情报中心"],"year":["2012","2013","2014","2015"],"local":["北四环西路","北四环西路","北四环西路","北四环西路"],"student":["甲","乙","丙","丁"]}centerDF = pd.DataFrame(data,columns=["year","name","local","student"],index=["a","b","c","d"])print (centerDF["name"])print (centerDF["student"])#output:a国科图b国科图c文献情报中心d文献情报中心Name: name, dtype: objecta甲b乙c丙d丁Name: student, dtype: object另外 , 可以看出按列进行获取时他们的index标识是相同的,且每一列是一个Series 对象
按行进行数据获?。涫凳峭ü齣ndex进行操作,具体如下:
data = https://www.huyubaike.com/biancheng/{"name":["国科图","国科图","文献情报中心","文献情报中心"],"year":["2012","2013","2014","2015"],"local":["北四环西路","北四环西路","北四环西路","北四环西路"],"student":["甲","乙","丙","丁"]}centerDF = pd.DataFrame(data,columns=["year","name","local","student"],index=["a","b","c","d"])print (centerDF.loc["a"])#在使用进行DataFrame.ix进行表中的数据块选择的时候,会抛出’DataFrame’ object has no attribute ‘ix’,这个是由于在不同的pandas的版本中,DataFrame的相关属性已过期,已不推荐使用导致的 。#参考代码先锋网

文章插图
#output:year2012name国科图local北四环西路student甲Name: a, dtype: object另外,同样可以看出每一行是一个Series 对象,此时该Series的index其实就是DataFrame 的列名称 , 综上来看 , 对于一个DataFrame 来说 , 它是纵横双向进行索引 , 只是每个Series(纵横)都共用一个索引而已
1.3 利用Pandas加载、保存数据在进行数据处理时我们首要工作是把数据加载到内存中 , 这一度成为程序编辑的软肋,但是Pandas包所提供的功能几乎涵盖了大多数的数据处理的加载问题,如read_csv、read_ExcelFile
(1)加载csv格式的数据
import pandas as pddata_csv = pd.read_csv("D:/python_cailiao/test.csv")#它的默认属性有sep=","data_csv#output:schoolinstitutegradesname0中国科学院大学文献情报中心15级田鹏伟1中国科学院大学文献情报中心15级李四2中国科学院大学文献情报中心15级王五3中国科学院大学文献情报中心15级张三data_csv = pd.read_csv("D:/python_cailiao/test.csv",sep="#")#更改默认属性sep="#"data_csv#output:school,institute,grades,name0中国科学院大学,文献情报中心,15级,田鹏伟1中国科学院大学,文献情报中心,15级,李四2中国科学院大学,文献情报中心,15级,王五3中国科学院大学,文献情报中心,15级,张三【1 python-数据描述与分析】data_csv = pd.read_csv("D:/python_cailiao/test.csv",header=None,skiprows=[0])#不要表头Headerdata_csv#output:schoolinstitutegradesname0中国科学院大学文献情报中心15级田鹏伟1中国科学院大学文献情报中心15级李四2中国科学院大学文献情报中心15级王五3中国科学院大学文献情报中心15级张三data_csv.columns=["school","institute","grades","name"]data_csv#自行添加表头列#output:schoolinstitutegradesname0中国科学院大学文献情报中心15级田鹏伟1中国科学院大学文献情报中心15级李四2中国科学院大学文献情报中心15级王五3中国科学院大学文献情报中心15级张三另外,综上,通过对csv格式的文件进行读取,我们可以指定读入的格式(sep=","),也可以指定他的header为空None , 最后添加column,而之所以可以后来添加的原因是读入的csv已经是DataFrame格式对象
(2)保存csv数据
data_csv.loc[1,"name"]="顾老师"data_csv.to_csv("D:/python_cailiao/save.csv")

文章插图
(1)加载excel格式的数据
data_excel = pd.read_excel("D:/python_cailiao/excel.xlsx",sheet_name="test")data_excel#output:schoolinstitutegradesname0中国科学院大学文献情报中心15级田鹏伟1中国科学院大学文献情报中心15级李四2中国科学院大学文献情报中心15级王五3中国科学院大学文献情报中心15级张三data_excel.loc[1,"name"]="顾立平老师"data_excel#output:schoolinstitutegradesname0中国科学院大学文献情报中心15级田鹏伟1中国科学院大学文献情报中心15级顾立平老师2中国科学院大学文献情报中心15级王五3中国科学院大学文献情报中心15级张三(2)保存数据
data_excel.to_excel("D:/python_cailiao/save.xlsx",sheet_name="test")

推荐阅读
- 企业运维 | MySQL关系型数据库在Docker与Kubernetes容器环境中快速搭建部署主从实践
- C#.NET ORM 如何访问 Access 数据库 [FreeSql]
- windows下mysql的数据主主同步
- 有趣实验 .NET下数据库的负载均衡
- Python-函数-字符串函数
- SQL的事务
- 下 MySQL数据库-数据表
- 原生Redis跨数据中心双向同步优化实践
- JuiceFS 在 Elasticsearch/ClickHouse 温冷数据存储中的实践
- 手机登录密码忘了怎么办(不清除数据的解锁方法)