1 python-数据描述与分析( 二 ) _生活百科

data = https://www.huyubaike.com/biancheng/{"name":["国科图","国科图","文献情报中心","文献情报中心"],"year":["2012","2013","2014","2015"],"local":["北四环西路","北四环西路","北四环西路","北四环西路"],"student":["甲","乙","丙","丁"]}centerDF = pd.DataFrame(data,columns=["year","name","local","student"],index=["a","b","c","d"])print (centerDF["name"])print (centerDF["student"])#output：a国科图b国科图c文献情报中心d文献情报中心Name: name, dtype: objecta甲b乙c丙d丁Name: student, dtype: object另外，可以看出按列进行获取时他们的index标识是相同的，且每一列是一个Series 对象
按行进行数据获?。涫凳峭ü齣ndex进行操作，具体如下：
data = https://www.huyubaike.com/biancheng/{"name":["国科图","国科图","文献情报中心","文献情报中心"],"year":["2012","2013","2014","2015"],"local":["北四环西路","北四环西路","北四环西路","北四环西路"],"student":["甲","乙","丙","丁"]}centerDF = pd.DataFrame(data,columns=["year","name","local","student"],index=["a","b","c","d"])print (centerDF.loc["a"])#在使用进行DataFrame.ix进行表中的数据块选择的时候，会抛出’DataFrame’ object has no attribute ‘ix’，这个是由于在不同的pandas的版本中，DataFrame的相关属性已过期，已不推荐使用导致的。#参考代码先锋网

文章插图
#output：year2012name国科图local北四环西路student甲Name: a, dtype: object另外，同样可以看出每一行是一个Series 对象，此时该Series的index其实就是DataFrame 的列名称，综上来看，对于一个DataFrame 来说，它是纵横双向进行索引，只是每个Series（纵横）都共用一个索引而已
1.3 利用Pandas加载、保存数据在进行数据处理时我们首要工作是把数据加载到内存中，这一度成为程序编辑的软肋，但是Pandas包所提供的功能几乎涵盖了大多数的数据处理的加载问题，如read_csv、read_ExcelFile
(1)加载csv格式的数据
import pandas as pddata_csv = pd.read_csv("D:/python_cailiao/test.csv")#它的默认属性有sep=","data_csv#output:schoolinstitutegradesname0中国科学院大学文献情报中心15级田鹏伟1中国科学院大学文献情报中心15级李四2中国科学院大学文献情报中心15级王五3中国科学院大学文献情报中心15级张三data_csv = pd.read_csv("D:/python_cailiao/test.csv",sep="#")#更改默认属性sep="#"data_csv#output：school,institute,grades,name0中国科学院大学,文献情报中心,15级,田鹏伟1中国科学院大学,文献情报中心,15级,李四2中国科学院大学,文献情报中心,15级,王五3中国科学院大学,文献情报中心,15级,张三【1 python-数据描述与分析】data_csv = pd.read_csv("D:/python_cailiao/test.csv",header=None,skiprows=[0])#不要表头Headerdata_csv#output：schoolinstitutegradesname0中国科学院大学文献情报中心15级田鹏伟1中国科学院大学文献情报中心15级李四2中国科学院大学文献情报中心15级王五3中国科学院大学文献情报中心15级张三data_csv.columns=["school","institute","grades","name"]data_csv#自行添加表头列#output：schoolinstitutegradesname0中国科学院大学文献情报中心15级田鹏伟1中国科学院大学文献情报中心15级李四2中国科学院大学文献情报中心15级王五3中国科学院大学文献情报中心15级张三另外，综上，通过对csv格式的文件进行读取，我们可以指定读入的格式（sep=","）,也可以指定他的header为空None ，最后添加column，而之所以可以后来添加的原因是读入的csv已经是DataFrame格式对象
(2)保存csv数据
data_csv.loc[1,"name"]="顾老师"data_csv.to_csv("D:/python_cailiao/save.csv")

文章插图
(1)加载excel格式的数据
data_excel = pd.read_excel("D:/python_cailiao/excel.xlsx",sheet_name="test")data_excel#output：schoolinstitutegradesname0中国科学院大学文献情报中心15级田鹏伟1中国科学院大学文献情报中心15级李四2中国科学院大学文献情报中心15级王五3中国科学院大学文献情报中心15级张三data_excel.loc[1,"name"]="顾立平老师"data_excel#output:schoolinstitutegradesname0中国科学院大学文献情报中心15级田鹏伟1中国科学院大学文献情报中心15级顾立平老师2中国科学院大学文献情报中心15级王五3中国科学院大学文献情报中心15级张三(2)保存数据
data_excel.to_excel("D:/python_cailiao/save.xlsx",sheet_name="test")