python文件数据分析治理提取

08-24 144阅读 0评论

前提提要

Python2.0有无法直接读取中文路径的问题,需要另外写函数Python3.0在2018年的时候也无法直接读取。

现在使用的时候,发现python3.0是可以直接读取中文路径的。

需要自带或者创建几个txt文件,里面最好写几个数据(姓名,手机号,住址)

要求

代码的时候最好,自己设几个要求,明确下目的:

需要读取对应目录路径的所有对应文件按行读取出每个对应txt文件的记录使用正则表达式获取每行的手机号将手机号码存储Excel

思路

1)读取文件2)读取数据3)数据整理4)正则表达式匹配5)数据去重6)数据导出保存

代码

import glob import re import xlwt filearray=[] data=[] phone=[] filelocatiON=glob.glob(r'课堂实训/*.txt') print(filelocation) for i in range(len(filelocation)): file =open(filelocation[i]) file_data=file.readlines() data.append(file_data) print(data) combine_data=sum(data,[])  print(combine_data) for a in combine_data: data1=re.search(r'[0-9]{11}',a) phone.append(data1[0]) phone=list(set(phone)) print(phone) print(len(phone))  #存到excel中 f=xlwt.Workbook('encoding=utf-8') sheet1=f.add_sheet('sheet1',cell_overwrite_ok=True) for i in range(len(phone)): sheet1.write(i,0,phone[i]) f.save('phonenumber.xls')

运行结果

python文件数据分析治理提取

生成一个EXCEL文件

python文件数据分析治理提取

python文件数据分析治理提取

分析

import glob import re import xlwt

globe用来定位文件,re正则表达式,xlwt用于excel

1)读取文件

filelocation=glob.glob(r'课堂实训/*.txt')

指定目录下的所有txt文件

2)读取数据

for i in range(len(filelocation)): file =open(filelocation[i]) file_data=file.readlines() data.append(file_data) print(data)

将路径下的txt文件循环读取,按序号依次读取文件打开每一次循环对应的文件将每一次循环的txt文件的数据按行读取出来使用append()方法将每一行的数据添加到data列表输出一下,可以看到将几个txt的文件数据以字列形式存在同一个列表

3)数据整理

combine_data=sum(data,[])

列表合并成一个列表

4)正则表达式匹配外加数据去重

print(combine_data) for a in combine_data: data1=re.search(r'[0-9]{11}',a) phone.append(data1[0]) phone=list(set(phone)) print(phone) print(len(phone))

set()函数:无序去重,创建一个无序不重复元素

6)数据导出保存

#存到excel中 f=xlwt.Workbook('encoding=utf-8') sheet1=f.add_sheet('sheet1',cell_overwrite_ok=True) for i in range(len(phone)): sheet1.write(i,0,phone[i]) f.save('phonenumber.xls')
Workbook('encoding=utf-8'):设置工作簿的编码add_sheet('sheet1',cell_overwrite_ok=True):创建对应的工作表write(x,y,z):参数对应行、列、值

到此这篇关于python文件数据分析治理提取的文章就介绍到这了,更多相关python文件数据分析内容请搜索云初冀北以前的文章或继续浏览下面的相关文章希望大家以后多多支持云初冀北!

免责声明
本站提供的资源,都来自网络,版权争议与本站无关,所有内容及软件的文章仅限用于学习和研究目的。不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负,我们不保证内容的长久可用性,通过使用本站内容随之而来的风险与本站无关,您必须在下载后的24个小时之内,从您的电脑/手机中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。侵删请致信E-mail:Goliszhou@gmail.com
$

发表评论

表情:
评论列表 (暂无评论,144人围观)

还没有评论,来说两句吧...