Python實(shí)現(xiàn)文本文件拆分寫入到多個(gè)文本文件的方法
將一個(gè)txt文本文件中的內(nèi)容行拆分固定的行數(shù),自動(dòng)分批寫入到多個(gè)文本文件。比如:一個(gè)源txt文件有5100行數(shù)據(jù),每1000行插入到一個(gè)txt文件,最后獲得6個(gè)txt文件(5個(gè)文本文件有1000行數(shù)據(jù),第6個(gè)文本文件有100行數(shù)據(jù))。
步驟1、先建立一個(gè)目錄用于存放分割后的txt文件(這里的目錄名為:dataText)2、修改拆分的數(shù)目(這里是每5000行數(shù)據(jù)存入一個(gè)txt文件)3、運(yùn)行python文件,查看生成的txt文件
代碼open_diff = open(’data.txt’, ’r’) # 源文本文件diff_line = open_diff.readlines()line_list = []for line in diff_line: line_list.append(line)count = len(line_list) # 文件行數(shù)print(’源文件數(shù)據(jù)行數(shù):’,count)# 切分diffdiff_match_split = [line_list[i:i+5000] for i in range(0,len(line_list),5000)]# 每個(gè)文件的數(shù)據(jù)行數(shù)# 將切分的寫入多個(gè)txt中for i,j in zip(range(0,int(count/5000+1)),range(0,int(count/5000+1))): # 寫入txt,計(jì)算需要寫入的文件數(shù) with open(’./dataText/ImageData%d.txt’% j,’w+’) as temp:for line in diff_match_split[i]: temp.write(line)print(’拆分后文件的個(gè)數(shù):’,i+1)結(jié)果
將txt文件中的數(shù)據(jù)拆分成多個(gè)文本文件,可以解決由于文本文件數(shù)據(jù)過(guò)大而無(wú)法導(dǎo)入某些軟件的問(wèn)。
這里是將一個(gè)url文本文件(約15M)導(dǎo)入idm下載url中的內(nèi)容,但由于文本文件過(guò)大,數(shù)據(jù)量過(guò)多,就拆分成多個(gè)文本文件分批次導(dǎo)入idm。
注意:1、程序中的5000為寫入每個(gè)文件的數(shù)據(jù)行數(shù),最后一個(gè)文件的行數(shù)不足5000,也用一個(gè)文本文件存儲(chǔ)。2、根據(jù)需要,修改存儲(chǔ)數(shù)據(jù)的行數(shù)(兩個(gè)地方的5000都需要修改)。
到此這篇關(guān)于Python實(shí)現(xiàn)文本文件拆分寫入到多個(gè)文本文件的方法的文章就介紹到這了,更多相關(guān)Python 文本文件拆分內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
1. 在Android中使用WebSocket實(shí)現(xiàn)消息通信的方法詳解2. 淺談python出錯(cuò)時(shí)traceback的解讀3. Python importlib動(dòng)態(tài)導(dǎo)入模塊實(shí)現(xiàn)代碼4. python matplotlib:plt.scatter() 大小和顏色參數(shù)詳解5. windows服務(wù)器使用IIS時(shí)thinkphp搜索中文無(wú)效問(wèn)題6. ASP 信息提示函數(shù)并作返回或者轉(zhuǎn)向7. Nginx+php配置文件及原理解析8. 利用promise及參數(shù)解構(gòu)封裝ajax請(qǐng)求的方法9. .NET中l(wèi)ambda表達(dá)式合并問(wèn)題及解決方法10. JSP數(shù)據(jù)交互實(shí)現(xiàn)過(guò)程解析
