python:HDF和CSV存儲(chǔ)優(yōu)劣對(duì)比分析
小數(shù)據(jù)用csv,大數(shù)據(jù)用h5
結(jié)論1:幾百KB以上的數(shù)據(jù)都用h5比較好
結(jié)論2:幾KB的數(shù)據(jù)h5反而很慢
程序
import pandas as pdimport numpy as npfrom wja.wja_tool import test_time as ttfrom wja import wja_tool as tooldf = tool.generate_sampleDF(row, col)tt().run()df.to_csv(’try.csv’)tt().end()tt().run()df.to_hdf(’try.h5’,’df’,mode=’w’)tt().end() tt().run()df1 = pd.read_csv(’try.csv’)tt().end()tt().run()df2 = pd.read_hdf(’try.h5’)tt().end()
對(duì)比1:數(shù)據(jù)10*1
df = tool.generate_sampleDF(10,1)
# csv保存# hdf保存# csv讀取# hdf讀取程序用時(shí):0.015程序用時(shí):0.9985程序用時(shí):0.009程序用時(shí):0.0369
對(duì)比2:數(shù)據(jù)100*10
df = tool.generate_sampleDF(100,10)
# csv保存# hdf保存# csv讀取# hdf讀取程序用時(shí):0.017程序用時(shí):1.1016程序用時(shí):0.01程序用時(shí):0.013
對(duì)比3:數(shù)據(jù)1000*100
df = tool.generate_sampleDF(1000,100)
# csv保存# hdf保存# csv讀取# hdf讀取程序用時(shí):0.2383程序用時(shí):1.0308程序用時(shí):0.0499程序用時(shí):0.016
對(duì)比4:數(shù)據(jù)10000*100
df = tool.generate_sampleDF(10000,100)
# csv保存# hdf保存# csv讀取# hdf讀取程序用時(shí):2.0895程序用時(shí):1.0073程序用時(shí):0.4055程序用時(shí):0.0169
對(duì)比5:數(shù)據(jù)10000*1000
# csv保存# hdf保存# csv讀取# hdf讀取df = tool.generate_sampleDF(10000,1000)
# csv保存# hdf保存# csv讀取# hdf讀取程序用時(shí):23.5693程序用時(shí):2.2057程序用時(shí):3.3697程序用時(shí):0.0619
補(bǔ)充知識(shí):python:n個(gè)點(diǎn)m條邊有權(quán)無(wú)向圖
n個(gè)點(diǎn):有個(gè)位置
m條邊:兩點(diǎn)之間存在m條邊有權(quán)值
有權(quán):每條邊代表一個(gè)數(shù)值
無(wú)向:沒有規(guī)定行進(jìn)方向
規(guī)定:
1、兩點(diǎn)之間的行進(jìn)路線,最終權(quán)值為所經(jīng)過(guò)的邊的權(quán)值的最大值
2、兩點(diǎn)之間走法不止一個(gè),最終取最小值為最終走法
問(wèn):
兩點(diǎn)之間的最終權(quán)值為多少
如上圖,我們可以將其寫為列表形式,前兩位是從小到大的的兩個(gè)點(diǎn),最后一個(gè)代表權(quán)值,如[1, 2, 2] 代表1和2之間的權(quán)值是2,以此類推
n,m = 5, 10road = [[1, 2, 2], [1, 3, 3], [1, 4, 7], [1, 5, 2], [2, 3, 4], [2, 4, 9], [2, 5, 5], [3, 4, 4], [3, 5, 5], [4, 5, 3]]def hold(list1, list2): jiaoji = list(set(list1)&set(list2)) need = [i for i in set(list1+list2) if i not in jiaoji] need.sort() return needdef get(road): option = {} for i in range (m): option[(road[i][0],road[i][1])] = [road[i][2]] for i in range (m): for j in range(i+1,m): dot = hold(road[i][:2], road[j][:2]) if len(dot)==2:if (dot[0],dot[1]) in option.keys(): option[(dot[0],dot[1])].append(max([road[i][2],road[j][2]]))else: option[(dot[0],dot[1])] = [] option[(dot[0],dot[1])].append(max([road[i][2],road[j][2]])) road_new = [] for i in option.items(): road_new.append(list(i[0])+[min(i[1])]) if road==road_new: print(road_new) return road_new return get(road_new)
輸出結(jié)果
所有可能的走法如下,并且最后一位輸出最短的權(quán)值路徑。
例如 [2, 3, 3]:代表 從2走到3最短的權(quán)值路徑是3,對(duì)應(yīng)路徑從圖中可以到是2-1-3
例如 [3, 5, 3]:代表 從3走到5最短的權(quán)值路徑是3,對(duì)應(yīng)路徑從圖中可以到是3-1-5
[[1, 2, 2], [1, 3, 3], [1, 4, 3], [1, 5, 2], [2, 3, 3], [2, 4, 3], [2, 5, 2], [3, 4, 3], [3, 5, 3], [4, 5, 3]]
以上這篇python:HDF和CSV存儲(chǔ)優(yōu)劣對(duì)比分析就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. 在Android中使用WebSocket實(shí)現(xiàn)消息通信的方法詳解2. 淺談python出錯(cuò)時(shí)traceback的解讀3. Python importlib動(dòng)態(tài)導(dǎo)入模塊實(shí)現(xiàn)代碼4. python matplotlib:plt.scatter() 大小和顏色參數(shù)詳解5. windows服務(wù)器使用IIS時(shí)thinkphp搜索中文無(wú)效問(wèn)題6. ASP 信息提示函數(shù)并作返回或者轉(zhuǎn)向7. Nginx+php配置文件及原理解析8. 利用promise及參數(shù)解構(gòu)封裝ajax請(qǐng)求的方法9. .NET中l(wèi)ambda表達(dá)式合并問(wèn)題及解決方法10. JSP數(shù)據(jù)交互實(shí)現(xiàn)過(guò)程解析
