python多線程和多進程關(guān)系詳解
在Python的標(biāo)準(zhǔn)庫中給出了2個模塊:_thread和threading,_thread是低級模塊不支持守護線程,當(dāng)主線程退出了時,全部子線程都會被強制退出了。而threading是高級模塊,用作對_thread進行了封裝支持守護線程。在大部分狀況下人們只需要采用threading這個高級模塊即可。
關(guān)于多進程的大概講解:多進程是multiprocessing模塊給出遠(yuǎn)程與本地的并發(fā),在一個multiprocessing庫的采用場景下,全部的子進程全是由一個父進程運行來的,這個父進程變成madter進程,它會管理一系列的對象狀態(tài)下,如果一旦這個進程退出了,子進程很可能處在一個不穩(wěn)定的狀態(tài)下,那么這個父進程盡量要少做事來維持其穩(wěn)定性
所以python多線程和多進程的區(qū)別如下:
多線程中,全部子線程的進程號一樣;多進程中,不一樣的子進程進程號不一樣
線程共享內(nèi)存空間;進程的內(nèi)存是獨立的
多線程可以共享全局變量,多進程做不到
同一個進程的線程之間可以直接交流;2個進程想通信,必須通過一個中間代理來實現(xiàn)
一個線程可以控制和操作同一進程里的其他線程;但是進程只能操作子進程
創(chuàng)建新線程很簡單;創(chuàng)建新進程需要對其父進程進行一次克隆
內(nèi)容擴展:
python多進程、多線程之聯(lián)系與區(qū)別
進程
概念:進程是操作系統(tǒng)分配資源的最小單元
理解:一個應(yīng)用程序至少包括1個進程,每個進程在執(zhí)行過程中擁有獨立的內(nèi)存單元,python的多進程編程主要依靠multiprocess模塊。
進程間通信:首先,進程間是可以相互通信的,比較常見的有七種通信方式,如管道pipe、命名管道FIFO、消息隊列MessageQueue、共享內(nèi)存SharedMemory、信號量Semaphore、套接字Socket、信號 signal(由于實際開發(fā)涉及較少,這里只作簡單介紹)但是通常進程之間是相互獨立的,每個進程都有獨立的內(nèi)存。通過共享內(nèi)存(nmap模塊),進程之間可以共享對象,使多個進程可以訪問同一個變量(地址相同,變量名可能不同)。多進程共享資源必然會導(dǎo)致進程間相互競爭,所以應(yīng)該盡最大可能防止使用共享狀態(tài)。
線程
概念:線程是操作系統(tǒng)調(diào)度的最小單元
理解:1個進程包括1個或多個線程,相比較之下,線程占用資源更少,更高效,且一個進程的多個線程在執(zhí)行過程中共享內(nèi)存,毫無疑問,線程之間可以相互通信。而python的多進程編程主要依靠threading模塊
線程間通信:主要有兩種方式,一種是上鎖,上互斥鎖確保任意時刻只有一個線程具備修改全局變量的能力。另一種則是使用消息隊列,比較經(jīng)典的生產(chǎn)者、消費者模型就是這樣,一個負(fù)責(zé)生成,一個負(fù)責(zé)消費,所生成的產(chǎn)品存放在queue里,實現(xiàn)了不同線程間溝通。
多進程跟多線程的區(qū)別
由于進程的創(chuàng)建跟銷毀都涉及到系統(tǒng)資源的分配以及回收,導(dǎo)致多進程的開銷明顯大于多線程的開銷。
兩者的應(yīng)用場景
對CPU密集型代碼(比如循環(huán)計算) - 多進程效率更高
對IO密集型代碼(比如文件操作,網(wǎng)絡(luò)爬蟲) - 多線程效率更高
理由:對于IO密集型操作,大部分消耗時間其實是等待時間,在等待時間中CPU是不需要工作的,那你在此期間提供雙CPU資源也是利用不上的,相反對于CPU密集型代碼,2個CPU干活肯定比一個CPU快很多。那么為什么多線程會對IO密集型代碼有用呢?這時因為python碰到等待會釋放GIL供新的線程使用,實現(xiàn)了線程間的切換。
到此這篇關(guān)于python多線程和多進程關(guān)系詳解的文章就介紹到這了,更多相關(guān)python多線程和多進程之間的聯(lián)系內(nèi)容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
