詳解PHP調(diào)用Go服務(wù)的正確方式
我們?cè)陂_(kāi)發(fā)過(guò)程中可能會(huì)遇到這樣的情況:
進(jìn)程依賴(lài)于某服務(wù),所以把服務(wù)耦合在進(jìn)程代碼中; 服務(wù)初始化耗時(shí)長(zhǎng),拖慢了進(jìn)程啟動(dòng)時(shí)間; 服務(wù)運(yùn)行要占用大量?jī)?nèi)存,多進(jìn)程時(shí)內(nèi)存損耗嚴(yán)重。文本匹配服務(wù),它是消息處理流程中的一環(huán),被多個(gè)消息處理進(jìn)程依賴(lài),每次初始化進(jìn)程要 6秒 左右時(shí)間構(gòu)造 Trie 樹(shù),而且服務(wù)讀取關(guān)鍵詞大文件、使用樹(shù)組構(gòu)造 Trie 樹(shù),會(huì)占用大量(目前設(shè)置為 256M )內(nèi)存。
我已經(jīng)把進(jìn)程寫(xiě)成了守護(hù)進(jìn)程的形式,讓它們長(zhǎng)時(shí)間執(zhí)行,雖然不用更多地考慮初始化時(shí)間了,但占用內(nèi)存量巨大的問(wèn)題沒(méi)有辦法。如果關(guān)鍵詞量再大一些,一臺(tái)機(jī)器上面跑十來(lái)個(gè)消息處理進(jìn)程后就干不了其他了。
而且,如果有需求讓我把文本匹配服務(wù)封裝為接口給外部調(diào)用呢?我們知道,web 服務(wù)時(shí),每一個(gè)請(qǐng)求處理進(jìn)程的生存周期是從受理請(qǐng)求到響應(yīng)結(jié)束,如果每次請(qǐng)求都用大量?jī)?nèi)存和時(shí)間來(lái)初始化服務(wù),那接口響應(yīng)時(shí)間和服務(wù)器壓力可想而知。
服務(wù)抽取這樣,服務(wù)形式必須要改變,我們希望這個(gè)文本匹配這個(gè)服務(wù)能做到:
隨調(diào)隨走,不依賴(lài),不再與“消息處理服務(wù)”耦合在一起; 一次初始化,進(jìn)程運(yùn)行期間持續(xù)提供服務(wù); 同步響應(yīng),高效而準(zhǔn)確,最好能不用各種鎖來(lái)保持資源占有;解決辦法也很簡(jiǎn)單,就是把這個(gè)文本匹配的服務(wù)抽取出來(lái),單獨(dú)作為一個(gè)守護(hù)進(jìn)程來(lái)運(yùn)行,像一個(gè)特殊的服務(wù)器,多個(gè)“消息處理服務(wù)”在有需要時(shí)能調(diào)用此服務(wù)進(jìn)程。
現(xiàn)在,我們需要考慮文本匹配服務(wù)進(jìn)程如何與外界通信,接受匹配請(qǐng)求,響應(yīng)匹配結(jié)果。繞來(lái)繞去,問(wèn)題還是回到了 進(jìn)程間通信。
Unix Domain Sockets進(jìn)程間通信進(jìn)程間通信(IPC,Inter-Process Communication),指至少兩個(gè)進(jìn)程或線(xiàn)程間傳送數(shù)據(jù)或信號(hào)的一些技術(shù)或方法。進(jìn)程是計(jì)算機(jī)系統(tǒng)分配資源的最小單位(嚴(yán)格說(shuō)來(lái)是線(xiàn)程)。每個(gè)進(jìn)程都有自己的一部分獨(dú)立的系統(tǒng)資源,彼此是隔離的。為了能使不同的進(jìn)程互相訪(fǎng)問(wèn)資源并進(jìn)行協(xié)調(diào)工作,才有了進(jìn)程間通信。
進(jìn)程間通信的方式有很多,網(wǎng)上對(duì)此介紹的也很多,下面根據(jù)文章的需求來(lái)分析一下這些方式:
管道:管道是Unix最初的IPC形式,但它只能用于具有共同祖先進(jìn)程的各個(gè)進(jìn)程,無(wú)法用于在沒(méi)有親緣關(guān)系的進(jìn)程。如果使用它,需要在“消息處理服務(wù)”中啟動(dòng)“文本匹配服務(wù)”,跟原來(lái)差別不大。 命名管道:也被稱(chēng)為有名管道,它在Unix稱(chēng)為FIFO,它通過(guò)一個(gè)文件來(lái)進(jìn)行進(jìn)程間數(shù)據(jù)交互,但服務(wù)于多個(gè)進(jìn)程時(shí),需要添加鎖來(lái)保證原子性,從而避免寫(xiě)入和讀取不對(duì)應(yīng)。 信號(hào)和信號(hào)量:用于進(jìn)程/線(xiàn)程事件級(jí)的通信,但它們能交流的信息太少。 消息隊(duì)列和共享內(nèi)存:都是通過(guò)一個(gè)公共內(nèi)存介質(zhì)來(lái)進(jìn)行通信 socket:通過(guò)Unix封裝好的網(wǎng)絡(luò)API來(lái)進(jìn)行通信,像數(shù)據(jù)庫(kù)、服務(wù)器都是通過(guò)這種方式實(shí)現(xiàn),它們也能提供本地服務(wù)。不過(guò)網(wǎng)絡(luò)socket固然能使用,但是要面臨著數(shù)據(jù)包裝和網(wǎng)絡(luò)調(diào)用開(kāi)銷(xiāo),也不是完美的選擇。簡(jiǎn)單介紹當(dāng)然還是有完美的方式的,這就是今天的主角 - Unix Domain Sockets ,它可以理解為一種特殊的 Socket,但它不需要經(jīng)過(guò)網(wǎng)絡(luò)協(xié)議棧,不需要打包拆包、計(jì)算校驗(yàn)和、維護(hù)序號(hào)和應(yīng)答等,只是將應(yīng)用層數(shù)據(jù)從一個(gè)進(jìn)程拷貝到另一個(gè)進(jìn)程,所以在系統(tǒng)內(nèi)通信效率更高。而且免去了網(wǎng)絡(luò)問(wèn)題,它也更能保證消息的完整性,既不會(huì)丟失也不會(huì)順序錯(cuò)亂。
作為特殊的 Socket,它的創(chuàng)建、調(diào)用方式和網(wǎng)絡(luò) Socket 一樣,一次完整的交互,服務(wù)端都要經(jīng)過(guò)create、bind、listen、accept、read、write,客戶(hù)端要通過(guò)create、connect、write、read。與普通 Socket 不同的是它綁定一個(gè)系統(tǒng)內(nèi)的文件,而不是 IP 和端口。
適用場(chǎng)景Unix Domain Sockets 真的是進(jìn)程間通信的一個(gè)重型武器,用它可以快速實(shí)現(xiàn)進(jìn)程間的數(shù)據(jù)、信息交互,而且不需要鎖等繁雜操作,也不用考慮效率,可謂是簡(jiǎn)單高效。
當(dāng)然,“重型武器” 的在各種場(chǎng)景下也有適合不適合。Unix Domain Sockets適用于以下場(chǎng)景:
服務(wù)長(zhǎng)時(shí)間存在。 Unix Domain Sockets 的服務(wù)端是個(gè)服務(wù)器一樣的存在,在守護(hù)進(jìn)程中,它阻塞并等待客戶(hù)端連接的特性可以被充分利用。 一服務(wù)器多客戶(hù)端。它能通過(guò) Socket 的文件描述符來(lái)區(qū)分不同的客戶(hù)端,避免資源之間的鎖操作。 同一系統(tǒng)內(nèi)。它只能在同一系統(tǒng)內(nèi)進(jìn)行進(jìn)程數(shù)據(jù)復(fù)制,跨系統(tǒng)請(qǐng)使用傳統(tǒng) Sockets。代碼實(shí)現(xiàn)接下來(lái)要 show code 了,不過(guò)學(xué) PHP 的都知道,PHP 不太適合處理 CPU 密集形的任務(wù),我剛好學(xué)了點(diǎn) Go,一時(shí)手癢,就用 Go 實(shí)現(xiàn)了下 Trie 樹(shù),所以才牽扯到 PHP 和 Go 之間的通信,有了今天的文章。當(dāng)然介紹的方法,并不只適合 PHP 與 Go 通信,其他語(yǔ)言也可以,至少 C系語(yǔ)言中是通用的。
Go 實(shí)現(xiàn)的 Trie 樹(shù)Trie樹(shù)不再是今天的主題,這里介紹一下數(shù)據(jù)結(jié)構(gòu)和需要注意的點(diǎn)。
// trie樹(shù)結(jié)點(diǎn)定義type Node struct { depth int children map[int32]Node // 用map實(shí)現(xiàn)key-value型的 字符-節(jié)點(diǎn) 對(duì)應(yīng)}
需要注意:
使用 slice 的 append() 函數(shù)保存遞增的匹配結(jié)果時(shí),有可能由于 slice 容量不夠而重新分配地址,所以要傳入 slice 的地址來(lái)保存遞增后的匹配結(jié)果結(jié)果,*result = append(*result, word),最后再將遞增之后的 slice 地址傳回。 由于 Go 中的編碼統(tǒng)一使用的 utf-8,不用像 PHP 一樣判斷字符的邊界,所以在進(jìn)行關(guān)鍵詞拆散和消息拆散時(shí),直接使用 int32() 方法將關(guān)鍵詞和消息都轉(zhuǎn)換為成員為 int32 類(lèi)型的 slice,匹配過(guò)程中就使用 int32 類(lèi)型的數(shù)字來(lái)代表這個(gè)中文字符,匹配完成后再使用fmt.Printf('%c', int32)將其轉(zhuǎn)換為中文。Go ServerGo 中創(chuàng)建一個(gè) socket 并使用的步驟非常簡(jiǎn)單,只是 Go 沒(méi)有異常,判斷 error 會(huì)比較惡心一點(diǎn),不知道有沒(méi)有大神有更好的寫(xiě)法。下面為了精簡(jiǎn),把 error 全置空了。
// 創(chuàng)建一個(gè)Unix domain soceket socket, _ := net.Listen('unix', '/tmp/keyword_match.sock') // 關(guān)閉時(shí)刪除綁定的文件 defer syscall.Unlink('/tmp/keyword_match.sock') // 無(wú)限循環(huán)監(jiān)聽(tīng)和受理客戶(hù)端請(qǐng)求 for {client, _ := socket.Accept()buf := make([]byte, 1024)data_len, _ := client.Read(buf)data := buf[0:data_len]msg := string(data)matched := trie.Match(tree, msg)response := []byte('[]') // 給響應(yīng)一個(gè)默認(rèn)值if len(matched) > 0 { json_str, _ := json.Marshal(matched) response = []byte(string(json_str))}_, _ = client.Write(response) }PHP Client
下面是 PHP 實(shí)現(xiàn)的客戶(hù)端:
$msg = 'msg';// 創(chuàng)建 連接 發(fā)送消息 接收響應(yīng) 關(guān)閉連接$socket = socket_create(AF_UNIX, SOCK_STREAM, 0);socket_connect($socket, ’/tmp/keyword_match.sock’);socket_send($socket, $msg, strlen($msg), 0);$response = socket_read($socket, 1024);socket_close($socket);// 有值則為匹配成功if (strlen($response) > 3) { var_dump($response);}小結(jié)效率
這里總結(jié)一下這套設(shè)計(jì)的效率表現(xiàn):
純粹用 Go 進(jìn)行文本關(guān)鍵詞匹配,一千條數(shù)據(jù)運(yùn)行一秒多,差不多是 PHP 效率的兩倍。不過(guò)說(shuō)好的 8倍效率呢?果然測(cè)評(píng)都是騙人的。當(dāng)然,也可能是我寫(xiě)法有問(wèn)題或者 Trie 樹(shù)不在 Go 的發(fā)揮范圍之內(nèi)。然后是 PHP 使用 Unix Domain Socket 調(diào)用 Go 服務(wù)的耗時(shí),可能是進(jìn)程間復(fù)制數(shù)據(jù)耗時(shí)或 PHP 拖了后腿,3秒多一點(diǎn),跟純 PHP 腳本差不多。
雜談用 PHP 的都知道,PHP 因?yàn)榻忉屝驼Z(yǔ)言的特性和其高度的封裝,導(dǎo)致其雖然在開(kāi)發(fā)上速度很快,可是執(zhí)行與其他語(yǔ)言相比略差。對(duì)此,業(yè)界的 FB 有 HHVM,PHP7 有 opcache 新特性,據(jù)說(shuō)還要在 PHP8 添加 JIT,用以彌補(bǔ)其先天硬傷。
不過(guò),對(duì)于開(kāi)發(fā)者,特別是跟我一樣對(duì)于效率有執(zhí)著追求的人來(lái)說(shuō),在了解使用 PHP 的新特性之外,自己再掌握一門(mén)較高執(zhí)行效率、開(kāi)發(fā)效率略低的語(yǔ)言,用來(lái)寫(xiě)一些高計(jì)算量,邏輯單一的代碼,與 PHP 互補(bǔ)或許會(huì)更好一點(diǎn)。
于是,在考慮良久,也見(jiàn)識(shí)了各種 Go 的支持者和反對(duì)者之間的撕逼后,我覺(jué)得還是要相信一下谷歌爸爸,畢竟也沒(méi)什么其他我覺(jué)得可選的語(yǔ)言了。
另外C呢,雖然暫時(shí)開(kāi)發(fā)中用不到,可是畢竟是當(dāng)代N多語(yǔ)言的起源,偶爾寫(xiě)寫(xiě)數(shù)據(jù)結(jié)構(gòu)、算法什么的以免生銹。而且學(xué)了些C,從 PHP 到 Go,切換起來(lái)還略有些得心應(yīng)手的感覺(jué)~
以上就是詳解PHP調(diào)用Go服務(wù)的正確方式的詳細(xì)內(nèi)容,更多關(guān)于PHP調(diào)用Go服務(wù)的正確方式的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. Nginx+php配置文件及原理解析2. JSP數(shù)據(jù)交互實(shí)現(xiàn)過(guò)程解析3. vue使用webSocket更新實(shí)時(shí)天氣的方法4. 解決啟動(dòng)django,瀏覽器顯示“服務(wù)器拒絕訪(fǎng)問(wèn)”的問(wèn)題5. Yii2.0引入CSS,JS文件方法6. 討論CSS中的各類(lèi)居中方式7. Python生成并下載文件后端代碼實(shí)例8. 如何使用CSS3畫(huà)出一個(gè)叮當(dāng)貓9. python使用selenium爬蟲(chóng)知乎的方法示例10. ASP.NET MVC獲取多級(jí)類(lèi)別組合下的產(chǎn)品
