如何讓不懂代碼的小白也能復(fù)用Python編碼成果?機(jī)器學(xué)習(xí)平臺(tái)來(lái)了!
2022-06-16 18:21:15
次
Tempo小課堂—Python擴(kuò)展編程功能實(shí)用技巧第二篇來(lái)咯~
在上一期Tempo小課堂| 安利3個(gè)被數(shù)據(jù)分析師夸爆的Python編程小功能!中小T給大家介紹了如何在Tempo平臺(tái)擴(kuò)展編程中通過(guò)3個(gè)提高Python編程易用性的小功能,來(lái)彌補(bǔ)Python原生編程在企業(yè)實(shí)際數(shù)據(jù)分析場(chǎng)景中的不足。
但企業(yè)的業(yè)務(wù)數(shù)據(jù)化轉(zhuǎn)型,當(dāng)然不僅僅只和具備編碼能力的專(zhuān)業(yè)數(shù)據(jù)分析人員有關(guān)。在實(shí)際的企業(yè)業(yè)務(wù)數(shù)據(jù)分析場(chǎng)景中,比如我們Tempo大數(shù)據(jù)分析平臺(tái)的大量用戶,其實(shí)都是一線的普通業(yè)務(wù)人員。
這些“小白”普遍對(duì)于算法語(yǔ)言(如Python、R、Java、Scala等)并不了解,通常只能通過(guò)平臺(tái)內(nèi)自帶的算法節(jié)點(diǎn)以拖拽的方法實(shí)現(xiàn)建模分析。
隨著業(yè)務(wù)數(shù)據(jù)分析維度的加深,往往就會(huì)出現(xiàn)一個(gè)尷尬的情況:
?需要處理的業(yè)務(wù)數(shù)據(jù)分析情況較為復(fù)雜,平臺(tái)內(nèi)自帶的算法節(jié)點(diǎn)不夠用了,需要企業(yè)專(zhuān)業(yè)數(shù)據(jù)分析人員專(zhuān)門(mén)去開(kāi)發(fā)業(yè)務(wù)相關(guān)的算法才能繼續(xù)推進(jìn)。
?算法以算法語(yǔ)言(比如Python語(yǔ)言)形式呈現(xiàn),業(yè)務(wù)人員既看不懂也不會(huì)用,新開(kāi)發(fā)的算法需要封裝成算法節(jié)點(diǎn)的形式,業(yè)務(wù)人員才能夠上手使用。
?系統(tǒng)管理員對(duì)業(yè)務(wù)涉及的相關(guān)算法也不夠了解,無(wú)法快速完成對(duì)整個(gè)算子相關(guān)說(shuō)明的封裝過(guò)程,且系統(tǒng)管理員的權(quán)限往往只存在于少部分人員,對(duì)于業(yè)務(wù)用戶和系統(tǒng)管理員雙方的溝通成本和工作量都比較大,過(guò)程繁瑣。
這時(shí),我們就會(huì)發(fā)現(xiàn),受限于編碼等專(zhuān)業(yè)技術(shù)門(mén)檻,在面對(duì)一些更為復(fù)雜的業(yè)務(wù)數(shù)據(jù)分析需求時(shí),普通業(yè)務(wù)人員還是沒(méi)有辦法深度參與到分析過(guò)程中。
因此為了避免此類(lèi)問(wèn)題,很多企業(yè)希望將封裝算法的任務(wù)直接下發(fā)到與業(yè)務(wù)相關(guān)的算法設(shè)計(jì)人員,然后由系統(tǒng)管理員進(jìn)行審核并管理,系統(tǒng)管理員只需審核通過(guò)或不通過(guò),若審核不通過(guò),則只需填寫(xiě)審核原因,告知項(xiàng)目組的相關(guān)人員即可。
這樣一來(lái)不僅可以將數(shù)據(jù)平臺(tái)系統(tǒng)管理員從繁瑣、復(fù)制的自定義算法上傳、封裝、維護(hù)的重復(fù)性工作中釋放出來(lái),還可以簡(jiǎn)化相關(guān)溝通流程,讓業(yè)務(wù)相關(guān)人員可以直接對(duì)接相關(guān)需求,提高整體工作效率。

便捷點(diǎn)選操作 快速實(shí)現(xiàn)算法封裝
為了滿足大家在實(shí)際工作場(chǎng)景中的需求,Tempo平臺(tái)支持將Python編程節(jié)點(diǎn)發(fā)布為自定義算法,通過(guò)簡(jiǎn)單幾步點(diǎn)選操作,即可快速將原創(chuàng)算法轉(zhuǎn)換為自定義算法節(jié)點(diǎn),方便快捷。
以邏輯回歸算法為例,若用戶已經(jīng)在Python編程實(shí)現(xiàn)了邏輯回歸的主要代碼,需要將其封裝為一個(gè)自定義算法,算子的配置界面中支持用戶設(shè)置正則化參數(shù)、最大迭代次數(shù)、懲罰函數(shù)類(lèi)型3個(gè)參數(shù),如下圖所示。
根據(jù)用戶角色的不同,具體算法封裝流程稍有不同。
普通設(shè)計(jì)用戶
在Tempo AI—挖掘分析—設(shè)計(jì)區(qū)—建模—Python編程節(jié)點(diǎn),支持直接將Python編程的代碼發(fā)布為自定義算法;
參數(shù)配置
執(zhí)行流程
設(shè)置好參數(shù)后,就可以進(jìn)行流程執(zhí)行。節(jié)點(diǎn)執(zhí)行成功后,在節(jié)點(diǎn)上右鍵,則支持“發(fā)布為自定義算法”功能。
自定義算法配置
需要經(jīng)過(guò)基本信息(填寫(xiě)算法名稱(chēng)、算法描述、上傳算法圖標(biāo))、元信息配置(設(shè)置輸入和輸出端口,輸入端口需要上傳數(shù)據(jù)集,輸出端口需要設(shè)置元信息)、測(cè)試(保證封裝的自定義算法可以正常使用)3個(gè)步驟,可提交“發(fā)布為自定義算法”的審核。
系統(tǒng)管理員
在Tempo AI-系統(tǒng)管理—挖掘平臺(tái)配置—算法管理—自定義算法管理—待審核中,可審核通過(guò)或不通過(guò);
點(diǎn)擊“審核”,可以選擇讓該算法通過(guò)或不通過(guò),若通過(guò),則需要選擇該算法的目錄層級(jí),則可進(jìn)行發(fā)布等操作。若不通過(guò),則需要填寫(xiě)原因。審核結(jié)果都會(huì)以消息的方式提醒用戶。
此外,系統(tǒng)管理員還可對(duì)待審核、通過(guò)、未通過(guò)的算法進(jìn)行查看、刪除操作。查看算子時(shí),支持查看算子的基本信息、代碼、參數(shù)配置、輸入和輸出端口信息。

知識(shí)成果統(tǒng)一管理 提高工作效率
這個(gè)功能也能夠幫助企業(yè)完善算法成果的日常管理和知識(shí)資產(chǎn)的沉淀積累。
舉個(gè)例子,在企業(yè)或項(xiàng)目中,代碼偏好人員的算法成果,往往以代碼形式散落在個(gè)人電腦重,企業(yè)無(wú)法統(tǒng)一管理,甚至不清楚內(nèi)部有多少成果,分別能夠解決哪方面的業(yè)務(wù)問(wèn)題。
那么當(dāng)人員發(fā)生變動(dòng),算法成果就脫離企業(yè)的掌控了,當(dāng)遇到相似的場(chǎng)景分析需求時(shí),往往無(wú)法順利復(fù)用已有算法成果,還是要從零開(kāi)始梳理業(yè)務(wù),進(jìn)行重復(fù)性的代碼開(kāi)發(fā)等,無(wú)形中造成資源、成本的浪費(fèi)。
而通過(guò)Tempo平臺(tái)的代碼快速轉(zhuǎn)化為自定義算法的小功能,企業(yè)在日常項(xiàng)目管理中就可以輕松解決上述問(wèn)題,還能在企業(yè)知識(shí)資產(chǎn)的積累過(guò)程中實(shí)現(xiàn)以下價(jià)值:
01、可以解決代碼化分析及管理的難題,并與已有算法功能可交叉使用,無(wú)縫融合,更靈活。
02、可以將內(nèi)部已有歷史算法成果集成到平臺(tái),統(tǒng)一管理及維護(hù),進(jìn)行算法成果沉淀,形成企業(yè)獨(dú)家內(nèi)容資產(chǎn)。
03、在平臺(tái)形成封裝好的算法,業(yè)務(wù)人員可查看并直接拖拽使用,實(shí)現(xiàn)成果分享、資源復(fù)用,提升分析效率,降低學(xué)習(xí)門(mén)檻。
課后總結(jié)
今天的Tempo小課堂中,小T主要給大家介紹了如何通過(guò)Tempo平臺(tái)中的Python擴(kuò)展編程功能簡(jiǎn)化算法封裝節(jié)點(diǎn)流程,提高算法成果復(fù)用、知識(shí)沉淀相關(guān)工作的效率。
下一期,小T將會(huì)繼續(xù)給大家介紹,如何通過(guò)Tempo大數(shù)據(jù)分析平臺(tái)中的Python擴(kuò)展編程功能,實(shí)現(xiàn)Python編程的性能提升,敬請(qǐng)期待!