站長資訊網(wǎng)
最全最豐富的資訊網(wǎng)站

從入門到實戰(zhàn),解鎖機器學(xué)習(xí),星環(huán)科技人工智能秘籍問世

從入門到實戰(zhàn),解鎖機器學(xué)習(xí),星環(huán)科技人工智能秘籍問世

  星環(huán)科技人工智能平臺團隊合著的《機器學(xué)習(xí)實戰(zhàn)-基于Sophon平臺的機器學(xué)習(xí)理論與實踐》現(xiàn)已問世,該書由機械工業(yè)出版社出版,凝結(jié)星環(huán)科技人工智能和大數(shù)據(jù)團隊豐富的實戰(zhàn)經(jīng)驗。

  從技術(shù)視角提供當(dāng)前人工智能相關(guān)技術(shù)的深入介紹,不僅講解人工智能知識體系的理論基礎(chǔ),也指導(dǎo)基于實戰(zhàn)平臺的環(huán)境進行操作。

  這是一本面向機器學(xué)習(xí)一線工程技術(shù)人員的實戰(zhàn)指南。除了算法原理講解,本書還結(jié)合實際業(yè)務(wù)問題,串聯(lián)起各種工具,手把手教您快速搭建模型,構(gòu)建行業(yè)應(yīng)用。

  本書特色

  人工智能已然成為了本時代的新動力——它正在革新世界各地的工業(yè),并從根本上改變我們工作的方式。隨著技術(shù)體系越來越復(fù)雜,應(yīng)用場景日益廣泛,開發(fā)門檻也越來越高。在這種情況下,需要一本關(guān)于機器學(xué)習(xí)的專業(yè)圖書,不僅講解關(guān)于整體知識體系的理論基礎(chǔ),也可以提供基于人工智能研發(fā)實戰(zhàn)平臺環(huán)境的操作指導(dǎo)。

  《機器學(xué)習(xí)實戰(zhàn):基于Sophon平臺的機器學(xué)習(xí)理論與實踐》在講解AI的算法原理的基礎(chǔ)上,還指導(dǎo)針對真實業(yè)務(wù)問題,如何快速搭建模型,構(gòu)建機器學(xué)習(xí)的行業(yè)應(yīng)用。

  1. 緊接地氣:本書由星環(huán)科技人工智能平臺研發(fā)團隊合著,凝聚了來自算法專家及一線軟件工程專家的實戰(zhàn)經(jīng)驗。相比于國內(nèi)學(xué)術(shù)人員的教材或國外譯注,本教材案例來自本土真實的業(yè)界實踐,更加貼合國內(nèi)機器學(xué)習(xí)產(chǎn)業(yè)的需求。

  2. 注重實踐:與基于Python等特定語言的機器學(xué)習(xí)入門教材不同,本書不拘泥于具體功能的代碼實現(xiàn),更關(guān)注技術(shù)大方向與業(yè)務(wù)落地的有機結(jié)合。

  3. 新手友好:對于機器學(xué)習(xí)的各環(huán)節(jié),本教材采用交互式的平臺Sophon進行落地,各環(huán)節(jié)高度可視化。對于有基礎(chǔ)的編程愛好者,可以擴展視野,看看平臺帶來的效率提升,并無縫遷移文本代碼至新平臺;對于零基礎(chǔ)的讀者,可以快速搭建并跑通完整的機器學(xué)習(xí)流程,提升入門機器學(xué)習(xí)的自信心。

  針對各種類型的機器學(xué)習(xí)問題,基于星環(huán)自研的人工智能平臺(Sophon)環(huán)境,結(jié)合真實案例,依照數(shù)據(jù)、分析、建模的演進歷程以及系統(tǒng)化闡述并進行實戰(zhàn)講解。

  通過原理講解與實例分析,讀者既能了解人工智能相關(guān)的算法原理,也能了解人工智能一些可落地的具體應(yīng)用場景。此外,本書還適合作為Sophon平臺工具的使用手冊,供平臺用戶參考。

  本書既適合作為高等院校計算機、軟件工程、人工智能等相關(guān)專業(yè)的教學(xué)用書,同時也可供從事機器學(xué)習(xí)相關(guān)領(lǐng)域的工程技術(shù)人員閱讀和參考,幫助掌握機器學(xué)習(xí)相關(guān)的算法原理,并能通過專業(yè)工具平臺快速搭建各類模型,構(gòu)建機器學(xué)習(xí)的行業(yè)應(yīng)用。

  星環(huán)科技作為國內(nèi)大數(shù)據(jù)和人工智能平臺的領(lǐng)航者,專注于企業(yè)級容量云計算、大數(shù)據(jù)和人工智能核心平臺的自主研發(fā)。星環(huán)科技Sophon集合基礎(chǔ)算法、實體畫像、視頻分析、知識圖譜、云服務(wù)、邊緣計算和管理組件等多個模塊的能量,可以讓用戶快速完成從特征工程、模型訓(xùn)練再到模型上線應(yīng)用的機器學(xué)習(xí)全生命周期的開發(fā)工作。

  關(guān)于我們

  星環(huán)科技人工智能平臺團隊由五十多位優(yōu)秀的研發(fā)工程師和算法工程師組成,逾八成具有國內(nèi)外名校碩士及以上學(xué)歷。其中研發(fā)子團隊的工作重心為一站式人工智能建模平臺Sophon;算法子團隊則負(fù)責(zé)基礎(chǔ)算法的研發(fā)及改進,并在數(shù)據(jù)挖掘、傳統(tǒng)機器學(xué)習(xí)、計算機視覺、自然語言處理、知識圖譜等領(lǐng)域進行前瞻性研究以及項目實施落地。星環(huán)科技人工智能平臺團隊一直致力于“把中國人自主研發(fā)的領(lǐng)先創(chuàng)新技術(shù)賦能全世界各行各業(yè),促進社會可持續(xù)發(fā)展,通過科技讓人類的生活更美好”。目前產(chǎn)品應(yīng)用已覆蓋金融、安防、電力、交通、教育等數(shù)十個行業(yè)和領(lǐng)域,申請專利近三十個。

  下面,我們將用一個商戶反欺詐的例子,串起本書的主要章節(jié)內(nèi)容。

  1 案例背景

  隨著移動支付的推廣,傳統(tǒng)的POS機刷卡已經(jīng)逐步被新興二維碼POS機刷碼所取代。同時,傳統(tǒng)的線下商鋪刷卡套現(xiàn)也逐步演化為網(wǎng)絡(luò)購物套現(xiàn)、個人POS機套現(xiàn)、微商及線上商鋪套現(xiàn)等多種方式。

  POS刷卡刷碼的流程如下圖所示:

從入門到實戰(zhàn),解鎖機器學(xué)習(xí),星環(huán)科技人工智能秘籍問世

  銀行或第三方支付平臺首先向商家推廣POS機,然后持有銀行卡的消費者就可以在相應(yīng)商鋪使用POS機刷卡消費,或者也可以將銀行卡與支付平臺綁定,再在商鋪使用POS機刷碼消費。這一過程中很有可能產(chǎn)生套現(xiàn)欺詐行為,而我們可以使用機器學(xué)習(xí)方法對商戶與消費者間交易行為建模,通過模型自動檢測異常商戶。

  處理這類案例時,我們會先將抽象的業(yè)務(wù)目標(biāo)轉(zhuǎn)化為機器可理解的問題,根據(jù)我們手中的數(shù)據(jù)和業(yè)務(wù)目標(biāo)構(gòu)想模型。整個機器學(xué)習(xí)的過程包含數(shù)據(jù)預(yù)處理及探索性分析、特征提取及選擇、模型構(gòu)建及訓(xùn)練和模型評估。問題建模的流程如下圖所示:

  2 數(shù)據(jù)預(yù)處理與探索性分析

  這一過程包含箱線圖、條形圖和數(shù)據(jù)分布特征研究等初步的數(shù)據(jù)探索、數(shù)據(jù)的歸一化處理、類別特征數(shù)據(jù)的獨熱編碼或高勢集特征編碼處理、時間特征數(shù)據(jù)的連續(xù)性變換或時間窗口提取處理等操作,為后續(xù)模型的構(gòu)建及模型收斂速度和精度的提升做了鋪墊。

  3 特征提取及選擇

  在POS套現(xiàn)的案例中,我們將構(gòu)建四種特征,其構(gòu)建流程如下:

  1. 將消費者和商家的靜態(tài)屬性信息作為靜態(tài)特征;

  2. 將商家與消費者之間的動態(tài)交易記錄作為交易特征,同時加入了商戶的平均交易額度等商戶深度數(shù)據(jù);

  3. 分析得到消費者和商家交易圖的模式結(jié)構(gòu)特性、傳播特征、聚類特征等圖結(jié)構(gòu)特征;

  使用圖嵌入算法和異常檢測算法 LOF得到用嵌入特征表示的深度圖特征

  若數(shù)據(jù)存在于多個表格中,則可以運用DFS(深度特征融合)進行數(shù)據(jù)表關(guān)聯(lián),特征基元以及自動特征搜索與組合(Sophon中提供了自動多表擴展算子的接口供建模使用)。自動特征構(gòu)建出的特征則可以使用不同類型的評價指標(biāo)(如LRLogLossMetric、SquaredLossMetric和EntropyBasedMetric)進行評價,再使用一些局部最優(yōu)方法進行選擇(Sophon中的AutoML模塊專門提供了自動特征構(gòu)建算子供使用)。

  4 模型構(gòu)建及訓(xùn)練

  1. 分類模型:將銀行業(yè)務(wù)人員預(yù)先指定的異常商戶標(biāo)簽作為分類目標(biāo),訓(xùn)練一個分類模型(如邏輯回歸模型),再根據(jù)模型結(jié)果判定新商戶是否異常;

  2. 回歸模型:將異常商戶標(biāo)簽經(jīng)交易網(wǎng)絡(luò)傳播后的異常值作為擬合目標(biāo),訓(xùn)練一個回歸模型(如線性回歸模型),再根據(jù)模型結(jié)果預(yù)測商戶未來出現(xiàn)套現(xiàn)異常的等級;

  3. 圖計算模型:計算圖結(jié)構(gòu)及圖特征,輔助對交易行為進行可視化圖分析

  當(dāng)我們擔(dān)心單一的分類/回歸模型性能無法滿足需求時,可以使用集成學(xué)習(xí),將XGBoost回歸、決策樹回歸/SVM、多層感知機和梯度提升樹等各類模型進行簡單平均/投票融合,集合成一個強學(xué)習(xí)器,從而得到一個具有比單獨學(xué)習(xí)算法更好預(yù)測性能的結(jié)果。而當(dāng)算法性能受到諸如訓(xùn)練過程和正則化方法等選擇的設(shè)計決策影響時,則可以選擇使用自動建模。

  另外,可視化圖分析能夠提供大量信息。如圖所示:AB 兩個詐騙商鋪的顧客中大多使用非信用卡交易,而其共同消費者(疑似欺詐團伙)卻大都使用信用卡交易,很可能在實施信用卡套現(xiàn)等詐騙行為。結(jié)合商戶信息的查詢結(jié)果:這兩個店鋪物理距離相距超過 30 公里,且這幾個消費者短時間內(nèi)同時在這兩家發(fā)生了消費,也佐證了可視化圖提供的信息。

  5 模型評估

  以判定商戶是否異常的分類模型為例,我們選擇混淆矩陣、ROC曲線與PR曲線進行模型評估。

  從圖中可以看到,在使用了前面所述特征進行模型訓(xùn)練使得測試集上模型的精度和召回率分別達到 0.925 和 0.7,基本能夠滿足商戶異常監(jiān)測場景的需要。

  從以上分析案例可以看到,Sophon的各個算法算子和可視化分析工具,能夠幫助有數(shù)據(jù)分析需求的業(yè)務(wù)人員更好地上手使用機器學(xué)習(xí)對相關(guān)業(yè)務(wù)案例進行分析,同時也使得整個模型搭建流程和結(jié)果展示更加清晰,幫助業(yè)務(wù)人員更好地研究場景問題,助力業(yè)務(wù)目標(biāo)的達成。

  此外,我們還可以借助自然語言處理和計算機視覺技術(shù),將更多關(guān)于商戶和消費者的非結(jié)構(gòu)化信息納入模型,形成更綜合化的分析體系。更多主題將在后續(xù)的獨立文章中呈現(xiàn),敬請期待。

  內(nèi)容提前知

  本書內(nèi)容覆蓋了機器學(xué)習(xí)領(lǐng)域從理論到實踐的多個主題,總共分為10章。

  1

  第一章 機器學(xué)習(xí)導(dǎo)論

  介紹機器學(xué)習(xí)的背景、定義和任務(wù)類型,構(gòu)建機器學(xué)習(xí)應(yīng)用的步驟,以及開發(fā)機器學(xué)習(xí)工作流的方式。

  2

  第二章 數(shù)據(jù)預(yù)處理與特征工程

  詳細(xì)介紹數(shù)據(jù)預(yù)處理和特征工程技術(shù),并輔以實例進行驗證。

  3-6

  第三~六章

  介紹回歸模型、分類模型、模型融合和聚類模型,這些內(nèi)容是機器學(xué)習(xí)理論和實踐中的傳統(tǒng)重點。其中不僅介紹各種常見數(shù)據(jù)類型的處理方法,還針對刪失數(shù)據(jù)進行了專門的綜述和實踐。

  7

  第七章 圖計算

  介紹機器學(xué)習(xí)領(lǐng)域較難的圖計算話題,并從工業(yè)界視角解讀如何將圖計算落地。

  8

  第八章 自動機器學(xué)習(xí)

  針對特征工程、建模過程中大量調(diào)參的場景介紹自動機器學(xué)習(xí)的理論和應(yīng)用,并細(xì)致比較和測試了各種自動特征工程算法在不同數(shù)據(jù)上的表現(xiàn)。

  9

  第九章 自然語言處理

  介紹自然語言處理(詞向量、序列標(biāo)注、關(guān)鍵詞抽取、自動摘要和情感分析)技術(shù),使用新聞文本數(shù)據(jù)搭建文本分類的流程。

  10

  第十章 計算機視覺

  介紹計算機視覺中圖像分類和目標(biāo)檢測的應(yīng)用以及車輛檢測的落地案例。

  《機器學(xué)習(xí)實戰(zhàn)》目前已在如下渠道開啟銷售:

  京東:

  https://item.jd.com/12782006.html

  當(dāng)當(dāng):

  http://product.dangdang.com/28498312.html

特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。

贊(0)
分享到: 更多 (0)
網(wǎng)站地圖   滬ICP備18035694號-2    滬公網(wǎng)安備31011702889846號
久久久999久久久精品| 久久久久久久久久免免费精品| 2022国产精品自产拍在线观看| 欧产日产国产精品精品| 国产精品亲子乱子伦xxxx裸| 天美传媒精品1区2区3区| 国产精品手机在线观看你懂的 | 麻豆人妻少妇精品无码专区| 动漫精品第一区二区三区| 精品久久久久久无码中文字幕漫画| 国产午夜亚洲精品| 2021国产精品成人免费视频| 久久精品国产2020| 久久精品国产久精国产思思| 99热精品国产麻豆| 久久精品亚洲一区二区三区浴池| 熟女精品视频一区二区三区| 久久伊人精品青青草原高清| 青青草国产精品久久久久| 极品精品国产超清自在线观看| 777午夜精品久久av蜜臀| 青青热久久久久综合精品| 中文字幕久精品免费视频| 国产一区二区精品久久岳| 最新精品国偷自产在线| 国产亚洲精品拍拍拍拍拍| 国内精品国语自产拍在线观看| 香蕉伊思人在线精品| 9久热精品免费观看视频| 欧洲精品无码一区二区三区在线播放 | 国产99视频精品免费视频76 | 久久久久久国产精品美女| 久99久无码精品视频免费播放| 国产精品乱码一区二区三区| 国产精品激情综合久久| 精品久久久久久久中文字幕| 久久久久亚洲精品中文字幕| 国内精品卡1卡2卡区别| 日本精品不卡视频| 日韩精品一区二区三区色欲AV| 99在线观看精品免费99|