第 20 章:解決方案

此章節主要介紹基於 SAS 平台所提供相關解決方案

基本介紹

首先典範轉移 (Paradigm Shift) 是由美國科學家湯馬斯.庫恩所提出,其主要描述在科學範疇中,一種基本理論上從根本的假設改變,改變之後應用於各種其他學科方面的巨大轉變。資訊技術也是如此,從最早大型主機、個人電腦、伺服器、雲端運算、…等,至現今大數據、深度學習和人工智慧等。從最早 SAS 統計軟體應用於個人電腦上進行資料探勘建模等資料分析的深入應用,導入 SAS 9 伺服器平台以伺服器為主的解決方案等資料分析的整合應用,以至於現今新推出 SAS Viya 雲端運算的應用。SAS 一直以來皆能夠因應典範轉移的趨勢潮流進行改變,同時 SAS 的優勢在於專業進階分析,因此在大數據、深度學習和人工智慧的時代,將更具有競爭優勢,根據 IDC 最新發佈的「2016 IDC全球商業智慧及分析工具軟體市場份額調查:雲時代正在來臨」報告中提到在2016年的進階及預測分析 SAS 以最高市場佔有率 30.5% 的絕對優勢,領先同領域的其它競爭者,同時 SAS 的企業策略為推動創新,因此 SAS 將 2016年度營收額達32億美元中的 26%投資於研發,高於其他科技業者平均研發投入的兩倍以上。

接著 SAS 解決方案主要有四種類型,分別為:

  1. 商業智慧與分析

  2. 客戶智慧

  3. 詐欺風險

  4. 資料管理

其中 SAS 解決方案皆會搭配報表、分析和資料整理相關產品,報表像是 SAS Visual Analytics,分析也就是 SAS Enterprise Miner,資料整理就是 SAS Data Integration ,當然還有其它相關產品整合搭配應用,像是 SAS Anti-Money Laundering 解決方案就會針對資料整理搭配 DataFlux Data Management Server 產品進行關鍵字模糊比對的功能應用,同時 SAS 解決方案的版本越新套件程度越完整代表能夠客製化的程度越低,像是 SAS Anti-Money Laundering 解決方案 6.3 版本,就會比 7.1 版本彈性更高,也就代表客製開發程度越大,對於不同國家的市場來說將會是一大優勢,以及不論任何版本 SAS 解決方案皆具有領域知識相關資料市集與情境規則的強大優勢,將能夠在最短的時間導入企業進行分析應用,像是目前全球已經有 200 家銀行採用 SAS Anti-Money Laundering 解決方案。此外在 SAS 9 平台任何解決方案首先皆是前置設定伺服器環境,接著安裝相關產品,再來設定相關產品的關聯,最後才會根據不同解決方案的關鍵重點需求進行後續設定和測試驗證,若我們要安裝 SAS 9 平台解決方案,則需要詳細了解伺服器環境、授權產品、網路架構、資料庫設計、使用者權限… 等資訊,否則很難順利透過安裝與設定部署 SAS 解決方案,請參考下述的影響列表。

再來 SAS 解決方案在於商業分析價值的應用主要是以 SAS Enterprise Miner 產品的應用為主。首先我們會透過 360 度全方位的架構套用客戶貼標,接著找出適當的模型針對不同的客戶屬性計算機率或分數,更進一步進行預測分析。此外還能夠搭配 SAS Visual Analytics 產品以視覺化圖表的方式進行探索,搭配 SAS Visual Statistics 產品以視覺化統計的方式進行分析,搭配 SAS Visual Data Mining and Machine Learning 以視覺化資料探勘的方式進行機器學習,搭配 SAS Visual Investigator 產品以視覺化關聯圖的方式進行調查 ,以利透過分析模型找出更多潛在商業分析的價值。因此 SAS 解決方案皆會因應不同情境有不同關鍵重點,商業智慧與分析關鍵在於找出企業價值,客戶智慧關鍵在於採取行銷行動,詐欺風險關鍵在於降低損失風險,資料管理關鍵在於落實資料治理。至於現今的趨勢則是以客戶為中心即時評估模型成效,以利動態快速反應與部署,像是金融業信用卡臨時調額、金融業行銷自動化提供貼心服務、零售業即時行銷、零售業業自動化推薦產品、…等多元化應用。

最後 SAS Viya 雲端分析平台有別於 SAS 解決方案則是提供企業深度學習的平台,在 SAS 解決方案中詐欺風險是深度採用神經網路和關聯分析進行智慧警示的評分、找出內控的問題、時序分析、…等應用。但是 SAS Viya 則提供共享平台、快速運算和協同管理的雲端分析平台,其能夠讓使用者透過熟悉的語言 R、Python 或 SAS 在 SAS Viya 平台中執行,並且透過 In-Memory 記憶體快速計算的技術,關鍵在於記憶體搭配硬碟的技術,不在受限於資料量的大小。此外對於資訊人員而言,則以微服務設計平台提供高規模化的應用,並且整合有效的權限安全控管,對於管理人員而言,則提供分析專案的資源控管、分析作業的流程控管和分析模型的版本控管,對於分析人員而言,則提供 SAS Visual Analytics 、 SAS Visual Statistics 、 SAS Visual Data Mining and Machine Learning 、 SAS Visual Investigator … 等視覺化分析工具進行進階分析與預測分析的應用。

總結不論是 SAS 解決方案或 SAS Viya 雲端分析平台若要能夠落實高品質的進階分析與預測分析之應用,則還是要回歸資料的本質,也就是針對資料提供準確且多元的有效變數為分析基礎資料表。但是要如何提供準確的變數資料則就必須要有完善的資料治理,以利進行高品質的資料前處理,以利針對不同的應用情轉換出準確且多元的有效變數,更進一步提供高品質的進階分析與預測分析之應用,此時 SAS 也有提供資料管理的解決方案,其中相關產品則有 SAS Data Quality、SAS Data Linkage、SAS Data Studio、SAS Data Integration、… 等若是考慮企業長久發展建議導入 SAS 資料管理解決方案從資料源頭開始進行高品質的分析。

SAS 9

預測模型使用歷史資料預測未來新資料的結果,這些預測會被使用於未來進行策略決策,例如: 預測模型能夠讓企業進行有關客戶市場回應的行為準確決策。基於這些預測,企業會識別有效影響客戶行為的策略,通常在建立和評分預測模型主要有兩個主要的程序,分別為:

  1. 透過存在的資料建立預測模型。

  2. 部署模型在新資料上進行預測評分。

預測模型的會由公式或規則組成,主要是依我們使用分析的類型的不同。基於輸入變數集大部分會被用於預測目標變數,例如: 回歸模型有參數和公式,決策樹則沒有參數但有規則。一般來說我們會將預測模型應用於企業進行目標行銷、信用卡評分和詐欺偵測。

首先目標行銷主要使用客戶資料改善銷售促銷和產品忠誠度的行銷,屬於資料庫行銷的類型之一,這時預測模型會基於客戶歷史資料,模型中主要包括客戶屬性的輸入資料,例如: 收入(連續變數)、職業(名目變數)、…等,通常會用於預測促銷對於客戶的回應,此時輸出資料則為二元變數主要是指客戶對於促銷的回應是否會進行購買,然後企業會應用預測模型針對新客戶的資料進行預測,哪一個客戶區分最有可能進行購買,也就是目標群眾,此時行銷工作就能專注於目標群眾,此外歷史客戶資料庫也會被使用於預測個人加入服務或取消服務,這時忠誠度促銷就能鎖定有極高風險取消服務的客戶。SAS 則有提供行銷自動化 (SAS Marketing Automation) 和即時決策管理 (SAS Real-Time Decision Manager) 的解決方案,同時在 2017 年 Gartner 的研究報告中提到 SAS 在於多通路行銷活動的管理是領先者的地位。

接著信用評分主要被使用於決定客戶信用申請表是否要允許或拒絕,此時會以歷史申請表資料建立預測模型,模型中主要包括申請屬性的輸入資料,例如: 收入(連續變數)、信用評分(連續變數)、…等,通常會用於預測申請人的貸款或負債情況,然後企業會應用預測模型針對新的申請人資料進行預測,主要目標在於降低新申請人的違約和嚴重拖欠的情況發生。SAS 則有提供信用風險評分 (Credit Scoring for SAS Enterprise Miner) 和企業風險管理 (SAS Enterprise Risk Management) 的解決方案,同時在 2017 年 Chartis RiskTech 的研究報告中提到 SAS 在於建模風險治理解決方案是領先者的地位。

再來詐欺偵測主要重點在於企業需要監控詐欺的交易,例如: 信用卡的購買或保險索賠,此時會以歷史交易資料建立預測模型,模型中主要包括交易或保險索賠屬性的輸入資料,通常會用於預測交易的詐欺狀態,然後企業會應用預測模型針對新的交易資料進行預測。主要目標在於預防新的交易和索賠被詐欺或濫用的情況發生,並且進行調查和阻檔。SAS 則有提供詐欺管理 (SAS Fraud Management) 和反洗錢 (SAS Anti-Money Laundering) 的解決方案,同時在 2017 年 Forrester 的研究報告中提到 SAS 在於進階分析和機器學習解決方案是領先者的地位。

總結我們學習統計基本理論概念,搭配進階的機器學習演算法建立預測模式之後,更進一步則能夠針對企業所面臨的問題導入適當的 SAS 解決方案,除了解決企業的問題痛點之外,更能夠為企業帶來持續不間斷的分析價值,以及全面性的風險治理。

SAS Viya

首先我們要如何在大量快速的資料中,透過應用簡單的業務規則和模式,同時無需存儲任何資料檢測,即時訓練和分析模型進行評分,以及如何將特定功能轉化為直接的業務優勢將會是非常重要的事情。在過去當我們考慮分析時,最常見建立模型的方法就是執行提取,轉換和載入,也就是 ETL,並且存取來自多個資料來源的儲存資料,同時轉換寫入至集中式資料儲存中,更進一步的透過資料操作來建立分析基礎資料表,也就是 ABT,其代表模型輸入的資料,下一步訓練分析模型,然後進行部署將此模型應用至正式環境中,以及定期執行已部署的模型根據歷史資料產生評分,上述步驟稱為靜態資料模型的建立和執行,然後可以計算評分,再由應用程式驅動業務流程和決策分析。

接著 SAS Event Stream Processing 是一個事件串流引擎,主要能夠以低延遲每秒處理數百萬個事件,這樣我們就能夠應用計算執行操作,並且對於事件串流進行應用分析,至於事件串流是我們業務中發生的事件的記錄,其有可能網站或移動應用程式任何操作,但它就是一個資料記錄,我們稱為串流,因為與傳統的 ETL 流程不同,其通常是作業執行的地方定期提取,轉換和載入資料,我們將會在資料發生時即時處理分析。我們主要可以針對串流資料進行簡單的事件處理開始,像是計算、過濾器、聚合、…等,有時也能夠為業務帶來價值,更進一步增加資料品質的操作,時間模式檢測,文字分析,串流分析、機器學習、…等,當然 SAS Event Stream Processing 支援開放源始碼和其它語言的整合,像是我們主要會透過 Python 語言建立事件串流處理專案,透過 Python 和 C 語言產生即時串流內的評分,以及透過 Python 、C 和 Java 進行客製整合。此外串流 ETL 管線處理的高層級的架構主要能夠分為四個階段,分別為資料來源、資料收集層、資料暫存層和 SAS 雲端分析處理,其中 SAS Event Stream Processing 能夠支援多種類型串流資料來源,像是各種傳感器產生的串流資料、多個檔案分發到不同的資料夾、透過 API 與分散式串流或靜態資料來源互動取得資料,當收集資料之後,其會將其發送到資料暫存層,並且在串流中進行轉換,同時將轉換之後的資料寫入 CAS 資料表中,以利後續即時分析應用。

再來我們要如何將上述所提到的 SAS Event Stream Processing 技術功能轉換為商業效益,像是提高收入,提高客戶滿意度,提高生產力、降低流失率、降低操作錯誤、降低欺詐發生機率,以利我們建立一個商業計劃來證明採用 SAS Event Stream Processing 事件串流處理的合理性。此時第一步驟就是需要與業務領域進行合作和討論,以確定現有的業務問題及其相關的估計損失或創造收入的新機會,將有助於提供的產品或服務,以及其相關的損失和收益機會,第二步驟就是將 SAS Event Stream Processing 功能對應至最終的業務優勢,我們主要能夠從五大方面進行深入探討,分別為:

  1. 直接的商業效益

  2. 快速進入市場

  3. 減少模型和專案部署操作錯誤

  4. 改善模型成效

  5. 即時資料整合和資料品質

第三步驟當完成業務計劃之後,再次與業務領域合作,以解釋有形的商業效益,同時透過 SAS Event Stream Processing 重新定義並且完成計劃,有時我們需要提供減損或直接損失的估算收益,如果我們需要這樣做,請嘗試在估算中保守,並且嘗試進行驗證商業領域的業務問題,請注意雖然我們可以一次包含多個業務問題,但是可能會增加專案的複雜性和不確定性,以致於增加專案的風險,因此最好先一次針對一個問題或機會。

最後 SAS Event Stream Processing 非常適合解決業務問題,並且這些問題主要以即時執行分析為主,並且在不儲存資料的情況下產生資料串流的洞察力,同時其提供了豐富多樣的進階分析建模算法,包括監督和非監督,將能夠處理結構化資料和非結構化資料,像是文字分析影像處理,以及採用離線和在線開發模型的能力。此外基於條件維護 (Condition-based maintenance, CBM) 關鍵高價值機器是典型的物聯網 (Internet of Things,IoT) 情境,其主要關鍵是監控重要的機器健康參數,以利可以基於機器的感知狀況進行維護,而不是每隔一段時間執行預防性維護,其中維修之間的故障可能性非常小,或者通過執行機器直到它失敗再進行修復,這時我們也就能夠透過 SAS Event Stream Processing 來監控即時變數的即時狀況。

SAS Visual Investigator

首先在面臨日益增加複雜性需求,分析師和調查人員需要提高了解警報的效率,以及影響最大的網路,此時使用 SAS Visual Investigator 將能夠讓我們執行更深入調查,以利發現隱藏的行為和活動。所謂 SAS Visual Investigator 主要能夠進行分類和管理警報,搜索和發現有關物件的相關詳細資訊,並且使我們能夠從不同角度查看資料和關係,包括社群網路,地圖資料和時間軸資料 ,以及工作區功能將能夠讓我們整理與調查相關的資訊,同時確定如何對其進行視覺化呈現見解,至於解決方案管理員負責配置和自定義解決方案,以利支援在企業環境中進行部署,像是銀行和金融機構詐欺和洗錢解決方案。

接著在 SAS Visual Investigator 中我們主要會透過兩種方法來獲取和評估調查任務的相關資訊,第一種方法為基於警報的調查,在企業內部會有相關的自動警報產生流程,第二種方法基於發現的調查,在企業內部會有相關的手動互動操作網站。所謂警報主要是一個物件,其主要擷取可操作實體的監視資料,以及該實體的分類活動,像是調查和申請的歷史資料,同時警報是根據警報事件創建的,警報事件是從各種資料來源傳送到 SAS Visual Investigator 中,警報將會按照策略組織佇列,並且僅有被授予存取特定策略權限的使用者才能夠使用與該策略相關聯所有佇列中的警報。通常解決方案管理員會建立一組規則,這些規則將適用於在特定產業規範的情況下可能表示可疑行為的事件,該事件代表可疑行為或活動的可能性就越大,則分數就越高。所謂發現主要是使用強大的搜索功能來瀏覽資料儲存庫的內容,以利發現與當前調查有關的資訊或進行新調查的資訊。

再來在 SAS Visual Investigator 中我們還能夠將感興趣的調查物件增加至工作空間中,一個工作空間可以與一個調查物件相關聯,每個工作空間都獨立於其它工作空間,每個工作空間皆是一個調查員工作區,能夠讓我們收集與調查更多相關的資訊,像是地圖,網路圖,文字和影像,並且透過多種方式將資料進行視覺化呈現,以利從不同的角度查看物件和資訊之間的關係,我們能夠在調查過程中更新工作空間,並且根據需求增加或刪除項目。此外在 SAS Visual Investigator 的工作空間中有提供許多不同類型的資料檢視畫面,分別為:

  1. 詳細檢視:主要能夠查看與調查相關的詳細資訊。

  2. 地圖檢視:主要能夠查看與調查相關資料中地理環境中彼此相關的物件。

  3. 網路檢視:主要能夠查看與調查相關資料中物件的連接和關係。

  4. 資料表檢視:主要能夠查看與調查相關的資料。

  5. 時間軸檢視:主要能夠查看與調查相關的日期資料。

  6. 文字分析檢視:主要能夠查看與調查相關的文字雲或文字分析結果。

最後在 SAS Visual Investigator 中針對管理報表的功能,將能夠讓具有適當特殊權限的使用者能夠查看適當的調查資訊,並且針對分析人員,策略和隊列進行管理分配,以及營運管理員將能夠查看警報處理方式和任務完成率,此功能將能夠使管理人員更有效地管理和分析工作量,更進一步在整個企業組織中有效地分配工作。此外除了管理報表的功能之外,我們更能夠透過 SAS Mobile Investigator 行動應用程式為使用者提供了簡化的行動裝置操作界面,以利存取 SAS Visual Investigator 中資料和設定,讓使用者能夠不在辦公室時進行調查工作。

SAS Detection and Investigation for Banking

首先詐欺行為通常始於身份盜用,並且透過合成身份進行詐欺已經使銀行損失高達數十億美元,並且追查不到不存在的詐欺犯,至於身份識別的詐欺方式主要能夠分為三種主要類型,分別為身份盜用、身份操作和合成身份,在這三種類型中綜合身份通常是最具挑戰性的識別,檢測和預防,因為合成身份是由各種來源偽造的組合而成,或者透過編輯或變更資料而建立用於詐欺的合成身份。當建立合成身份之後,就能夠透過多種方法進行詐欺,一開始需要先通過信用資料或記錄,主要常見有三個方法,分別為:

  1. 申請信貸 (Applying for credit):主要利用合成身份申請信用卡服務,此時商家、金融機構或其他實體提交合成身份資訊給徵信機構,如果徵信機構有該身份的檔案,則就會給債權人一個分數,但是如果沒有可比記錄,則徵信機構就會建立一個檔案,並且記錄查詢,不論初始請求是否已經批准或拒絕,但至少已經有合法的身份記錄,因此我們需要在申請信貸時針對未知的身份進行調查。

  2. 增加授權使用者 (Adding an authorized user):主要將新身份增加為授權使用者,使用者能夠使用現有的信用文件、另一個合成身份或真實身份證文件,此時可能會因勾結詐欺者,而利用其詐欺行為獲得回扣的人之信用身份,透過關聯新授權的使用者進行原始帳戶信用評分,然後拆分為一個單獨的貸方文件,因此我們需要透過授權使用者的關係調查出詐欺行為。

  3. 業務相互勾結關係 (Bringing a business entity in collusion):主要也稱為資料提供者,這方法很有可能涉及到有詐欺的商業組織,該組織主要會建立用於合成身份的假信用帳戶,然後將每月記錄提交給徵信機構,以利合成身份的帳戶持續付款,代表真實,值得信賴的人,所以詐欺者主要會利用信用服務建立可被信任之身份,因此我們需要透過網路關聯圖調查出已被信任之身份的詐欺行為。

接著我們要如何在在數位應用程式中進行多個層次驗證身份,以利判斷申請人身份是真實,而非合成身份,此時有關深度盡責調查主要有兩個方法,分別為:

  1. 身份驗證 (Identity verification):主要將申請人的詳細資訊與歷史信用記錄進行對應,並且透過不容易偽造的資訊確保申請人是所聲稱的真實身份,以利驗證身份並非用於詐欺行為。

  2. 裝置驗證 (Device verification):主要將裝置的詳細資訊根過去的經驗和資訊進行比較,以利判斷過去是由哪個身份使用過此裝置設備,以利驗證裝置並非用於詐欺行為。

除了進行多個層次驗證身份之外,我們更需要針對應用程式中的資料進行詐欺偵測和調查,此時企業組織就會需要收集來自於大量內部和外部資料的線索,而有效收集資料的方法主要有三個方法,分別為:

  1. 監視應用程式資料 (Monitor application data):主要監視應用程式中的資料,將能夠幫助發現合成身份,並且發現跨多個資的重複使用的身份,或者重複使用同一台裝置來創建和管理多個無關的身份。

  2. 分析網路 (Analyze the network):主要分析網路來理解申請人、設備、帳戶和應用程式的資料,像是一個帳戶是否有未授權的使用者?家庭成員?多個應用程式是否具有相同的貸方文件?透過網路連結視覺化的方式偵查和調查潛在的詐欺行為。

  3. 評估過去的經驗 (Assess past experience):主要評估申請人過去在應用程式上的經驗是什麼?是否包含相同的資料元素,像是相同的裝置設備?是否因原因或詐欺而關閉帳戶?負面資訊將能夠促進更進一步的盡職調查,以利了解申請人與帳號之間的關係,若是缺乏全面的身份資訊將很有可能會發生詐欺行為的風險。

再來針對詐欺行為進行分析,主要有四個分析方法,分別為:

  1. 描述性分析 (Descriptive analytics):主要從資料中了解現在正在發生的事情或過去發生了什麼事,產生了多少警報,每個警報需要花費幾個小時進行調查?這些關鍵績效指標對於企業營運非常重要。

  2. 診斷性分析 (Diagnostic analytics):主要解釋為什麼發生了某些事情,查找統計異常值,指出根本原因的相關性和分類為何?這種診斷見解的方式主要能夠改善計劃,以利管理詐欺風險。

  3. 預測性分析 (Predictive analytics):主要憑藉預測性分析的見解,以利管理詐欺風險的分析的團隊了解未來詐欺的趨勢和結果。

  4. 指示性分析 (Prescriptive analytics):主要透過優化研究確定最佳結果或方案,其目的主要是透過修改滿足業務限制條件的決策變數,以利滿足最大化或最小化某些目標。

此外與基於規則的系統不同,對於犯罪分子而言,基於規則的系統相當容易測試和規避,此時機器學習用於偵測詐欺行為,主要會從過去的經驗中學到的場景可用作無監督或有監督機器學習的輸入,演算法主要會從資料模式進行學習,與假設驅動的分析不同,機器學習將能夠發現我們不知道要尋找的內容,以利偵測出更多的詐欺行為,甚至是不遵循常見模式的罕見事件,因此機器學習透過自動化來適應人口中不斷變化的行為模式,以利自動建立適應行為模式的分析模型,至於正確的機器學習偵測方法取決於輸入變數、訓練模型和目標變數,主要有兩種機器學習的模型,分別為:

  1. 監督學習 (Supervised learning):模型主要會為演算法提供樣本輸入和相關輸出,其目標主要是設計一個對應輸入的通用規則輸出,我們主要訓練監督模型,以利進行詐欺檢測,其中主要使用詐欺和合法活動相關的記錄,以及了解新資料應用時如何預測詐欺的存在。

  2. 無監督學習 (Unsupervised learning):模型主要不會為演算法提供任何標籤,該演算法將會自行查找結構或資料中的隱藏模式,由於我們不知道哪些資料代表詐欺行為,所以期望模型建立描述函數結構的函數資料,將不符合標準的內容標記為異常,然後應用掌握全新的和看不見的資料。

但是若要使用機器學習演算法的分析模型應用於詐欺偵測,則需要大量資料,以利機器學習具有大量且良好的分類知識,以利從大量資料中查找模式和建立高度準確的模型,此時更多資料代表著更好的模式識別和更準確的詐欺檢測,雖然用最少的人工干預來定義模型,但是最終分析模型大部份像黑盒子,因此很難針對機器學習模型的結果進行解釋。

最後 SAS Detection and Investigation for Banking 解決方案將能夠解決身份盜用、身份操作和合成身份等問題,並且識別和減少應用程式中的詐欺行為,此解決方案主要針對銀行的偵測和調查詐欺行為提供一個單一端到端的整合分析平台,將能夠更好地進行詐欺偵測,並且在多個通道和產品上實現更高的營運效率。搭配獨特的混合分析方法使用多種進階分析和機器學習技術,像是自動業務規則、預測模型、文字探勘、資料庫搜尋、異常報告、網路連接分析、… 等,以利更準確地發現更多可疑活動,以及強大的詐欺分析引擎將內建人工智慧和機器學習技術與傳統的偵測方法整合使用時,將能夠以即時或批次的方式處理所有資料,而不僅僅是樣本資料,以利發現更多詐欺行為,並且減少誤報率。此外基於風險和價值的評分模型,在警報發送給調查人員之前,對警報進行準確的評分和優先級排序,以利在節省時間的情況下,研究人員可以以更高的效率處理更多案件,並專注於產生更高投資報酬率的高價值網路,更準確的評分也代表著更少的誤報,從而減少了客戶的不便,以利提高了客戶滿意度,更進一步還能夠透過識別由合成身份導致的銀行欺詐損失來提高收款流程的效率,因為這些損失幾乎沒有收回的機會。

SAS Adaptive Learning and Intelligent Agent System

首先目前隨著數據量快速增加,威脅偵測的任務越來越多且越來越複雜,像是銀行需要從每天發生數十億筆交易識別潛在的詐欺交易,此時我們不再能夠透過手動的方式查看所有可用的資料,因此需要依靠系統來縮小資料範圍,以利幫助銀行找到真正的詐欺交易,而這些系統往往是以下二種,分別為:

  1. 專家驅動系統:主要由領域專家根據產業經驗定義規則或預測模型,以利發現潛在的詐欺行為。

  2. 資料驅動系統:主要由機器學習技術識別交易行為資料中的可疑模式,以利發現潛在的詐欺行為。

儘管這些方法被證明是有效的,但是需要產業領域的專業知識來定義適當的專家驅動規則或數據科學專業技能來定義適當的資料驅動規則,並且隨著威脅模式的變化和趨勢發展,兩者皆需要定期進行更新。

接著詐欺罪犯會一直在尋找新的欺詐方式,這種不斷發展的威脅給專家驅動的方法論檢測帶來了問題,因為隨著新的詐欺模式的出現,需要一些時間和專業知識才能夠製定新的規則。同時當偵測威脅,就需要人力資源進行進一步調查以識別是否確實是威脅,以及需要採取什麼進一步的措施,但是企業組織通常僅有部份的分析人員可以對產生的警報進行分類,並且按照威脅劃分警報的優先級,以及確保低誤報率是最關鍵考慮因素,因此銀行需要在未發現的詐欺成本和處理成本之間取得平衡。此外真正的交易要比欺詐交易多,守法公民多於詐欺罪犯,而對於大多數機器學習演算法來說,這是一個非常具有挑戰的罕見事件問題,需要透過資料科學專業技能來解決此問題。

再來不論由領域專家根據產業經驗定義規則或預測模型,或由機器學習技術識別交易行為資料中的可疑模式,皆能夠透過 SAS Adaptive Learning and Intelligent Agent System 解決方案進行詐欺分析,以利發現潛在的詐欺行為。其主要能夠自動化建立模型以進行偵測,在自動化建立模型的過程中,智慧代理應用程式主要查看企業組織中的資料,並且使用有監督和無監督的機器學習技術來建構準確且經過專門調整用於偵測罕見事件的模型,然後可以將此模型部署在 SAS Visual Investigator 中針對現有資料產生警報,並且透過圖表、地圖、時間表和網路分析等調查工具來處理這些警報,以利確定威脅是否真實。最重要的是智慧代理應用程式會持續監控警報調查的結果,並更新結果進行持續學習,同時智能代理會根據更新的資料自動重新訓練模型,如果認為它比上一個模型更好,則可以發佈到正式環境。

最後 SAS Adaptive Learning and Intelligent Agent System 主要提供網站操作界面,僅需要透過設定表格、目標、事件旅標和模型屬性的步驟設定,就能夠在最短時間內自動化查看企業組織中的資料,並且使用有監督和無監督的機器學習技術來建構準確且經過專門調整用於偵測罕見事件的模型。此外當模型自動化建立完成之後,就會產生結果報表,預設主要會顯示四個指標資訊,分別為:

  1. 偵測率:正確命中事件的比例。

  2. 誤發現率:錯誤命中的比例。

  3. 未命中事件率:應命中但未命中的事件之比例。

  4. 命中率:記錄命中的比例 (正確和錯誤命中的總和)。

當然還有提供效能矩陣、 ROC 曲線、PR 曲線和增益圖表等視覺化呈現,以及針對效能矩陣將會產生「在 0.7 的臨界值下,此預測模型成功命中 292 個事件,同時未命中 247 個應命中事件。模型命中率為 54.17% 且事件未命中率為 45.83%。事件命中的轉換率為 82.72%。」敘述說明,更進一步我們能夠直接透過網站操作畫面動態調整臨界值,當調整之後會立即更新模型結果,至於相關操作畫面,請參考官方論文

開始使用

Last updated