一、資料分析及應用
(一)建置人民線上資料庫動態Metabase儀表板,並每月自動更新,作為資料分析應用範例。
(二)利用機器學習方法,試辦四種心健司精神照顧系統風險預警模型建置,包含:自殺風險預警模型、傷人風險預警模型、思覺失調傷人風險預警模型及思覺失調14天內再住院風險預警模型。
圖片說明:模型預測樣本(預測風險行為之高風險群)預測得出數值是以精神病患群體人口(以精照資料庫為主)中未來發生風險行為的高風險群體(自殺、再住院)(未知),加上風險行為-自殺防治通報系統(已知)與出院準備計畫(已知)資料去預測。
透過機器學習演算法可用於預測風險行為高風險群體,期望模型預測樣本可以貼近「未來發生風險行為的真實群體。」
(三)分析本部相關業務系統訪視紀錄語料,分析語料內容並擷取業務關鍵字,建置五項訪談紀錄語意資料庫,以利後續語料分析之運用,包含:1966話務整合系統、社家署脆弱家庭個案管理平台、心健司加害人處遇系統、社工司兒童與少年未來教育及發展帳戶系統及保護司保護資訊系統。
二、平台功能優化
(一)提升數據分析能力:平台整合了 Python 和 R 的多個數據分析套件,如 Scikit-learn、Spacy、VADER(NLTK) 以及 OpenCV-Python 等,讓使用者能進行樞紐分析,並直接生成圖表。
(二)提供更直觀的數據視覺化:平台新增文字雲功能,並支持TGOS服務,讓使用者使用地址轉換等相關功能,並導入Metabase儀表板,針對系統運行狀態、應用性能、指標等進行監控和分析時,可以使用儀表板提供的功能,實時查看和分析多個數據源。
(三)改善資料品質分析與錯誤管理:平台自動生成資料品質報告,並新增 ETL錯誤通知功能,使用 Logstash 和 Elasticsearch 分析數據運行情況,讓管理者隨時掌握系統狀態,並強化資料管理與通知功能,確保資料的準確性。
三、資料分析應用活動成果
(一)辦理數據應用暨資安強化論壇:針對本部相關系統廠商,說明資訊安全防護工作強化的基礎概念及宣傳本部大數據平臺,並配合本部政風處及邀請廉政署共同出席。
(二)資料分析應用黑客松:因應113年本部舉辦總統盃黑客松,本部針對部及所屬機關同仁,舉行了為期數月的大數據資料分析應用黑客松活動,包含:教育訓練、工作坊、成果競賽及最終成果發表,期望激發本部及所屬機關數據分析支援決策、為民服務及完善資料應用等。
圖片說明:
- 活動規劃及說明會:規劃活動內容、公布活動(說明會)。
- 開始報名及蒐集各隊伍提案( 資料整備):蒐集各隊伍提案、各單位業務資料匯入本部大數據平台。
- 搭配工具教育訓練:資料分析工具(Power BI、Python、R)、大數據平台。
- 工作坊規劃:由外部講師個別指導參賽組別,強化分析題目及內容。
- 黑克松&活動評比:辦理黑客松活動,並進行最終成果評審、名次公布及頒獎。
- 成果發表會:邀請本部會規模本次黑客松成果。