智能制造與大數據:數據分析實現智能化
2020-12-25 15:13:37
次
前面《智能制造與大數據——數據共享實現網絡化》一文圍繞智能制造發展的第二個階段——“網絡化”展開闡述,重點介紹通過主數據標準制定及數據處理等技術保障共享數據的一致性與完整性,從而實現網絡化協同的目標。
制造的進一步目標是在數字化和網絡化的基礎上實現智能化制造。本期,我們將繼續和您分享“智能制造發展的第三階段-智能化”。
一、無處不在的“智能”應用
近年來,隨著高新科技與創新浪潮的發展,“智能”二字在我們生活中出現的頻次越來越高,智能化設備也越來越多,如:智能冰箱(通過溫度自動調節讓食物保持最佳存儲狀態)、智能手表(除指示時間還能監測使用者的睡眠、健康狀態、足跡等)、智能音箱(除了外音播放還可以進行各類語音交互,如新聞播報、智能家電控制等)、智能掃地機器人(能夠自動測量工作空間、規劃合理路徑,執行全屋清掃)、智能汽車(無人駕駛汽車,通過車載傳感系統感知道路環境,自動規劃行車路線并控制車輛到達預定目標)等。此外,全社會還在致力于構建智慧城市、智慧醫療、智慧能源、智能化民生等建設。
“智能”無處不在,歸根結底是因為隨著數據采集、數據傳輸與共享、數據處理與分析和人工智能技術的發展,我們有了從非智能向智能轉變的基礎和契機。站在智能制造的角度,圍繞制造型企業的智能應用重點包括:智能設計、智能研發、智能決策、智能車間、智能工廠、智能物流與供應鏈、智能服務、智能裝備、智能產線、智能管理等。
二、實現智能化的關鍵:大數據處理與分析技術
眾所周知,大數據是人工智能的基石,人工智能依賴于超強的計算能力和充分的大數據集。制造企業智能化應用的真正實現,必然也需要圍繞企業發展中產生的大量多源異構數據資產作支撐,比如:各類業務信息系統中的結構化數據;經營文件、作業指導書、質檢報告等半結構化數據;生產管理監控視頻、測試音頻等非結構化數據;產品試驗過程時序監測數據等。為實現這些數據的充分利用與價值挖掘,大數據處理與分析技術就顯得尤為重要。
大數據處理與分析技術支撐“數據資產價值化”這個核心目標的實現,重點是將采集存儲的企業數據資產,通過業務分析、場景構建、分析處理、算法開發、模型構建、可視化和應用開發等步驟,實現數據價值變現,以達到智能決策與應用的目的。一句話概括,工業大數據分析主要是利用統計分析、機器學習、深度學習、信號處理等技術,結合業務知識通過對工業過程中所產生的數據進行處理、計算、分析并提取其價值信息、規律,進而實現自感知、自決策、自執行的過程。
隨著物聯網、高性能計算、高維可視化、大數據基礎平臺等技術的發展與支撐,基于大數據處理與分析技術,開展制造企業各層次研發、生產、管理、服務等智能化決策應用模型的開發,解決企業生產及經營管理層面的業務難題,已成為現階段制造企業智能化轉型升級的核心工作之一。
三、典型的數據分析挖掘過程
典型的數據分析挖掘過程主要包括基于業務充分調研與理解后的數據接入、數據預處理、特征工程、算法選擇與開發、模型構建、評估評測、模型洞察、模型部署及成果發布等過程。美林數據完全基于此分析建模流程研發打造 Tempo 大數據分析平臺,支持企業級用戶快速實現數據資產的深度分析與應用建模。

1、數據接入
平臺數據接入包含關系型數據庫輸入、MPP數據庫輸入、大數據分析引擎輸入、文件上傳、數據同步等不同輸入節點,支持不同類型數據的快速導入,為挖掘分析與模型訓練提供基礎數據源。
2、數據處理
提供多種數據預處理方法及數據的高級轉換操作,包括但不限于數據標準化、RFM分析、因子分析、角色定義等,實現數據清理、集成、變換、消缺、歸約等預處理操作,為挖掘分析做好數據準備。
3、特征工程
要構建一個高效精準的機器學習模型有很大一部分因素取決于特征向量的選擇與提取,構造好的特征向量,是要選擇合適的、表達能力強的特征。尤其是對于工業大數據來說,由于數據來源多、業務機理復雜、外界因素干擾、傳感器異常等原因,企業原始數據包含較多的異常點、干擾點,多維度之間存在非線性關系等,這些都將直接影響后續模型構建的準確性以及模型復雜度,因此在算法選擇與模型構建之前,需要數據分析人員對原始數據進行探索分析與特征提取,開展過濾、轉化、降維、特征選擇等特征分析工作,為算法選擇與模型訓練提供良好輸入。
4、算法選擇
基于業務問題剖析、數據基礎探索與特征工程處理后,算法類型的確定與具體算法的選擇將成為搭建分析模型的關鍵。平臺提供豐富的分析挖掘算法庫,包括分類、聚類、回歸、關聯分析、時間序列、綜合評價及文本挖掘等多類別上百種機器學習算法,并支持集成學習、深度學習等框架與應用模型搭建,全面實現復雜場景下各業務數據的分析與建模訴求。與此同時,平臺提供基于Python、Java、R、MATLAB等編程語言的擴展編程接口,支持特定場景下,工業應用領域用戶的業務型經驗算法、細分專業特定算法的快速寫入與固化應用。
5、模型訓練
模型訓練是以歷史數據為樣本,對模型進行評估,以保障模型的準確率。在樣本選擇的時候,需要滿足數據樣本多樣化、數據樣本盡可能大、數據樣本的質量盡可能高等條件。平臺提供對模型迭代訓練過程的可視化洞察功能,實現模型訓練過程的全透明管理監控,輔助數據分析人員構建高性能和高精準度的挖掘模型。
6、評估評測
精度準確、性能良好的機器學習模型不是一蹴而就訓練獲得的,過程中需要基于CRISP-DM流程進行反復迭代、優化與評測驗證,根據數據變化及業務決策使用要求反復調整優化模型。因此,合理、有效的模型評估方法與機制是必不可少的。平臺提供的模型評估方式支持離線評估和在線評估兩種方式,并可直接對評估結果進行可視化展現;評估完的模型可直接在建模工程中進行輸出、讀取與復用。
7、模型洞察
模型洞察的作用是全方位觀察分析建模過程及模型運算的結果,通過洞察能夠為改進數據分析挖掘流程和模型調優提供支撐,從而提升模型有效性和精度。
8、模型部署
模型部署重點是將設計、驗證后的模型與調用流程投入生產使用,通過發布挖掘流程,并利用調度任務或接口服務等方式將設計好的流程接入到生產環境,形成最終的決策應用系統,指導實際業務的開展。
9、、成果發布
整個數據分析及建模工程完成后,可以快速將分析挖掘模型等成果進行發布與共享,支持外部鏈接、數據展示門戶及外部調用接口等多種分享方式。成果發布后形成數據挖掘模型庫,后續類似應用構建時可從模型庫中選擇已有模型進行快速調整,提升建模效率。支持將發布后的成果嵌入第三方平臺或與已有信息業務系統集成,并支持將關鍵信息實時發送到移動端、PC端、大屏等,滿足企業多層級多場景下決策應用的需求。
四、典型應用場景:預測與健康管理
智能化應用的一個典型場景便是預測與健康管理(Prognostics and Health Management,PHM),尤其是設備狀態的準確分析與預測性維護。一直以來傳統企業在典型或核心設備層面的維護主要是參照設備的標準參數及工人經驗進行設備維護保養,維護人員經常不得不選擇提前更換正常部件以最大限度保障設備正常運行,或冒著發生故障停機的風險使其盡可能久的運行,存在著過渡維護、成本浪費或潛在風險增大等現象,比如:機器突發性故障會造成時間、生產和利潤的嚴重損失。
如何實時準確地判斷設備的健康狀態,并提前預測設備或典型部件的失效時間是困擾企業的一大問題。我們知道,一臺設備是否會提前或者延后失效與設備的使用過程有很大的關系,通過采集設備運行狀態信息及設備維修保養記錄信息,根據設備失效的影響因素構建設備預測性維護模型。通過歷史數據進行學習模型構建與知識獲取,在應用過程中以實時的設備運行狀態數據為輸入,并基于預測出的設備健康狀態與失效時間提前進行設備維護,可極大程度避免設備的各類突發故障。基于“數據驅動+機理模型”的設備狀態評估與預測性分析,幫助企業回答了“是否有故障”、“哪一類故障”、“何時維修、如何維修”的問題,既能高效準確找出需關注的部件或子系統,前瞻性開展維修計劃及工具、庫存備件的準備等相關工作,還可以在設備脫機或生產間隙安排并啟動維修保養計劃,為車間和工廠節省時間、金錢和空間,也可避免不正確的維護計劃帶來的設備利用率低及突發故障的產生,進而保障生產安全并提高生產效率。

簡單來說,基于設備全要素的數據采集、存儲、共享與分析的設備預測性維護可實現如下效果:
- 較高的運維效率:顯著降低設備的故障率及停機時間,提高設備利用率,保證設備持續使用,避免非計劃性停工,提高企業生產效率。全面降低由設備的故障或突發故障所帶來的難以估算的安全隱患,提升企業設備運維效率與質量。
- 較好的設備性能:一體化設備健康管理平臺,可有效積累設備典型故障模式及知識庫,結合設備全壽期數據連接,可實現設備研制信息閉環反饋,全面提升設備研制與維護水平。
- 較低的服務成本:減少設備整個生命周期維修費用及成本,消除過度維護所花費的時間和資源,設備維修總體原則可改變為“適時小修、避免大修、預防性、計劃性維護”。
對于智能制造的發展來說,數字化制造、網絡化制造和新一代智能制造并不是決然分離的,而是相互交織、迭代升級。在數字技術、網絡技術充分發展的今天,智能制造推進過程中都可按照需要融入各種先進技術,進而推進制造業轉型升級。
本專欄系列文章主要針對智能制造三個階段中的數據采集、數據共享及數據分析等關鍵技術進行闡述。隨著物聯網、大數據和云計算等技術的高速發展,基于多信息采集與融合分析的智能化應用能力逐步落地并發揮出較大價值,使得企業生產能力和經營效益均達到了一個全新高度。對于期待智能化轉型的制造企業,務必在開展智能制造應用規劃與建設的過程中要利用好此類技術,為數據采集、數據共享與數據分析應用提供支撐。
只要全面把握企業智能制造發展的方向與目標,圍繞具體目標確定相關數據范圍,并采用合適的數據采集技術獲取數據,并將數據進行標準化、規范化管理,從而實現高質量的數據融合與共享;結合具體業務問題的智能模型構建與利用,實現基于數據驅動的生產管理過程的診斷與優化,實現生產業務、經營管理活動的自感知、自決策與自執行,逐步實現企業的智能化轉型目標。