• beat365
  • 經管郵箱
  • 教職工内網
  • 用戶登錄
  • EN

基于大模型的雙環螺旋知識共創

2025-02-26
閱讀:

基于大模型的雙環螺旋知識共創

 

E37E4


人和AI在知識共創中是雙向哺育的:人推動AI演變,AI增進人類智慧。人類智慧推動人工智能持續進化,人工智能的發展又反過來激發和促進人類智慧提升,智慧生命與智能機器之間相互促進、共同成長。


/ 徐笑君



OpenAI20221130日發布ChatGPT大語言模型以來,國内外各種各樣的大模型快速發展。由于大模型具有大數據、大算力、強算法的特點,目前機構或個體一般以預訓練的通用大模型為基座,通過提示詞工程、檢索增強生成、微調或預訓練進行二次知識創造,最終形成行業大模型或者解決具體任務的自訓練模型。

例如,2024年中秋前夕,廣聯達發布了建築行業的AI大模型白皮書,預示着中國建築軟件行業第一個大模型出現。這個行業大模型是針對行業特定數據和任務(如建築規劃、設計、交易、成本、施工、運維及綜合管理等)進行定制化訓練和優化形成的,具有行業專業知識和技能。

又如,針對沖壓時産生的廢料偶發性卡塞影響生産效率,并存在打壞模具風險的問題,上汽大衆儀征工廠進行了視覺自動化監測廢料通暢的嘗試。項目組首先通過相機捕捉廢料槽實時畫面,之後使用圖像增強和形态學處理等方法,利用幀差法實現廢料的識别,進而建立不同模具的廢料數學模型,并基于VI+AI技術開發模具廢料實時監測系統,實現了對沖壓廢料的實時智能監控,從而能夠及時發現卡廢,減少清理難度,減少停機時間。

與傳統以人為主體的知識創造相比,基于大模型的知識創造的規律有何不同?機構或個體如何應用通用大模型進行知識創造?在知識創造過程中,人和AI的合作方式和角色分配是怎樣的?人類智慧和人工智能在知識創造中如何形成互補?本文就這些問題展開分析和讨論。

基于大模型的知識共創模式和過程

基于大模型的知識創造有兩個主體:人(個體和團隊)和AI(具備深度學習能力的大模型)。以下就人的工作特點和通用大模型的特點展開分析,并歸納出基于大模型的知識共創模式、過程及其特點。

個體和團隊的工作特點

作為知識創造者,人類的知識獲取和整合能力、認知能力、偏好和價值觀等影響着知識創造過程。野中郁次郎認為人類知識創造主體包括個體和團隊,有四種知識創造形式:社會化(Socialization)、外顯化(Externalization)、組合化(Combination)和内隐化(Internalization)。

社會化是指個體間的隐性知識轉化,那些難以言傳的心智模式、經驗與直覺通過觀察、模仿和親身實踐傳遞給其他個體。這種知識的傳遞是隐性的,依賴于個體間的直接互動和非正式學習。外顯化是指個體将隐性知識轉化為可以共享和交流的顯性知識,通常通過語言、文字、圖表等媒介讓原本深藏于個人心中的知識明晰化,為團隊所共享。組合化是指團隊将顯性知識進一步整合和系統化,形成組織層面的顯性知識庫。這一過程涉及知識的收集、分類、存儲和分析,以便于更廣泛的應用和傳播。内隐化是指組織層面的顯性知識被個體吸收和内化,轉化為新的隐性知識。個體通過學習、實踐和反思,将這些知識融入自己的知識體系中,為新一輪的社會化做好準備。

團隊是組織知識創造的主體,團隊目标的設置和分解、團隊成員的選擇和分工、團隊成員之間的溝通和協作,均對團隊的知識創造效果有重要影響。理查德·哈克曼和露絲·瓦格曼指出,構建高績效團隊需要滿足三個必要條件:首先,團隊必須擁有既具有挑戰性又清晰明确的目标,并且這些目标對組織具有重大意義;其次,團隊成員需要具備相應的勝任力,團隊成員之間的技能和專長要互為補充;最後,團隊應保持一定的穩定性,團隊的邊界要既清晰又具有一定的擴展性,成員之間相互依賴。

通過比較研究,我們發現普通團隊和極限團隊存在以下差異。第一,工作态度上,普通團隊隻是以專業精神完成工作,極限團隊則是把工作當成一種使命并沉浸其中。第二,在團隊協調上,普通團隊注重團隊成員個人的經驗和能力,極限團隊看重團隊成員之間的适配性和任務完成的協作性。第三,在任務目标設置方面,普通團隊設置很多優先事項,認為目标越多越好,極限團隊則是注重有限的重要目标,堅持少即是多的原則。第四,在團隊文化方面,普通團隊努力營造一種高效且一成不變的文化,極限團隊竭力打造一種既溫情又嚴苛的文化。第五,在對待團隊沖突方面,普通團隊傾向于維護團隊成員之間的和諧,避免沖突和不安,極限團隊将沖突視為一種積極的動力,認為适度的不安可以激發團隊的創新和進步。極限團隊因其明确的目标、互補的技能、清晰的邊界、協作的文化和對沖突的積極态度,在追求卓越和創新方面展現出更為明顯的優勢。

OpenAI 最近推出的 o1 大模型為例,這個大模型是由18位在各自專業領域表現出色的年輕科學家組成的極限團隊精心打造的。首先,從團隊目标來看,該團隊的工作目标極具挑戰性,對推動 AI 大模型的發展具有極其重要的意義。為了在這個模型中融合思維鍊技術(Chain of Thought, 簡稱CoT)和系統二思維模式,團隊每個成員都孜孜不倦地工作并樂此不疲。第二,從團隊成員構成和分工來看,團隊成員大多擁有國際頂尖大學的教育背景和博士學位,并在 AI 領域積累了豐富的工作經驗。他們在大模型的開發過程中有不同的角色和職責,但都做出了突出的貢獻。例如,Jieqi Yu獲得複旦大學本科學位、普林斯頓大學博士學位,曾在臉書(Facebook) 工作了 12 年,目前擔任 OpenAI 的工程經理,負責模型的安全性和穩定性。艾哈邁德·埃爾-基什基(Ahmed El-Kishky)和 詹森·韋(Jason Wei)在模型設計和實現過程中發揮了關鍵作用,前者擁有豐富的行業經驗,參與推理研究,後者因提出思維鍊概念而廣為人知。Lilian Weng獲得北京大學本科學位、印第安納大學布魯明頓分校博士學位,是OpenAI的安全系統負責人,為大模型注入了很多安全保障理念。第三,從團隊文化來看,該團隊的氛圍非常和諧,同事們經常一起用餐、一起外出活動。第四,團隊成員擁抱不同意見,理性對待觀念上的沖突。團隊成員都非常聰明且才華橫溢,在專業問題上都有自己的見解,并充滿熱情地推動自己的想法,但是他們并不固執己見,如果遇到客觀證據反駁自己的觀點,也會願意改變想法。

通用大模型的特點

通用大模型是一種可以處理多種任務的人工智能模型,通常是基于深度學習和自然語言處理技術開發的。通用大模型可細分為單模态大模型和多模态大模型。

單模态大模型指僅處理和理解一種類型數據的人工智能模型,即隻專注于一種數據模态(文本、圖像、音頻、視頻等)。這類模型通常是針對特定任務或領域進行優化和訓練的,具有很強的專門性和深入的理解能力。例如,自然語言處理(NLP)模型專注于文本數據,圖像識别模型專注于圖像數據。由于隻處理一種類型的數據,單模态大模型可以針對數據進行深度優化,從而在特定任務上表現出色。單模态大模型通常被應用于特定領域或任務,如機器翻譯、圖像分類、語音識别等。自然語言處理領域的單模态大模型有OpenAI開發的ChatGPT4o、谷歌開發的GeminiMeta開發的LLaMA 、百度開發的文心一言、阿裡巴巴開發的通義千問和華為開發的盤古大模型等;計算機視覺(CV)領域的單模态大模型有微軟開發的ResNet、谷歌開發的EfficientNetJoseph Redmon開發的YOLOv10等;語音處理領域的單模态大模型有Mozilla開發的DeepSpeechDeepMind開發的WaveNet等。單模态大模型的應用場景有自然語言處理、計算機視覺和語音處理。

多模态大模型是一種能夠同時處理和理解多種類型數據的人工智能模型。這類模型的主要特點是能夠融合和綜合多種模态的數據,從而在理解和生成複雜信息時展現出更強的能力。多模态大模型能夠理解和關聯不同模态之間的關系,如理解一段文字并找到與之匹配的圖像,或是生成與圖像内容相關的文字。多模态大模型具備處理多種任務的能力,如圖像分類、文本生成、情感分析等,能夠在一個統一的模型框架内進行多種任務的處理。比較知名的多模态大模型包括OpenAI公司開發的 CLIPDALL-E、微軟開發的Florence、阿裡巴巴達摩院開發的天元(Tianyuan)、中國科學院自動化研究所開發的紫東太初(Zidong Taichu)、小鵬汽車開發的小鵬(XpengAI、廣聯達開發的AecGPT-V等。多模态大模型在許多場景中具有廣泛應用,如自動駕駛、醫療診斷、智能客服等。

+AI的知識共創模式

知識共創的主體之一人可細分為個體和團隊,另一主體AI可以根據其處理信息的模态劃分為單模态大模型和多模态大模型。由此可以形成四種知識共創模式:個體單模态知識創造、個體多模态知識創造、團隊單模态知識創造和團隊多模态知識創造(見表1)。每一種模式代表了人類智慧與人工智能在不同層面和維度上的協作與融合。

9AFC

在個體單模态知識創造模式中,個體利用專注于單一數據類型的AI模型來增強自己的創造力和問題解決能力。例如,作家使用專門分析文本的AI模型來提升内容深度和專業性。

在個體多模态知識創造模式中,個體與能夠處理多種數據類型的AI模型合作,以實現更為全面和創新的知識創造。例如,研究人員與一個能夠同時分析文本、圖像和聲音的AI模型合作,以探索跨學科的研究問題。

在團隊單模态知識創造模式中,團隊成員共同利用單模态AI模型來協作和共創知識。這種模式适用于需要團隊智慧和AI在特定領域内深入分析的情況,如市場分析團隊使用文本分析AI來解讀消費者反饋。

在團隊多模态知識創造模式中,當團隊與多模态AI模型合作時,能夠實現跨領域的知識整合和創新。這種模式特别适合需要綜合多種數據源和視角來解決複雜問題的場景,如産品開發團隊利用AI模型來分析用戶行為、市場趨勢和設計元素,共同創造出新的産品概念。

這四種知識共創模式不僅展示了人與AI在知識創造過程中的多樣化合作方式,也揭示了不同規模和模态的人工智能如何被應用于支持和增強人類的認知能力。

+AI雙環螺旋上升的知識共創過程

人和AI知識共創存在着兩個互補且相互促進的循環系統:一個以人為中心,另一個以AI(大模型)為中心。這兩個循環在各自領域内不斷演進,還通過交互作用共同推動知識的深化與擴展。

以人為中心的知識創造循環是一個動态疊代的過程,包括社會化、外顯化、組合化和内隐化四個階段。這個循環在個體和團隊的學習中不斷螺旋上升,每一次疊代都深化了對知識的理解和應用(見圖1)。

1C9F2

AI為中心的知識創造循環遵循機器學習和深度學習的路徑,包括數據收集和預處理、模型訓練、模型優化和内容生成幾個階段。AI系統通過各種渠道收集大量數據,并對其進行清洗、标注和格式化,為模型訓練做準備。對數據進行預處理後,AI模型通過算法學習數據中的模式和關聯,逐步構建知識基礎。在訓練的基礎上,AI模型不斷調整和優化參數和結構,以提高預測和生成的準确性。經過訓練和優化的AI模型能夠生成新的内容、模式和解決方案,這些成果可以用于各種應用場景。以AI為中心的知識創造循環在機器深度學習的過程中也不斷螺旋式上升,每一次疊代都增強了AI的智能水平和應用能力(見圖2)。

以人為中心的知識創造循環和以AI為中心的知識創造循環并不是孤立的,它們相互交織、相互促進。人類的直覺、創造力和批判性思維可以指導AI的訓練和優化,AI的強大計算能力和模式識别能力又可以擴展人類的認知邊界和處理複雜問題的能力。這種雙向互動形成了一個雙環螺旋上升的結構,共同推動知識創造和知識應用(見圖3)。

40E35

智能工單審核系統開發中的知識共創

上海巡智科技有限公司(下文簡稱巡智科技)是一家為城市地下資産提供現場智慧管理解決方案的高新技術企業和專精特新企業,主要産品有AR智能管網管理系統、AI智能審核系統、小區泵房三維可視化、小區AR建設(地下管線+立體管線)等。其中,AR智能管網管理系統運用ARAI、雲計算等技術,以智能手機、平闆、AR眼鏡等為載體,實現了管網及其附屬設備閥門、水表、消火栓等的智能化、可視化、便利化管理。

下面以巡智科技智能工單審核系統在二次供水水箱清洗中的應用為例,分析其以團隊為單位應用單模态大模型進行知識共創的過程。

某市的水務公司将七萬多隻水箱池的清潔工作外包給第三方專業公司。水務公司采用一個水箱一張工單的作業質量監管制度,第三方專業公司的作業人員需要用手機拍攝清洗過程上傳系統,由水務公司員工進行人工審核銷單。由于上傳的照片多達百萬張,人工審核效率低,成本高。為此,水務公司委托巡智科技開發水箱清潔智能工單審核系統,以降低成本,提高工作效率。

巡智科技派出由1名産品工程師、1名測試工程師和3名開發工程師組成的5人團隊負責這個智能工單審核系統的開發。整個開發過程包括了解工作流程和落實審核指标,收集和準備數據集,選擇大模型并定義、訓練模型,評估模型性能,将模型應用于審核實踐。

了解工作流程和落實審核指标。項目組的工程師擅長AI技術但是不懂客戶的工作流程和工單審核标準,所以要花很多時間去熟悉、學習、挖掘和規範相關的工作流程和标準。例如,客戶的工作流程可能不是很完備,缺了某些環節或者不符合智能審核系統的要求,巡智的開發團隊就需要制定一個工作流程給清洗水箱池的工人,讓工人按照這個流程進行作業并拍照上傳圖片。又如,在落實審核指标時,項目組通過與客戶溝通發現有一個叫水質的指标,即衡量水的含氧量、總氯等是否合格,于是,項目組就要求提交的照片中包括能夠體現水質的相應信息。

收集和準備數據集。智能審核系統根據工單上提供的照片收集和準備數據集。如果提供的照片不符合要求,就難以收集數據,需要作業人員更新符合标準的照片。由于照片數量龐大,項目組在收集和準備數據庫這個環節花的時間是最多的。數據集的數據質量和數量決定着模型訓練效果。

選擇、定義和訓練模型。項目組選擇YoloV8模型作為預訓練大模型,這個模型采用卷積神經網絡(CNN)實現對圖像的分類和查重。工程師将數據集中99%的數據拿來做模型訓練,留下1%的數據用于測試。在模型訓練過程中,工程師要根據經驗判斷模型什麼時候會收斂,模型輸出的結果是好還是不好。考慮到模型訓練的時間,工程師輸入模型的數據是逐漸增加的,在訓練過程中要移出數據集中的髒數據。通過不斷增加數據集,在每一輪訓練後調整YoloV8中的超參數(包括學習率、網絡層數、激活函數、批處理大小、卷積核大小等),模型會不斷優化,最終适配項目的任務要求。這是一個人和AI頻繁溝通、不斷互動、共同促進知識更新和知識生成的過程。

評估模型性能和應用于實踐。項目組拿預留的測試數據來測試模型的有效性,當預測準确率達到95%時,就可以停止訓練模型,将模型交付給客戶使用了。在交付的時候,會将智能審核結果與人工審核結果進行比較,看哪一個準确率更高。當智能審核結果的準确率高于人工審核時,就可以由智能工單審核系統取代人工審核。

巡智科技以阿米巴的形式來管理項目組。組長由選舉産生,且均為年輕人。每個項目組需要全流程閉環完成承擔的任務,權利和責任前置,自我管理,有充分的自主權。項目組與客戶溝通需求後會在組内進行頭腦風暴,大家從各個角度思考可能的解決方案和難點。在頭腦風暴的過程中,項目組成員也會通過詢問chatGPT等大模型獲取所需的信息并形成問題解決思路(這裡有個體單模态知識創造、個體多模态知識創造)。在頭腦風暴後,項目組制定一個工作流程,然後按照這個流程推進工作。頭腦風暴是一個知識社會化、外顯化、組合化和内隐化的過程。

智能工單審核系統在某市水務公司二次供水水箱清洗中應用3年後,共審核43萬多份工單,處理了超過700萬圖片,其中超過110萬張圖片需查重,審核合格率從67.15%增至93.36%,重複率降至0.53%,有效達到了提升效率、降低成本的目标。

人和AI在知識共創中的合作方式和角色分配

基于大模型的人+AI知識共創大概有三種互動模式,每種模式都體現了人與AI之間不同的合作方式和角色分配。這三種互動模式分别是嵌入模式(Embedding Mode)、副駕駛模式(Copilot Mode)和智能體模式(Agent Mode)。

在嵌入模式下,人類專家定義整個任務的框架和目标,負責任務的主要部分,在特定環節會調用AI模型獲取建議或輔助決策。AI在這一過程中扮演輔助角色,提供必要的信息和選項,最終的決策權和任務的完成掌握在人類手中。這種模式強調人在任務執行中的中心地位,AI隻是一個增強人類能力的工具。

副駕駛模式下,人和AI是一種更為協作的夥伴關系。人類設定任務目标,與AI模型共同參與任務的執行。人類利用大模型的輸出,還通過訓練小型模型來優化和定制AI的輔助功能,使其更貼合特定任務的需求。在這種模式下,人與AI的關系更加平等,雙方共同推動任務向前發展,相互之間的協作和溝通更加頻繁。

智能體模式代表了一種高度自動化的合作方式。人類僅僅需要定義任務的最終目标和提供必要的資源,如數據集或計算資源,之後,AI模型将獨立負責任務的規劃、分解和執行。AI不僅執行任務,還自行判斷任務的完成情況和結束時機。這種模式下,AI擁有更大的自主權,人類轉變為監督者和策略提供者,負責監督AI的績效并确保任務目标的實現。

前述智能工單審核系統的開發,采用了嵌入副駕駛混合的模式。首先,項目組在項目開發的不同階段通過ChatGPT等大模型來獲取建議或輔助決策,采取的是嵌入模式。其次,項目組在開發計算機程序時使用Copilot輔助編碼,包括生成代碼、生成注釋、解釋代碼和優化代碼。最後,在智能工單審核系統開發完成并交付使用後,部分環節實現了智能化。例如,系統每天淩晨自動拉取前一天工單數據,使用多階段策略獲取數據,并存儲已完成工單信息,确保數據安全。又如,系統自動更新和對比描述信息,分段下載文件,确保可靠性。下載後,系統驗證、解包并保存數據,為後續處理提供基礎。審核結果加密發送至客戶服務器校驗。但是,目标設置、模型優化和确定工單審核任務是否應該結束等工作還是由人工來完成。因此,在智能工單審核這項任務上,采用的是副駕駛模式。

總的來講,人和AI在知識共創中是雙向哺育的:人推動AI演變,AI增進人類智慧。人類智慧推動人工智能持續進化,人工智能的發展又反過來激發和促進人類智慧提升,智慧生命與智能機器之間相互促進、共同成長。

結論

人和AI在知識創造過程中各有優勢和劣勢。相比人類,AI具有強大的學習能力和數據處理能力。例如,阿爾法圍棋(AlphaGo)大模型能夠打敗世界頂級的圍棋大師,一方面是因為學習了大量人類棋譜,包括頂級圍棋大師的對弈記錄,它還通過與自己對弈不斷改進和優化下棋策略。另一方面,阿爾法圍棋擁有強大的計算資源,包括高性能的GPUTPU集群,這使它能夠在短時間内進行大量的模拟和計算,快速評估和選擇最佳走法。AI在知識創造中的主要劣勢是創造力不足,在生成新穎和原創想法方面存在局限,通常依賴于已有的數據和算法。

人類擁有豐富的想象力和創造力,能夠提出新穎的想法和解決方案,這是基于算法的AI難以比拟的。人類在知識創造過程中常常會經曆頓悟的瞬間,OpenAIo1團隊成員将這種靈光一現的時刻稱為啊哈時刻。頓悟是一種在特定時刻發生的意外突破,那一刻,所有的迷霧似乎都一掃而空,一切都變得清晰明了,仿佛一道靈感的閃電劃破夜空。o1的團隊成員分享了他們靈感閃現的啊哈時刻。其中一個例子是,當一位成員觀察到通過強化學習訓練模型生成和優化思維鍊技術(CoT)後,其效果竟然超越了人類編寫的 CoT,他非常振奮,此時他意識到了強化學習時間(訓練時計算量)和推理時間(測試時計算量)對提高模型效率的重要性(新認知和新知識的産生)。另一位團隊成員驚訝地發現模型在數學測試中的得分突然有了顯著提高,進一步觀察後發現這是由于模型開始自我反思、質疑自己的答案了。他強烈地感受到團隊終于創造出了與衆不同的東西,那一瞬間,仿佛所有東西都彙聚到了一起,大模型驅動的知識組合化和知識内隐化在這個團隊成員的身上猛烈發生。這些啊哈時刻不僅是團隊成員個人學習成長的标志,也是整個 o1 項目向前邁進的重要裡程碑。

總的來講,人類與AI在知識創造中的優勢和劣勢,可以讓我們更好地理解兩者在知識創造中的互補性,從而能夠有效地結合人類的智慧與AI的能力來促進知識共創。

徐笑君:複旦大學管理學院副教授

責任編輯:劉永選

來源:《清華管理評論》202411月刊