圖:楊紅霞相信,AI在未來會改變各行各業(yè),她希望有更多的人才參與,推動AI行業(yè)走向新階段。\大公報記者麥潤田攝
編者按
特區(qū)政府近年大力推行「搶人才」政策,打造國際高端人才集聚高地,發(fā)展新質生產力。人工智能作為一個新質生產力行業(yè),其發(fā)展離不開人才的支撐。如今,國家的AI人才數(shù)量已領先世界,根據(jù)近期發(fā)布的《全球高層次科技人才態(tài)勢報告》,近五年中國高層次科技人才數(shù)量快速增長,從2020年的18805人增至2024年的32511人,佔比從16.9%躍升至27.9%,躍居全球首位。美國智庫研究指出,中國高校培養(yǎng)了全球近一半的頂尖AI研究人員,成為AI人才的最大出產國。
香港高校亦不甘人後,憑藉優(yōu)質教育資源、「背靠祖國、面向世界」等優(yōu)勢,於近兩年網羅不少海內外的AI人才,共同建設香港的AI行業(yè)。他們當中不乏有「通義千問」AI前身─M6大模型的負責人、與Open AI團隊合作過的微軟公司首席研究員等。
《大公報》於今日起推出《AI港人才》系列,特邀本港學界的AI專家,介紹其AI的前沿研究、展望香港AI的未來路向。相信這一場城市與人才的雙向奔赴,將助力香港以嶄新姿態(tài),在全球AI浪潮中錨定新坐標。
「目前的生成式AI,在大眾領域方面表現(xiàn)得很好,但到一些醫(yī)療、製藥等高精尖領域,就容易出現(xiàn)AI幻覺,原因是AI在學習時並沒有相關的數(shù)據(jù)可參考?!乖谏墒饺斯ぶ悄芾顺敝校愀劾砉ご髮W電子計算學系楊紅霞教授正以獨特的視角和嶄新的技術路線推動AI的未來發(fā)展。
楊紅霞現(xiàn)在所負責的CO-GEN AI(Collaborative Generated AI)項目,正是希望在預訓練階段,邀請各領域專家加入,完善AI的數(shù)據(jù)庫。這不僅挑戰(zhàn)了傳統(tǒng)中心化AI的局限,更為高精尖領域的突破提供了全新可能。
「我相信AI在未來有可能會改變各行各業(yè),所以我們應積極地擁抱它,讓各行業(yè)的專家都可以往裏面貢獻一分力量?!箺罴t霞強調,所有人都需要做好準備,迎接AI時代。\大公報記者 湯嘉平
去年入職理大的楊紅霞教授,曾榮獲沃森研究中心首席科學家、雅虎首席科學家;2016年回國後加入阿里巴巴集團,擔任阿里巴巴達摩院人工智能科學家兼總監(jiān),成為「通義千問」前身─M6大模型項目的帶頭人,亦在之後擔任浙江大學上海高等研究院兼任教授、美國字節(jié)跳動大語言模型負責人。有豐富「大廠」工作經驗的她,卻在此時選擇來港發(fā)展,她將會給香港的AI行業(yè),帶來什麼樣的成績呢?
算力消耗更少 硬件兼容更大
楊教授熟練地打開電腦給記者看,裏面是關於CO-GEN AI項目的介紹,這也是她加入理大後,主力負責的項目之一。說到這個新的項目,楊教授表示,它將是一個去中心化的AI,相比現(xiàn)時中心化的AI,它消耗的算力更少、在硬件系統(tǒng)方面會更為兼容,以及在專業(yè)領域表現(xiàn)得更專業(yè),減少輸出錯誤答案的可能性。
「AI大模型的產生,主要經過兩個階段,一個是training stage(預訓練階段),另一個是alignment stage(對齊階段)?!箚柤爸行幕腿ブ行幕木唧w區(qū)別與概念,楊紅霞科普道,預訓練是AI大模型建設的核心階段,該階段將產出基礎模型。惟該階段最消耗算力,且跑算力的時間長、試錯的機會少,故為保證流程順暢,接觸該階段的各大廠核心團隊人數(shù)也不會多?!覆还苁前⒗镂辉M,還是Google、Meta、OpenAI,他們的(預訓練)團隊也只有二三十人,而這二三十人就是關鍵?!?/p>
因此,這個階段,是需要把所有數(shù)據(jù)和GPU資源放在同一個地方,去解決問題,這就是目前所有生成式AI,包括ChatGPT、DeepSeek的運作方式。然而,楊紅霞表示,中心化AI的局限性在於,暫時做不到讓公眾參與進來,無法給AI投餵前沿的、網絡中都難覓的專業(yè)知識?!脯F(xiàn)在預訓練階段是電腦專家去做的,但作為電腦專家,他只懂電腦,並不懂醫(yī)療、教育等很專業(yè)的領域。而AI需要新的數(shù)據(jù),不然它只能學習現(xiàn)有的數(shù)據(jù),它無法自己去創(chuàng)造新的知識點?!?/p>
楊紅霞目前的工作,就是致力打破這種局限。「我們現(xiàn)在就在做兩件事。」楊紅霞表示,第一件事是對AI大模型進行持續(xù)地預訓練,讓各領域專家把專業(yè)知識注入到模型中,進而得到各領域的大模型。
項目已與多所醫(yī)院展開合作
在這件事上,楊紅霞表示,理工大學內部已經有十個領域在接觸該項目,即:城市能源、商業(yè)轉化、智能製造機器人、智能臨床推理、電網現(xiàn)代化、材料智能製造、教育、建築工程與管理、類腦計算。同時,該項目亦與中國科學院杭州醫(yī)學所、浙江省腫瘤醫(yī)院、北京協(xié)和醫(yī)院展開合作。
在得到各專業(yè)領域的大模型後,AI只需要直接學習這些大模型即可,不用再像中心化AI一樣,去學習最原始的數(shù)據(jù),這便是去中心化的AI,也就是楊紅霞教授現(xiàn)在負責的CO-GEN AI。「打個比方,傳統(tǒng)的中心化AI,就像是一個人包攬所有的家務來做;那CO-GEN AI就像是一家人分工合作,媽媽掃地、爸爸做飯、孩子整理書桌,最後一齊享受乾淨的房間和熱乎的飯菜?!?/p>
問及CO-GEN AI的落地計劃,楊教授就表示,希望在未來一到三年,上述提到的十個參與領域都有非常突破性、革命性的進展。
「我覺得生成式人工智能還真的只是剛剛開始,它是一個偉大的技術,但它一定得有一個巨大的產業(yè)去依託它,才能把它托起來?!箺罴t霞相信,AI在未來會改變各行各業(yè),在這個歷史性與革命性的時代浪潮中,她希望能有更多的人才參與進來,推動AI行業(yè)走向新階段。