美國斯坦福大學教授、美國國家工程院院士李飛飛(來源:斯坦福大學賬號)
北京時間5月10日凌晨舉行的Bloomberg Tech活動上,著名華人計算機科學家、美國斯坦福大學教授李飛飛(Fei-Fei Li)與彭博社Emily Change進行對話。
這場15分鐘對話中,李飛飛表示,所謂擔心人類被 AI 滅絕的風險被過度炒作,“這已經被夸大了”,所謂“滅絕性的危機”有點太過了。不過,她依然認為需要對 AI 模型進行限制,擔憂、評估和審查這些 AI 模型。
這是外界公布李飛飛創業之后的首次參加對話活動。
李飛飛是 AI 領域的先驅性人物,也是計算機領域的華人女科學家,目前還是斯坦福大學首位紅杉講席教授、美國國家工程院院士、美國國家醫學院院士、美國文理科學院院士、ImageNet的首席科學家和首席研究員、斯坦福以人為本人工智能研究院院長、AI4ALL聯合創始人。她的專業領域是計算機視覺和認知神經科學。
李飛飛一直被稱為“AI 教母”——源自與圖靈三大“AI 教父”一樣的稱號。她通過開發一種名為ImageNet的大規模圖像數據集在AI領域名聲大噪。該數據集幫助開創了新一代能可靠識別物體的計算機視覺技術,也是ChatGPT底層技術之一。
2016年11月,李飛飛加入谷歌,擔任谷歌云AI/ML首席科學家。2018年9月,返回斯坦福任教,現為谷歌云AI/ML顧問。10月20日斯坦福大學以人為中心的AI計劃開啟,李飛飛擔任聯合負責人。
此前報道稱,她創立了一家“空間智能”企業,并完成了種子輪融資。投資方包括硅谷風險投資公司 Andreessen Horowitz(a16z)、加拿大基金Radical Ventures等。但在對話中拒絕談論此事。
李飛飛強調,她看到越來越多的女性,和多樣化背景的人進入科技和人工智能領域,多樣化背景人員將有可能成為杰出的思想家、創新者、技術人員和教育家,發明家,科學家。因此她完全接受“AI 教母”這個稱號。
以下是李飛飛對話全文:
歡迎李飛飛博士登臺,她是斯坦福大學計算機科學 Sequoia 教授,人工智能中心聯合主任。
Emily Chang: 李博士被譽為人工智能的教母。你對這個稱號有何感想?這是我要提的第一個問題。
李飛飛:Emily,我自己從未自稱為任何事情的教母,但當我被授予這個頭銜時,我確實停下來思考了一下,我想,如果男性可以被稱為某事的教父,那么女性也可以,所以我完全接受這個稱號。
Emily Chang: 百分之百。
Emily Chang: 你是我們這個時代最有影響力的計算機科學家之一。你撰寫了大量的學術論文。你是 ImageNet 的創造者,這個包含大量圖片及其描述的數據庫為現代 AI 奠定了基礎。你有想象過它的影響力會有多大嗎?
李飛飛:ImageNet 于 2007 年被設想出來,它可能是 AI 算法中大數據的關鍵轉折點。從科學的角度看,我堅信大數據會從根本上改變我們進行 AI 研究的方式,但我從未想到大數據、神經網絡和 GPU 的融合會催生出現代 AI,我也從未預想到從那時起的進步速度。
Emily Chang: 你經常和那些正在決定這項技術未來的人們在同一房間里,比如拜登總統,Sam Altman,Sundar Pichai,Satya Nadella。你在國會作證,你參與了各種工作小組。你對那些有權力的人,他們應該如何使用這種權力,有什么主要的建議嗎?
李飛飛:Emily,很好的問題。實際上,無論我是在 K-12 夏令營,還是在斯坦福大學的 AI 導論課程中,我的信息都是一樣的,那就是要認識到這項技術,它是什么,以及如何負責任和審慎地使用它。理解并接納它,因為它是一種橫跨各個領域的技術,正在改變我們的文明,推動商品流通,科學發現的快速進展,尋找治療癌癥的方法,繪制生物多樣性地圖,和我們一起發現新材料。但同時,也要認識到所有可能產生的后果,包括可能的非預期后果,以及如何負責任地開發和部署它。我認為,在現今的對話中,保持平衡,理性深思的聲音非常重要。無論是在白宮還是學校。
Emily Chang: 現在,我不知道你會否稱這為一場危機或一個轉折點,但 AI 模型的訓練數據正在耗盡,然后有些公司開始轉向使用 AI 生成的數據和合成數據來訓練他們的模型。這個問題有多嚴重?有哪些風險?下一步該怎么做?
李飛飛:首先,我認為 AI 模型的訓練數據正在耗盡是一種非常狹隘的觀點。我知道你在暗指那些消耗大量互聯網數據的大語言模型,特別是那些來自網站、Reddit、維基百科等你能獲取的數據。即使在談論語言模型,我們也不應局限于此。我認為還有很多可以探索的。
我們看到,不同的數據可以用來構建定制化的模型,無論是用于新聞業還是在諸如醫療保健等不同的行業領域。其實我們并沒有耗盡數據。實際上,還有很多有許多行業還未進入數字化時代。我們并未充分利用數據,不論是在醫療、環保還是教育等領域。因此,即使在語言模型這個領域,我不認為我們的數據已經用盡。
Emily Chang: 您認為現在使用 AI 生成的數據來訓練模型是好事,還是這可能會讓我們逐漸遠離原始數據,以一種可能危險的方式進行?
李飛飛:這是個需要更深入探討的問題。這是個好問題。AI 有很多生成數據的方法。比如在我的斯坦福實驗室,我們做了很多機器人研究,對吧?機器人學習。在這里,模擬數據非常重要,因為我們根本沒有足夠的資源或機會去收集由人類產生的動作等等。模擬真的非常重要。這會讓我們走向危險的道路嗎?
我認為,即使是使用人類生成的數據,也可能讓我們走向危險的道路。同樣,如果我們對模擬數據的處理不負責任,或者沒有進行深思熟慮,那么當然可能會使我們走向危險的道路。我的意思是,我甚至不需要特意指出。你知道有哪些是人類生成的不良數據,對嗎?就像整個暗網那樣。所以問題不在于模擬本身,問題在于數據。
Emily Chang: 你正在涉足熱門且競爭激烈的 AI 創業領域。你正在啟動一些項目,能透露一些信息嗎?
李飛飛:不能。
Emily Chang: 好的。那就期待后續吧。我們就 AI 時代的信任度進行了一項調查。可以公布那項調查的結果嗎?問題是,你對科技公司能否安全開發 AI 有多大的信任?我完全信任他們,0%。我持懷疑態度,所有人。一點也不信任。