科技日報北京12月7日電 (記者張夢然)谷歌公司6日宣布推出一種名為Gemini的新人工智能模型,聲稱該模型在一系列智力測試中的表現(xiàn)優(yōu)于OpenAI的GPT-4模型和“專家級”人類。
Gemini已針對不同的應用創(chuàng)建了3個版本,分別是Nano、Pro和Ultra。谷歌拒絕回答有關Pro和Ultra的規(guī)模、它們包含的參數(shù)數(shù)量、訓練數(shù)據(jù)的規(guī)?;騺碓吹葐栴}。
其最小版本Nano旨在在智能手機上運行,實際上有兩種模型:一種用于速度較慢的手機,擁有18億個參數(shù);另一種用于功能更強大的手機,擁有32.5億個參數(shù)。
谷歌聲稱,Gemini的中檔Pro版本擊敗了其他一些模型,但更強大的Ultra超過了所有現(xiàn)有AI模型的能力。它在行業(yè)標準MMLU基準上的得分為90%,而“專家級”的人類預計能達到89.8%。
這是人工智能首次在測試中擊敗人類,也是現(xiàn)有模型中得分最高的。該測試涉及一系列棘手的問題,包括邏輯謬誤、日常道德問題、醫(yī)療問題、經(jīng)濟和地理。
在同一測試中,GPT-4的得分為87%,LLAMA-2的得分為68%,Anthropic Claude 2的得分為78.5%。Gemini在其他9項常見基準測試中的8項中擊敗了所有這些模型。
去年,谷歌“深度思維”發(fā)布的AlphaCode可擊敗50%的人類開發(fā)人員,而新發(fā)布的Gemini聲稱可擊敗85%的人類編程師。
谷歌“深度思維”的艾力·柯林斯表示,Gemini“幾乎在每個領域都是最先進的”。
【總編輯圈點】
Gemini目前沒有可供測試的版本,但谷歌卻演示了它兩種很“實際”的功能——解決家庭作業(yè)問題、處理實時視頻能力。這不禁讓“特定人群”驚呼:我現(xiàn)在就需要它!而對業(yè)內人士來說,這個AI更值得注意之處,是它不僅能力最強,還最通用,這意味著其可以適應各種任務。與當前許多專注于文本的模型不同,Gemini接受過文本、圖像和聲音方面的綜合訓練,能接受所有這些格式的輸入然后再輸出,甚至,它還比所有“前輩”模型們更擅長搞開發(fā)。
版權聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關法律責任。