新推出的 Granite 3.0 8B 和 2B 模型,在寬松的 Apache 2.0 許可證下發佈,在許多學術和企業基準測試中表現出強大的性能,能夠超越或匹敵類似規模的模型。 新推出的 Granite Guardian 3.0 模型提供了 IBM 最全面的護欄功能,以推進安全且值得信賴的人工智能。 新推出的 Granite 3.0 專家混合模型(Mixture-of-Experts models)可實現極其高效的推理和低延遲,適用於基於 CPU 的部署和邊緣計算。 全新的 Granite 時間序列模型在零樣本/少樣本預測中實現了最先進的性能,超越了大10倍的模型。 IBM 推出了下一代基於 Granite 的 watsonx Code Assistant,適用於通用編碼;在 watsonx.ai 中首次推出用於構建和部署 AI 應用程序和智能體(Agents)的新工具。 宣佈 Granite 將成為 Consulting Advantage 的默認模型,這是一個由 AI 驅動的交付平台,IBM 的 160,000 名顧問使用該平台,可以更快地為客戶提供新解決方案。 香港2024年10月22日 /美通社/ — 在美國時間10月21日舉行的IBM(紐約證券交易所代碼:IBM)年度TechXchange大會上,IBM宣佈推出其迄今為止最先進的AI模型家族——Granite 3.0。IBM的第三代Granite旗艦語言模型在許多學術和行業基準測試中均能超越或匹敵同類領先模型提供商的模型,展示出強大的性能、透明性和安全性。 IBM 推出 Granite 3.0:專為企業打造的高性能AI模型 與公司對開源 AI 的承諾一致,Granite 模型在寬松的 Apache 2.0 許可證下發佈,它們憑借在性能、靈活性和自主性方面的獨特組合能夠為企業客戶和整個社區提供服務。 IBM的Granite 3.0家族系列包括: 通用/語言模型:Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base 護欄與安全模型:Granite Guardian 3.0 8B, Granite Guardian 3.0 2B 專家混合模型:Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base 新款 Granite 3.0 8B 和 2B 語言模型被設計為企業級AI的”主力”模型,能夠在檢索增強生成(RAG)、分類、摘要、實體提取和工具使用等任務中提供強大的性能。這些緊湊的多功能模型旨在根據企業數據進行微調,並在各種業務環境或工作流程中無縫集成。 許多大型語言模型(LLM)是基於公開可用的數據進行訓練的,絕大多數企業數據仍然未被利用。通過將小型 Granite 模型與企業數據相結合,特別是使用 IBM 和 RedHat 在五月推出的革命性對齊技術 InstructLab, IBM 相信企業可以實現與大型模型相媲美的特定任務性能,而成本只是其中的一小部分(基於在幾個早期概念驗證中觀察到的成本比大型前沿模型低 3 到 23 倍的範圍[i] )。 Granite 3.0 版本的發佈重申了 IBM 對建立 AI 產品透明度、安全性和信任的承諾。Granite 3.0 技術報告和負責任使用指南提供了用於訓練這些模型的數據集描述,詳細說明瞭所應用的過濾、清洗和處理步驟,並全面展示了模型在主要學術和企業基準測試中的性能結果。 至關重要的是,IBM 為 watsonx.ai 上的所有 Granite 模型提供知識產權賠償,旨在增強企業客戶將企業數據融入模型的信心。 提高標準:Granite 3.0 基準測試 Granite 3.0 語言模型在原始性能上也展示出良好的結果。 在 Hugging Face 的 OpenLLM 排行榜定義的標準學術基準測試中,Granite 3.0 8B Instruct 模型的整體性能平均領先於 Meta 和 Mistral 中類似大小的開源模型的最先進性能。在 IBM 的先進 AttaQ 安全基準測試中,Granite 3.0 8B Instruct 模型在所有測量的安全維度上均領先於 Meta 和 Mistral 的模型[ii] 。 在檢索增強生成(RAG)、工具使用和網絡安全領域的核心企業任務中,Granite 3.0 8B Instruct 模型的平均表現優於Mistral 和 Meta 中類似規模的開源模型 [iii]。 Granite 3.0 模型是在超過 12 萬億個標記上進行訓練的,這些數據來自 12 種不同的自然語言和 116 種不同的編程語言,採用了一種新穎的兩階段訓練方法,利用了數千個旨在優化數據質量、數據選擇和訓練參數的實驗結果。到今年年底,預計 3.0 8B 和 2B 語言模型將支持擴展的 128K 上下文窗口和多模態文檔理解能力。 IBM 展示了性能和推理成本的完美平衡,提供了其 Granite 專家混合(MoE)機構模型,Granite 3.0 1B-A400M 和 Granite 3.0 3B-A800M,這些較小且輕量級的模型可用於低延遲應用程序以及基於 CPU 的部署。 IBM 還宣佈了其預訓練 Granite 時間序列模型的更新版本,早期版本於今年早些時候發佈。這些新模型在 3 倍的數據上進行訓練,在所有三個主要時間序列基準測試中表現出色,超越了來自 Google、Alibaba 等公司 10 倍更大模型的性能。更新後的模型還提供了更大的建模靈活性,支持外部變量和滾動預測[iv] 。 Granite Guardian 3.0:開啓負責任AI的新時代 作為此次發佈的一部分,IBM 還推出了一個新的 Granite Guardian 模型系列,允許應用程序開發人員通過檢查用戶提示和 LLM 響應來實施安全護欄,以發現各種風險。Granite Guardian 3.0、8B 和 2B 型號提供了當今市場上最全面的風險和危害檢測功能。 除了社會偏見、仇恨、毒性、褻瀆、暴力、越獄等危害維度外,這些模型還提供了一系列獨特的檢索增強生成(RAG)特定檢查,如基於事實性、上下文相關性和答案相關性。在針對 19 項安全性和 RAG 基準的廣泛測試中,Granite Guardian 3.0 8B 模型在危害檢測方面的整體準確性平均高於 Meta 的所有三代 Llama Guard 模型。它在幻覺檢測方面的整體性能也與專門的幻覺檢測模型 WeCheck 和 MiniCheck 相當 [v]。 …
了解詳情