新车测评网_网罗汽车评测资讯_汽车评测门户报道

首頁 > 汽車技巧 > 汽車技巧 > 微軟發布Phi-3 Mini:3.8B參數小到能塞進手機,性能媲美GPT-3.5

微軟發布Phi-3 Mini:3.8B參數小到能塞進手機,性能媲美GPT-3.5

發布時間:2024-04-24 22:46:37來源: 15210273549

 

編譯 | 長頸鹿
編輯 | 香草

智東西4月24日報道,4月23日,微軟在官網開源了小語言模型(SLM)——Phi-3-mini。這是微軟Phi-3系列模型推出的首個模型。

Phi-3-mini作為微軟Phi系列的第四代產品,以其38億參數和3.3T tokens的龐大訓練數據量,在語言、推理、編碼和數學基準測試中超越了眾多數百億參數規模的模型。

此外,Phi-3-mini有4k和128k tokens兩個上下文長度變體,經過預訓練和指令調整,可以更好地理解人類的語言、表達、邏輯并執行不同類型的指令。

與大語言模型相比,Phi-3-mini模型操作更為簡便。該模型的體積很小,這一特性使其可以在端側部署和運行。據稱,該模型可以作為聊天機器人離線訪問,且具有不亞于GPT-3.5的性能。

Phi-3-mini的成本大幅降低。微軟生成式AI研究副總裁塞巴斯蒂安·布貝克(Sébastien Bubeck)稱,相比于其他相似功能的模型,Phi-3-mini成本可能只有十分之一。

據微軟研究團隊稱,Phi-3-mini小體積、高性能的創新歸功于由合成數據組成的數據集。該數據集由大量已過濾的網絡數據和其他AI制作的兒童讀物中的合成數據組成。

微軟計劃在未來幾周內推出Phi-3系列的另外兩個模型,分別是Phi-3-small(7B)和Phi-3-medium(14B)。

目前有三個平臺可以獲取Phi-3-mini:

Microsoft Azure AI Studio:https://ai.azure.com/explore/models/Phi-3-mini-128k-instruct/version/2/registry/azureml

Hugging Face:https://huggingface.co/collections/microsoft/phi-3-6626e15e9585a200d2d761e3

Ollama:https://ollama.com/library/phi3

一、“小而美”的模型,Phi-3-mini優于兩倍其尺寸模型

據微軟官網稱,Phi-3模型是目前能力最強、性價比最高的小型語言模型(SLM),其在多種語言、推理、編碼和數學基準測試中均展現出超越同等規模甚至更大型模型的能力。

Phi-3-mini包含兩種上下文長度的規模,分別是4k和128k tokens,其中128k tokens的上下文窗口支持在同類模型是首次實現,且對模型質量的影響微乎其微。此外,該模型經過指令微調,能夠以自然語言方式響應和執行多種指令,確保了其即時可用性。

Phi-3模型在小尺寸上具有突破性的性能。根據微軟研發團隊的測試,Phi-3模型在基準測試中優于相同尺寸和更大尺寸的語言模型。其中,Phi-3-mini的性能優于其尺寸兩倍的模型,而Phi-3-small和Phi-3-medium的性能優于更大的模型,包括GPT-3.5 Turbo。

根據性能對照表,Phi-3-mini的兩個變體于基準測試的19個對比項中,有17項勝過Gemma-7b模型,18項勝過Mistral-7b模型,11項勝過Llama-3-8B模型。但也有11項次于GPT3.5-Turbo模型,17項次于Claude-3 Sonnet模型。

 

▲Phi-3系列基準測試對照表(圖源:微軟)

此外,微軟還在學術報告中稱Phi-3模型的整體性能可以與Mixtral 8x7B和GPT-3.5等模型相媲美。

Phi系列模型的起源于微軟研究部門,已經被廣泛使用,其中Phi-2下載量超過200萬次。從用于Python編碼的Phi-1開始,到增強推理和理解的Phi-1.5,再到27億參數的Phi-2,Phi系列在語言理解方面超越了其25倍參數大小的模型。

微軟計劃在未來幾周內推出Phi-3系列的另外兩個模型,分別是Phi-3-small(7B)和Phi-3-medium(14B),旨在為Azure AI和其他模型庫提供更靈活的選擇。

二、Phi-3遵循安全和高質,Phi-3-mini為多個平臺專門優化

Phi-3模型的設計遵循了微軟的“負責任AI標準”,包括問責制、透明度、公平性、可靠性與安全性、隱私與安全和包容性。Phi-3模型經歷了嚴格的安全度量和評估、紅隊測試、敏感用途審查,并遵循安全指南,以確保這些模型在開發、測試和部署過程中都符合微軟的標準和最佳實踐。

Phi-3模型在訓練過程中采用了高質量的數據,這是基于先前的Phi模型工作的延續。它們還通過了廣泛的安全后訓練,包括從人類反饋中進行的強化學習(RLHF)、在數十個傷害類別上進行的自動測試和手動紅隊測試。

此外,Phi-3-mini在Azure AI上配備了一套完整的部署、評估和微調工具鏈,并通過Ollama平臺使開發者能夠在本地筆記本電腦上運行。模型還針對ONNX Runtime進行了優化,支持Windows DirectML,并且實現了跨平臺支持,包括GPU、CPU和移動硬件。

同時,Phi-3-mini也作為英偉達推理微服務(NVIDIA NIM)提供,具備可廣泛部署的標準API接口,并對英偉達GPU進行了專門優化。

三、Phi-3提供離線推理場景,AI解決方案已落地印度

微軟公司通過提供Copilots幫助客戶用生成式AI進行業務轉型。他們認為,不同任務對質量成本曲線上不同規模模型的需求正日益增長。

小語言模型,如Phi-3,特別適用于以下情況:資源受限的環境,包括設備上和離線推理場景;延遲約束的場景,快速響應時間至關重要;以及成本受限的用例,特別是那些具有較簡單任務的用例。

由于尺寸較小,Phi-3模型可以在計算受限的推理環境中使用,特別是Phi-3-mini可以在端側使用。Phi-3模型的較小尺寸還使得微調或定制變得更加容易和更具成本效益。此外,較低的計算需求使其成本更低,延遲更好。較長的上下文窗口使其能夠處理和推理大量的文本內容,如文檔、網頁、代碼等。

微軟的一些客戶已經開始使用Phi-3構建解決方案。比如農業領域,Phi-3模型為農民提供了更便捷、更經濟的解決方案,并幫助他們在沒有穩定互聯網連接的情況下使用AI技術。

印度一家領先的商業集團ITC正在將Phi-3模型用于Krishi Mitra(一款面向農民的應用程序)內,幫助印度農民通過技術手段獲得更好的農業解決方案。據悉,該應用已經覆蓋了超過一百萬名農民。

結語:大小模型相輔相成,離線AI聊天已成現實

微軟的Phi-3模型設計的初衷旨在兼容多種設備。Phi-3與Stability AI的Zephyr、谷歌的Gemini Nano和Anthropic的Claude 3 Haiku等小型模型一樣,能夠在端側運行,而無需依賴互聯網連接。

盡管云端大模型在性能上全面超越小模型,但它們也存在一些局限性,包括較高的成本、運行速度以及對互聯網連接的依賴。相比之下,Phi-3允許用戶在沒有網絡的情況下與虛擬助手進行互動,能夠在不上傳數據的前提下實現內容總結,解決了AI領域的一部分弊端。

未來這類模型有望與智能手機集成,甚至可能內置于常用家電中,為用戶的生活提供個性化建議。我們期待AI變得越來越生活化,也期待小語言模型在未來的進步

汽車技巧更多>>

吉利銀河星耀8:以豪華平權,再創“爆款” 奇瑞混動技術大秀,沖擊1升油耗 上汽之夜:技術平權定義出行文明,中國方案重構全球汽車秩序 汽車智能化狂飆遭質疑,上汽要用更懂用戶的方式步入下半場 50萬買奧迪S5,修車比保養還勤,奧迪售后該醒醒了! 智能化內卷時代,英仕派的“恰到好處”才是真香 盤點:奇瑞汽車混動之夜上發布的新技術和新產品 奇瑞混動之夜:中國技術定義全球標準,開源計劃引領產業革命 現在“出海”,理想汽車能找到“理想”的海外市場嗎? 車展為何誕生于上海? Gartner預測:2025年電動汽車出貨量將增長 17% 奇瑞風云A9即將盲訂:超5米混動四驅中大型車 加拿大電動汽車退稅計劃提前終止,資金耗盡促車企自補 騰勢Z9GT第1萬輛正式交付:最快交付破萬的新能源豪華轎車 委員談AI+教育,“不怕學生用得多,怕他們不會用” 運動與生活早已密不可分,他是身體力行的“體育人” 春運開啟,昆明長水機場應對即將到來的出入境客流高峰 深圳二手房交易量重新站上6萬套關口,樓市新政后連現5個“日光盤” 點燃數字引擎,加大場景創新,蘇州工行打造數字人民幣生態體系新篇章 他從上海到西藏定日,希望一點點平息孩子們心中的“余震” 比亞迪唐L插混版的全新升級,如何重新定義家用SUV? 小米YU7純電SUV來襲,3040萬價位能否引領新潮流? 堅守駕駛樂趣 進階數字智能 寶馬集團以堅實市場表現邁向新世代 阿斯頓·馬丁Vantage Roadster來襲,6.8秒敞篷開合,性能與顏值并存! 換裝新發動機并增加ABS,新大洲本田NS125LA升級 多項功能升級 長安啟源E07迎1.1版本OTA升級 比亞迪夏入局MPV,GL8、塞納、夢想家等曾經的優勢車型該如何應對 敞篷開/關只要6.8s?兄弟們先看看!沒準今年就開上了! 2025年溫州市財稅會計學校招聘公告 2025年杭州市第三人民醫院招聘工作人員公告
主站蜘蛛池模板: 多米诺-多米诺世界纪录团队-多米诺世界-多米诺团队培训-多米诺公关活动-多米诺创意广告-多米诺大型表演-多米诺专业赛事 | 附着力促进剂-尼龙处理剂-PP处理剂-金属附着力处理剂-东莞市炅盛塑胶科技有限公司 | 灌装封尾机_胶水灌装机_软管灌装封尾机_无锡和博自动化机械制造有限公司 | 十二星座查询(性格特点分析、星座运势解读) - 玄米星座网 | 六维力传感器_三维力传感器_二维力传感器-南京神源生智能科技有限公司 | 众品家具网-家具品牌招商_家具代理加盟_家具门户的首选网络媒体。 | 气弹簧定制-气动杆-可控气弹簧-不锈钢阻尼器-工业气弹簧-可调节气弹簧厂家-常州巨腾气弹簧供应商 | 陕西安闸机-伸缩门-车牌识别-广告道闸——捷申达门业科技 | 深圳市八百通智能技术有限公司官方网站 | 天空彩票天下彩,天空彩天空彩票免费资料,天空彩票与你同行开奖,天下彩正版资料大全 | 步进驱动器「一体化」步进电机品牌厂家-一体式步进驱动 | 定制奶茶纸杯_定制豆浆杯_广东纸杯厂_[绿保佳]一家专业生产纸杯碗的厂家 | 耳模扫描仪-定制耳机设计软件-DLP打印机-asiga打印机-fitshape「飞特西普」 | 一氧化氮泄露报警器,二甲苯浓度超标报警器-郑州汇瑞埔电子技术有限公司 | pbt头梳丝_牙刷丝_尼龙毛刷丝_PP塑料纤维合成毛丝定制厂_广州明旺 | 板框压滤机-隔膜压滤机配件生产厂家-陕西华星佳洋装备制造有限公司 | 辐射仪|辐射检测仪|辐射巡测仪|个人剂量报警仪|表面污染检测仪|辐射报警仪|辐射防护网 | 证券新闻,热播美式保罗1984第二部_腾讯1080p-仁爱影院 | 土壤检测仪器_行星式球磨仪_土壤团粒分析仪厂家_山东莱恩德智能科技有限公司 | 安徽合肥项目申报咨询公司_安徽合肥高新企业项目申报_安徽省科技项目申报代理 | 菲希尔FISCHER测厚仪-铁素体检测仪-上海吉馨实业发展有限公司 | 隧道风机_DWEX边墙风机_SDS射流风机-绍兴市上虞科瑞风机有限公司 | 游泳池设计|设备|配件|药品|吸污机-东莞市太平洋康体设施有限公司 | 金环宇|金环宇电线|金环宇电缆|金环宇电线电缆|深圳市金环宇电线电缆有限公司|金环宇电缆集团 | 2025世界机器人大会_IC China_半导体展_集成电路博览会_智能制造展览网 | 云南丰泰挖掘机修理厂-挖掘机维修,翻新,再制造的大型企业-云南丰泰工程机械维修有限公司 | 水质监测站_水质在线分析仪_水质自动监测系统_多参数水质在线监测仪_水质传感器-山东万象环境科技有限公司 | 手持式线材张力计-套帽式风量罩-深圳市欧亚精密仪器有限公司 | 篷房|仓储篷房|铝合金篷房|体育篷房|篷房厂家-华烨建筑科技官网 知名电动蝶阀,电动球阀,气动蝶阀,气动球阀生产厂家|价格透明-【固菲阀门官网】 | 上海心叶港澳台联考一对一培训_上海心叶港澳台联考,港澳台联考一对一升学指导 | 升降机-高空作业车租赁-蜘蛛车-曲臂式伸缩臂剪叉式液压升降平台-脚手架-【普雷斯特公司厂家】 | 安徽集装箱厂-合肥国彩钢结构板房工程有限公司 | 顶呱呱交易平台-行业领先的公司资产交易服务平台 | 仓储笼_金属箱租赁_循环包装_铁网箱_蝴蝶笼租赁_酷龙仓储笼租赁 测试治具|过炉治具|过锡炉治具|工装夹具|测试夹具|允睿自动化设备 | 氟氨基酮、氯硝柳胺、2-氟苯甲酸、异香兰素-新晨化工 | 网络推广公司_网络营销方案策划_企业网络推广外包平台-上海澜推网络 | 国产液相色谱仪-超高效液相色谱仪厂家-上海伍丰科学仪器有限公司 | 安全阀_弹簧式安全阀_美标安全阀_工业冷冻安全阀厂家-中国·阿司米阀门有限公司 | 二手色谱仪器,十万分之一分析天平,蒸发光检测器,电位滴定仪-湖北捷岛科学仪器有限公司 | 政府园区专业委托招商平台_助力企业选址项目快速落地_东方龙商务集团 | 过跨车_过跨电瓶车_过跨转运车_横移电动平车_厂区转运车_无轨转运车 |