• 部落格
  • 關於我們
  • 加入我們
  • 產品資訊

新聞專題:OpenAI 最新產品更新

fiisual

2025/1/10

本文主要分享ChatGPT在去年12月發布的新功能,內文中分為5大面向來進行整理與討論。新模型與方案的發布:推出全新o1-Previous 版本,提供更高的計算及處理問題的能力;開發者優化:透過與學界與專家合作的方式提高模型在特定領域上的分析能力;創新與功能提升:Sora指令式生產影片 & Canvas 一頁式整合聊天與生成內容區;ChatGPT 功能新增:提升網頁搜尋能力, 透過電話方式聯繫AI, 專案管理能力;與蘋果的合作:與siri合作的apple intelligence;更多其他功能:原生應用程式及語音模式等。OpenAI在此次的推出後展現了AI更多的能力,未來需要更加思考如何在維持公司營利與人類技術革新的平衡。

ChatGPT 於去年 12月4日 驚喜宣布 OpenAI 將從 5 號開始,計畫連續 12 天向大眾發布、演示OpenAI 即將推出的新功能。消息一出引發大眾關注,尤以先前市場上所傳出之 o1 新模型的正式推出最令人引頸期盼。由於發布產品與功能眾多,我們將分為以下 5 大方向進行整理與論述。

Open AI 新功能5大面向介紹。

新模型與方案的發布

5 日,OpenAI 驚喜釋出 o1 模型正式版本,以取代先前於 9 月推出 o1-Previous。大眾平常運用的GPT-4 系列著重於文字理解與生成,o1 則在此基礎上,進一步強調圖像的分析處理及推理能力的優化。根據內部測試結果,o1 相較於預覽版減少了 34% 的重大錯誤,整體運行速度也加快了 50% 左右,展現其優越性能。此外,OpenAI 也順勢推出 o1 Pro,為 o1 的進階版本,得以提供更高的計算能力,處理專業領域及深度學習模型之中複雜的問題。

同時,OpenAI 新增了 ChatGPT Pro,為全新的訂閱方式。過往用戶僅有免費以及 Plus 兩方案可以選擇,Pro 方案之下,用戶每月只需支付 200 美元,便可無限制的存取及使用旗下 o1、GPT-4o、進階語音功能等,以及目前最聰明的模型-o1 Pro,獲取各領域中更精確、可靠的回應。此方案主要針對 ChatGPT 的重度使用者,特別是學術研究者、程式開發人員等,滿足他們對於 AI 的高度需求,OpenAI 也表示將持續優化 Pro 方案的功能。

開發者優化

OpenAI 開始實施模型的「強化微調研究計畫」其正在徵集開發人員和機器學習工程師等,訓練客製化的專業模型。簡單而言,就是期望透過學界、業界專家精準的使用回饋,增強模型於特定領域的推理能力,提高於該領域分析的正確性與應用深度。這樣的計畫可以加速專業模型深入產業應用,針對像是金融保險、法律、工程等產業,OpenAI 表示已有一定程度的發展,將協助提高研發、分析方面的價值。

除了上述提到的模型客製化,OpenAI 也優化了開發者端的工具,包括:

  • OpenAI o1 推理技術加入API支援,用於簡化客戶服務、供應鏈決策、預測財務趨勢等。目標使用者為使用層級 5、熟悉深度應用技術的開發者,本次新增包括函數呼叫、結構化輸出等功能。
  • 即時 API 的改進創造了低延遲、自然的對話體驗,同時整合 WebRTC 技術並降低價格。
  • 偏好微調得以針對用戶及開發人員的偏好,調整模型資料輸出入的方式,提高靈活性。
  • 除了現有的 Python、Node.js 等,新增 Go 與 Java SDK 開發工具包,擴大 API 的開發範圍。

創新與功能提升

Sora

本次發佈的其中一大亮點為 Sora,其能自動分析用戶指令,產出符合使用者需求的影片,目前僅提供 ChatGPT Plus 以及 Pro 會員使用。OpenAI 於本次正式發佈了 Sora 並展示其功能,除了本次的最大創新-允許用戶輸入場景敘述,由AI創造影片(Prompt)外,其餘編輯功能包含:影片混合(Remix)、重新剪輯(Re-cut)、無縫循環(Loop)、融合(Blend)、故事版(Storyboard)等,大多僅需由用戶下達文字指令即可達成,使影片編輯的功能更加平易近人。

Sora 之所以眾所矚目,是其具突破性的將生成式 AI 技術延伸到影音,同時推動生成式 AI 朝向通用人工智慧(Artificial General Intelligence, AGI)邁進,未來可能影響剪輯軟體,甚至是剪輯師、動畫師等的職業需求。不過,外界普遍的擔憂為隱私性、肖像權及版權方面的問題。OpenAI 於報告中表示其訓練管道多元,同時也與專家合作,避免成為有心人士創造違法影片的管道。然而,先前OpenAI 曾因使用未經授權的文字作品訓練 ChatGPT 而遭《紐約時報》起訴,本次針對 Sora 的訓練技術來源,OpenAI 也未揭露使用內容。在外界對於隱私性擔憂存在的情形下,距離深入產業與大眾應用可能仍需一段時間。

Canvas

ChatGPT 編輯器 Canvas 新功能示意圖。

第四天,OpenAI 發佈了近似於編輯器的 Canvas 功能,並開放給所有用戶。過往,不論是在撰寫文章或編輯 Python 程式時,用戶往往需針對不同動作與 ChatGPT 進行來回問答,並於另一編輯頁面將所得資訊逐次拼貼、排序成完整文章或編碼。在 Canvas 頁面中,左側為 ChatGPT 聊天界面,右邊結果生成區,使用者可於左側界面輸入指令,ChatGPT 便會依照要求於右側生成結果。此功能不僅省去了用戶整理資訊的時間,ChatGPT 更是可以針對上下文產出更精確的結果。

除此之外,ChatGPT 還可以依照用戶需求對結果進行最後潤飾,並針對幼兒園到研究生等不同程度的讀者進行用字與編排上的調整。不過,目前市場上的文字專業編輯軟體如:notion,已推出內嵌式的 AI,提供用戶編輯上的輔助;主打編程專用的 AI 軟體 Cursor,由於擁有完整程式庫的上下文,在表現上效率更高。Canvas 相對而言仍在初期發展階段,具體應用上的競爭力仍需進一步提升。

ChatGPT功能新增

1. 搜尋功能

本次的一大亮點為 OpenAI 於 ChatGPT 之下新增了搜尋功能,其不僅可以在 ChatGPT 網頁上進行搜索,更大的亮點為用戶可以下載 Chrome 擴充功能,直接透過瀏覽器網址列進行搜尋。OpenAI 積極與各大新聞和數據提供者合作,直奔消息來源的策略也強化了整體資訊的可信度。此功能的推出,首當其衝的衝擊對象為目前擁有全球超越九成市佔的搜尋引擎巨頭 Google,因其更直覺的搜尋方式有望改變整體網路搜尋的運作。目前 Google 的超過 50% 的收益來源為龐大人流之下帶來的廣告收益,使用者未來可能的偏好轉變將撼動 Google 業務上的壟斷地位。

2. 1-800 ChatGPT熱線

ChatGPT的美國用戶可以撥通1-800熱線(1-800-242-8478),全球用戶則可透過 WhatsApp 發送訊息與 ChatGPT 的 AI 助理取得聯繫。此功能的一大亮點為其超越了網路的限制,即使在網路訊號不佳的情況下,也可以得到 AI 即時的幫助。不過,目前大眾上對於該功能的安全性表示懷疑,因 Google 曾於 2007 年推出 Google-411 語音辨識服務,當時的 Google 副總裁 Marissa Mayer 就曾直接表明服務的推出是為了採集樣本,以提高語音輸出的準確性。雖然 OpenAI 保證不會利用大眾與 AI 的通話進行大型語言訓練,卻難消市場的擔憂。此外,基於安全考量,通話的內容均有可能被審查,強化了整體隱私性的疑慮。

3. 專案管理功能

OpenAI 為 ChatGPT 新增了專案功能,用戶可以依特定主題為對話建立有組織的資料夾,同時上傳相關文件,創造自訂的 AI 資料庫,ChatGPT 即可從海量資料中抓出關鍵論點進行分析。此功能旨在強化使用者與 ChatGPT 對話中上下文的連貫邏輯,方便使用者進行主題性的研究。本功能與 Google 所推出之 Notebook LM 相似,均擁有 AI 輔助思考以及檔案上傳等功能。兩者皆處於起步階段,目前功能應用上看來也各有優缺,競爭的關鍵將會落在邏輯推理的能力上。

與蘋果的合作

ChatGPT 與蘋果合作示意圖。

9日,OpenAI 展示了 Apple Intelligence 將如何應用 ChatGPT,成為橫跨 iOS、MacOS 系統的智能助手。其與先前蘋果於秋季發佈會中展示的功能相似,主要亮點為 siri 的應用廣度、深度提升。相比於 ChatGPT 以文字輸入,蘋果用戶可維持過往使用 siri 的習慣,透過語音提供指令,再傳輸給ChatGPT 進行分析並反應,由 siri 協助在手機上完成。應用情境如:當朋友與用戶以訊息分享某位歌手發行的新專輯消息時,用戶只需一聲令下「播放」,ChatGPT 便能分析現在情境而開啟音樂軟體播放該專輯。互動性拉高的同時,資訊的揭露與指令的實踐也更加快速直覺。另一亮點為視覺化的應用,ChatGPT 可以透過相機,針對鏡頭所見提供用戶資訊,應用具象化下也提高了先前蘋果於iPhone16之「相機快捷鍵」亮點。

11 日,蘋果順勢推出 iOS 18.2,以支援 OpenAI 提供的新功能。先前,大眾對於 Apple Intelligence的具體應用前景持保留態度,甚至於 Q3 財報推出後引發投資人疑慮。本次功能的正式推出,對於蘋果而言無疑是給予市場一顆定心丸,也令大眾開始期待後續應用上的優化。然而,儘管這些功能提高蘋果用戶的便利性,但在即時且深入剖析用戶使用習慣、模式的過程中,卻帶來一定隱私性上的顧慮。尤其蘋果是相當強調資安的品牌,與 ChatGPT 的合作或許會降低部分用戶對於隱私保護的信心。

更多其他功能

第十一天,OpenAI 推出了適用於 MacOS 與 Windows 上的原生桌面應用程式,同時新增語音模式,簡化用戶輸入指令的流程與障礙。OpenAI 也擴大了第三方應用程式的整合,包含多個終端、文字編輯 App 以及整合式開發環境(IDE)ChatGPT將超越問與答,如同秘書、助理般與用戶一同協作,並提供主動、即時的使用支持。受益最大的為開發者,因其能與編程環境融合,根據要求及上下文撰寫代碼、進行錯誤排查等,顯著提高編寫效率。

除了上述提到的功能之外,本次發布中 OpenAI 也推出 Santa Mode 限定功能,用戶可以於聖誕節期間在 ChatGPT 上與聖誕老人聊天。OpenAI 亦於最後一天宣示將持續與法律學界專家合作,旨在強化對於用戶指令與文字輸入的識別推理,以防遭到惡意人士濫用,提高整體安全性。

總結

綜合上述,將新增之ChatGPT模型與應用,對應方案整理如下:

模型/應用FreePlusProTeam
GPT-4oV(有限)V(有更大額度)VV(有更大額度)
o1-miniV(有限)VV(有限)
o1V(有限)VV(有限)
o1 ProV
SoraV(有限)V
CanvasVVVV
搜尋功能VVVV
專案管理功能VVV

OpenAI 此次新品的推出,再次顛覆大家對於 AI 的應用想像,也顯示出 OpenAI 不僅希望 AI 能協助解決民眾生活、工作之中遇到的問題,更期望AI能朝向具備有獨立思辨能力的助理演進,與人類交換意見、相互學習。

目前,AI 平均智商正逐漸逼近人類(人類智商約落在90到110之間)未來 AI 的加速革新,將重塑人類獲取資訊的模式,聰明的 AI 甚至可能大幅取代部分產業勞力需求。此外,若需獲得 AI 更多幫助,大眾必須向 AI 揭露更多個人資訊,隱私風險加大。長遠而言,不僅會引發道德法律層面等社會問題,更擔心人類會被 AI 反噬。

如同外界猜測般,OpenAI 27 日透過官方部落格中宣布,預計於 2025 年將原先營利化的部門轉型為德拉瓦州公益公司(Delaware Public benefit Corporation)以公司使命以及股東利益作為優先目標,同時維繫非營利部門的發展。OpenAI 原先為創造廣泛受益且安全的 AGI 所設,選擇採用非營利的特殊方式經營即是為了確保人工智慧於適當的範圍內開發。有了財務面的支撐,OpenAI 得以擁有更多資金投入研究,相反地也有了利益誘因。因此,在轉型為營利事業後,該如何維持公司營利與人類技術革新的平衡,將會是 OpenAI 最大的難題,也是政府、大眾需持續關注的方向。

如果你想認識更多OpenAI ,也可以參考這篇噢! 新聞專題:OpenAI 營利化轉型

Blog Post Ad

其他標籤