如果您需要從銀行倒閉消息中解脫出來,這裡有一些令人耳目一新的東西。 OpenAI的 GPT-4 昨天被釋放。 新型號是繼 GPT-3.5-渦輪 並承諾產生“更安全”和“更有用”的反應。 但這到底是什麼意思呢? 這兩種模型如何比較?
我們分解了關於 GPT-4 的六件事。
處理圖像和文本輸入
GPT-4 接受圖像作為輸入,並可以分析圖像和文本的內容。 例如,用戶可以上傳一組食材的圖片,並詢問模特他們可以使用圖片中的食材製作什麼食譜。 此外,視障用戶可以截取一個雜亂無章的網站,並要求 GPT-4 對文本進行解密和總結。 然而,與 DALL-E 2 不同,GPT-4 無法生成圖像。
對於銀行和金融科技公司而言,GPT-4 的圖像處理可能有助於幫助在入職過程中遇到困難的客戶。 該機器人可以幫助破譯用戶體驗的屏幕截圖,並為困惑的客戶提供演練。
不太可能響應不適當的請求
根據 OpenAI 的說法,GPT-4 響應不允許的內容的可能性比 GPT-3.5 低 82%。 它產生事實響應的可能性也比 GPT-3.5 高 40%。
對於金融服務行業,這意味著使用 GPT-4 為聊天機器人提供動力比以前風險更小。 新模型不易受到道德和安全風險的影響。
每個查詢處理大約 25,000 個單詞
OpenAI 不以字數或字符數來衡量其輸入和輸出。 相反,它根據稱為 代幣. 雖然單詞與標記的比率並不簡單,但 OpenAI 估計 GPT-4 每個查詢可以處理大約 25,000 個單詞,而 GPT-3.5-turbo 的每個查詢可以處理 3,000 個單詞。
這種增加使用戶能夠進行擴展對話、創建長格式內容、搜索文本和分析文檔。 對於銀行和金融科技公司而言,增加的字符數限制在搜索和分析用於承保目的的文件時可能會很有用。 它還可用於標記合規性錯誤和欺詐。
在學術測試中表現更好
雖然 ChatGPT 在統一 BAR 考試中得分第 10 個百分點,但 GPT-4 得分第 90 個百分點。 此外,GPT-4 在其他標準化測試中表現出色,包括 LSAT、GRE 和一些 AP 測試。
雖然這種特定功能對銀行來說不會派上用場,但它意味著一些重要的事情。 它突出了人工智能保留和再現結構化知識的能力。
已在使用中
雖然 GPT-4 昨天剛剛發布,但它已經被少數組織採用。 例如,自 2 月推出以來,微軟一直在使用 GPT-4 為其 Bing 聊天機器人提供支持。 Be My Eyes 是一個幫助盲人或弱視用戶的技術平台,它正在使用新模型來分析圖像。
該模型也被用於金融服務領域。 條紋是 目前正在使用 GPT-4 以簡化其用戶體驗並打擊欺詐。 摩根大通是 借力 GPT-4 組織其知識庫。 “你基本上擁有了財富管理領域最博學的人的知識——瞬間。 我們相信這對我們公司來說是一種變革能力,”摩根士丹利財富管理分析、數據和創新主管 Jeff McMillan 說。
還是亂
OpenAI 的 GPT-4 的一個非常類似於人類的方面是它會犯錯誤。 事實上,OpenAI 的 技術報告 關於 GPT-4 說,該模型有時“在其預測中肯定是錯誤的”。
紐約時報 提供 最近的一篇文章就是一個很好的例子, GPT-4 令人印象深刻但仍有缺陷的 10 種方式. 文章描述了一位用戶請求 GPT-4 幫助他學習西班牙語的基礎知識。 在其回應中,GPT-4 提供了一些不准確的地方,包括告訴用戶“gracias”發音像“grassy ass”。