什麼是GPT-4?

根據OpenAI說法,GPT-4可在律師資格考試擊敗90%人類、在國際生物奧林匹亞 (Biology Olympiad)擊敗99%高中生。 事實上,GPT-4在至少34種涵蓋總經、寫作、數學等領域的測驗皆名列前茅。 GPT-4 用途功能,和 ChatGPT 有何差別? 根據OpenAI官網上的介紹,GPT-4能夠處理多達2.5萬字的長篇內容,足足是ChatGPT的8倍以上,無論是生成文本、延伸對話或分析文件,GPT-4都能勝任。 這也代表著GPT-4現在擁有更強悍的「記憶力」。 《TechCrunch》認為,GPT-4能夠長時間更聚焦地與用戶對話,除了提供更精確的回覆、不會偏移討論主題,過去聊天機器人表現不佳的一大問題原因在於,最剛開始的要求與設定在一定長度的談話後就會被後來的資訊所覆蓋。

GPT-4比ChatGPT更準確嗎?

但OpenAI也開闢了新天地。 根據該公司的說法,GPT-4比原來的ChatGPT更有能力,更準確,它在各種測試中的表現令人吃驚,包括統一律師考試(GPT-4得分高於90%的人類考生)和生物奧林匹克競賽(它擊敗了99%的人類考生)。 GPT-4還在一些大學先修課程考試中名列前茅,包括大學先修藝術史和大學先修生物學,它在SAT考試中獲得了1410分——這不是一個完美的分數,但卻是許多人類高中生夢寐以求的分數。 你可以感受到GPT-4增加的智能,它的反應比以前的版本更流暢,而且似乎更適合更加廣泛的任務。 GPT-4似乎比ChatGPT有了更多防護措施。 它似乎也明顯不像原來的必應那麼瘋瘋癲癲——我們現在知道,必應在幕後 運行的是GPT-4的一個版本 ,但似乎沒有經過仔細的微調。

GPT-4有什麼風險?

AI語言模型甚至可以學習自我複製,創建新的副本以防原始模型被破壞或被停用。 今天,GPT-4似乎看上去沒有那麼危險。 但這主要是因為OpenAI花了很多時間試圖理解並減輕其風險。 但如果OpenAI的測試漏掉了一個有風險「湧現行為」怎麼辦? 或者,如果它的問世促使另一個不那麼有良知的人工智慧實驗室向市場推出一個防護措施更少的語言模型怎麼辦?

GPT-4 有什麼強大的程式設計能力?

OpenAI聯合創始人:過去的做法是「錯誤的」 GPT-4 有非常強大的程式設計能力,包括根據指令編寫程式碼和理解現有程式碼。 該研究具體測試了 GPT-4 在程式設計方面的能力。 下圖 3.1 是一個讓 GPT-4 寫 python 函數的例子,該研究使用 LeetCode 線上判斷程式碼是否正確。