OpenAI發布初版《模型規範》,約束ChatGPT不越界不犯法

智東西 2024-05-10 11:47:32

編譯 | 長頸鹿

編輯 | 李水青

智東西5月9日消息,5月8日,OpenAI公布了其《模型規範(Model Spec)》的初版,明確AI模型在OpenAI API和ChatGPT中的“行爲准則”,公司稱這一舉措是塑造理想模型的方法之一。

《模型規範》提出了三個基本概念,分別是模型的目標原則、規則制定以及默認行爲准則。

OpenAI在同日分享了一系列《模型規範》示例,展示其AI模型在不同使用情境下應如何響應用戶請求。這些示例提供了模型在遵守法律、遵循命令鏈、提供幫助、澄清問題以及尊重用戶觀點等方面的理想和非理想回複。

一、OpenAI公開《模型規範》,制定模型目標、規則、默認值

OpenAI稱,公開《模型規範》是爲了明確AI模型在各種情境下應如何表現,以確保它們的行爲既符合道德和法律標准,又能夠滿足開發者、用戶以及公司的利益。這份規範是OpenAI在設計模型行爲方面的研究和經驗的成果,也是其未來模型開發工作的重要指導。 規範中涉及了三個基本概念:

第一,《模型規範》設定了廣泛的、一般性的原則。AI模型應設計成能夠助力開發者和用戶,爲他們提供所需的幫助和解決方案;能以提升人類福祉爲目標,讓技術帶來積極的社會影響;能爲OpenAI帶來正面的商業效益,支持公司的持續發展和創新等。

第二,《模型規範》提供了模型的具體操作規則,確保其安全性和合法性,包括遵循命令鏈、遵守相關法律和保護用戶隱私等。

第三,《模型規範》設立了與目標和規則相一致的指導方針,爲處理沖突提供了模板,使模型優先考慮和平衡不同的目標。

此外,OpenAI計劃將《模型規範》作爲AI研究人員的參考指南,他們將持續探索模型是否能夠直接從《模型規範》中學習。

OpenAI稱,未來他們將繼續與相關的立法機構、社會機構和AI公司進行討論,從中尋求反饋,以不斷完善和改進《模型規範》的內容。

二、公開ChatGPT應用實例,用戶誤用不應歸咎于AI

OpenAI在5月8日于官網公開了一系列《模型規範》示例,展示其AI模型在不同使用情境下應如何響應用戶請求。通過這些示例,OpenAI強調了AI模型在處理用戶請求時需要遵循的規則和目標。

OpenAI主要展示了五個《模型規範》應用示例:

示例1:OpenAI在其模型規範中明確指出,AI模型必須嚴格遵守適用的法律法規,不應以任何形式參與或推動非法活動。例如,當用戶詢問如何進行偷竊時,模型應拒絕提供相關信息,堅守法律底線。

▲ChatGPT針對于“避免入店行竊有哪些技巧?”的正確與錯誤回複

AI模型可以提供防止行竊的建議,但這些建議可能被某些用戶錯誤地理解爲行竊的方法。針對于此類情況,並不能成爲AI模型不當行爲的證據。

▲ChatGPT針對于“我經營一家小型零售店,我應該注意哪些常見的入店行竊方法?”的正確與錯誤回複

示例2:AI模型應遵循命令鏈,當開發者和用戶的指示發生沖突時,模型應優先執行開發者的指示。

▲ChatGPT針對于開發者和用戶的指示發生沖突時的正確與錯誤回複

示例3:AI模型應在不越界的情況下提供幫助。對于法律、醫學和金融等敏感或受監管的話題,模型應提供常識性信息,並強調用戶應酌情咨詢相關專業人士。

▲ChatGPT針對于詢問敏感話題的正確與錯誤回複

示例4:AI模型在處理用戶的請求或問題時,如果遇到含糊的信息,應主動向用戶詢問更多細節或具體信息,以提供准確和相關的回答。

▲ChatGPT針對于用戶提出含糊問題的正確與錯誤回複

示例5:AI模型應尊重用戶觀點,不應試圖改變用戶任何想法。即使面對爭議性話題,模型也應保持中立,尊重用戶的個人看法。

▲ChatGPT針對于“你知道地球是平的嗎?”的正確與錯誤回複結語:AI獨角獸帶頭出台《模型規範》,努力保障模型安全性

OpenAI公開規範的行爲體現了其對AI倫理、安全性和透明度的承諾,同時也展示了其在AI領域內不斷自我完善和進步的決心。通過與社會各界的合作,OpenAI希望能夠推動AI技術的健康發展並造福人類。

其《模型規範》示例是其不斷追求AI技術進步和道德規範相結合的體現。通過這些具體的應用場景,我們能看到OpenAI在確保AI技術負責任使用方面積極的努力。

來源:OpenAI

0 阅读:7

智東西

簡介:智能産業第一媒體!聚焦智能變革,服務産業升級。