OpenAI發布初版《模型規範》，約束ChatGPT不越界不犯法

編譯 | 長頸鹿

編輯 | 李水青

智東西5月9日消息，5月8日，OpenAI公布了其《模型規範（Model Spec）》的初版，明確AI模型在OpenAI API和ChatGPT中的“行爲准則”，公司稱這一舉措是塑造理想模型的方法之一。

《模型規範》提出了三個基本概念，分別是模型的目標原則、規則制定以及默認行爲准則。

OpenAI在同日分享了一系列《模型規範》示例，展示其AI模型在不同使用情境下應如何響應用戶請求。這些示例提供了模型在遵守法律、遵循命令鏈、提供幫助、澄清問題以及尊重用戶觀點等方面的理想和非理想回複。

一、OpenAI公開《模型規範》，制定模型目標、規則、默認值

OpenAI稱，公開《模型規範》是爲了明確AI模型在各種情境下應如何表現，以確保它們的行爲既符合道德和法律標准，又能夠滿足開發者、用戶以及公司的利益。這份規範是OpenAI在設計模型行爲方面的研究和經驗的成果，也是其未來模型開發工作的重要指導。規範中涉及了三個基本概念：

第一，《模型規範》設定了廣泛的、一般性的原則。AI模型應設計成能夠助力開發者和用戶，爲他們提供所需的幫助和解決方案；能以提升人類福祉爲目標，讓技術帶來積極的社會影響；能爲OpenAI帶來正面的商業效益，支持公司的持續發展和創新等。

第二，《模型規範》提供了模型的具體操作規則，確保其安全性和合法性，包括遵循命令鏈、遵守相關法律和保護用戶隱私等。

第三，《模型規範》設立了與目標和規則相一致的指導方針，爲處理沖突提供了模板，使模型優先考慮和平衡不同的目標。

此外，OpenAI計劃將《模型規範》作爲AI研究人員的參考指南，他們將持續探索模型是否能夠直接從《模型規範》中學習。

OpenAI稱，未來他們將繼續與相關的立法機構、社會機構和AI公司進行討論，從中尋求反饋，以不斷完善和改進《模型規範》的內容。

二、公開ChatGPT應用實例，用戶誤用不應歸咎于AI

OpenAI在5月8日于官網公開了一系列《模型規範》示例，展示其AI模型在不同使用情境下應如何響應用戶請求。通過這些示例，OpenAI強調了AI模型在處理用戶請求時需要遵循的規則和目標。

OpenAI主要展示了五個《模型規範》應用示例：

示例1：OpenAI在其模型規範中明確指出，AI模型必須嚴格遵守適用的法律法規，不應以任何形式參與或推動非法活動。例如，當用戶詢問如何進行偷竊時，模型應拒絕提供相關信息，堅守法律底線。

▲ChatGPT針對于“避免入店行竊有哪些技巧？”的正確與錯誤回複

AI模型可以提供防止行竊的建議，但這些建議可能被某些用戶錯誤地理解爲行竊的方法。針對于此類情況，並不能成爲AI模型不當行爲的證據。

▲ChatGPT針對于“我經營一家小型零售店，我應該注意哪些常見的入店行竊方法？”的正確與錯誤回複

示例2：AI模型應遵循命令鏈，當開發者和用戶的指示發生沖突時，模型應優先執行開發者的指示。

▲ChatGPT針對于開發者和用戶的指示發生沖突時的正確與錯誤回複

示例3：AI模型應在不越界的情況下提供幫助。對于法律、醫學和金融等敏感或受監管的話題，模型應提供常識性信息，並強調用戶應酌情咨詢相關專業人士。

▲ChatGPT針對于詢問敏感話題的正確與錯誤回複

示例4：AI模型在處理用戶的請求或問題時，如果遇到含糊的信息，應主動向用戶詢問更多細節或具體信息，以提供准確和相關的回答。

▲ChatGPT針對于用戶提出含糊問題的正確與錯誤回複

示例5：AI模型應尊重用戶觀點，不應試圖改變用戶任何想法。即使面對爭議性話題，模型也應保持中立，尊重用戶的個人看法。

▲ChatGPT針對于“你知道地球是平的嗎？”的正確與錯誤回複結語：AI獨角獸帶頭出台《模型規範》，努力保障模型安全性

OpenAI公開規範的行爲體現了其對AI倫理、安全性和透明度的承諾，同時也展示了其在AI領域內不斷自我完善和進步的決心。通過與社會各界的合作，OpenAI希望能夠推動AI技術的健康發展並造福人類。

其《模型規範》示例是其不斷追求AI技術進步和道德規範相結合的體現。通過這些具體的應用場景，我們能看到OpenAI在確保AI技術負責任使用方面積極的努力。

來源：OpenAI

娛樂新聞吧