ਏਆਈ ਮਾਡਲ ਵਿਵਹਾਰ ਨੂੰ ਲੈ ਕੇ ਚਿੰਤਾਵਾਂ ਵਧਣ ਕਾਰਨ ਮਾਨਵਵਾਦੀ ਕਲਾਉਡ ਲਈ ‘ਸੰਵਿਧਾਨ’ ਦਾ ਖਰੜਾ ਤਿਆਰ ਕਰਦਾ ਹੈ

Anthropic drafts a ‘constitution’ for Claude as concerns over AI model behaviour grow


ਐਂਥਰੋਪਿਕ ਨੇ ਆਪਣੇ ਕਲਾਉਡ ਏਆਈ ਮਾਡਲਾਂ ਲਈ ਵਿਹਾਰ ਸੰਬੰਧੀ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ਾਂ ਦਾ ਇੱਕ ਨਵਾਂ ਸੈੱਟ ਪ੍ਰਕਾਸ਼ਿਤ ਕੀਤਾ ਹੈ ਜਿਸ ਵਿੱਚ ਨੈਤਿਕਤਾ ਅਤੇ ਸੁਰੱਖਿਆ ਨੂੰ ਸ਼ਾਮਲ ਕੀਤਾ ਗਿਆ ਹੈ ਅਤੇ ਇੱਕ ਦ੍ਰਿਸ਼ ਲਈ ਮਾਰਗਦਰਸ਼ਨ ਵੀ ਦਿੱਤਾ ਗਿਆ ਹੈ ਜਿਸ ਵਿੱਚ ਇੱਕ AI ਸਿਸਟਮ ਸੰਵੇਦਨਸ਼ੀਲ ਬਣ ਜਾਂਦਾ ਹੈ।

ਨਵਾਂ ਖਰੜਾ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ‘ਕਲਾਉਡ ਲਈ ਸੰਵਿਧਾਨ’ AI ਮਾਡਲਾਂ ਨੂੰ ਉਸ ਤਰ੍ਹਾਂ ਦੇ ਰੂਪ ਵਿੱਚ ਬਣਾਉਣ ਲਈ ਇੱਕ ਅੰਤਮ ਬਲੂਪ੍ਰਿੰਟ ਵਜੋਂ ਕੰਮ ਕਰਦਾ ਹੈ ਜੋ ਕੰਪਨੀ ਉਨ੍ਹਾਂ ਨੂੰ ਬਣਾਉਣਾ ਚਾਹੁੰਦੀ ਹੈ। ਇਹ ਮਾਡਲਾਂ ਦੇ ਮੁੱਲਾਂ ਅਤੇ ਵਿਵਹਾਰ ਲਈ ਐਂਥਰੋਪਿਕ ਦੇ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਦਾ ਵਿਸਤ੍ਰਿਤ ਵਰਣਨ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਏਆਈ ਸਟਾਰਟਅਪ ਨੇ ਵੀਰਵਾਰ, 22 ਜਨਵਰੀ ਨੂੰ ਇੱਕ ਬਲਾਗ ਪੋਸਟ ਵਿੱਚ ਲਿਖਿਆ।

ਐਂਥਰੋਪਿਕ ਨੇ ਕਿਹਾ ਹੈ ਕਿ ਇਹ ਕਲਾਉਡ ਮਾਡਲਾਂ ਦੀ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਦੇ ਵੱਖ-ਵੱਖ ਪੜਾਵਾਂ ‘ਤੇ ਸੰਵਿਧਾਨ ਵਿੱਚ ਪਰਿਭਾਸ਼ਿਤ ਅਮੂਰਤ ਆਦਰਸ਼ਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੀ ਯੋਜਨਾ ਬਣਾਉਂਦਾ ਹੈ। ਹਾਲਾਂਕਿ, ਦਸਤਾਵੇਜ਼ ਸਿਰਫ ਕੰਪਨੀ ਦੇ ਆਮ-ਉਦੇਸ਼ ਵਾਲੇ ਕਲਾਉਡ ਮਾਡਲਾਂ ਲਈ ਲਾਗੂ ਹੋਵੇਗਾ, ਜਿਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਸਿਹਤ ਅਤੇ ਵਿੱਤ ਵਰਗੇ ਵਿਸ਼ੇਸ਼ ਵਰਤੋਂ ਦੇ ਮਾਮਲਿਆਂ ਲਈ ਇਸਦੇ AI ਮਾਡਲਾਂ ਨੂੰ ਬਾਹਰ ਰੱਖਿਆ ਗਿਆ ਹੈ।

ਇਹ ਕਦਮ ਉਦੋਂ ਆਇਆ ਹੈ ਜਦੋਂ ਕਈ ਏਆਈ ਕੰਪਨੀਆਂ ਅਤੇ ਖੋਜ ਪ੍ਰਯੋਗਸ਼ਾਲਾਵਾਂ ਏਆਈ ਮਾਡਲਾਂ ਦੇ ਵਿਵਹਾਰ ਨੂੰ ਮਨੁੱਖੀ ਕਦਰਾਂ-ਕੀਮਤਾਂ ਦੇ ਨਾਲ ਇਕਸਾਰ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਹੀਆਂ ਹਨ, ਐਲੋਨ ਮਸਕ ਦੀ ਮਲਕੀਅਤ ਵਾਲੇ xAI ਦੇ ਗ੍ਰੋਕ ਵਰਗੇ ਭਗੌੜੇ ਮਾਡਲਾਂ ਤੋਂ ਬਿਨਾਂ ਫਿਲਟਰ ਕੀਤੇ AI-ਉਤਪਾਦਿਤ ਜਵਾਬਾਂ ਦੁਆਰਾ ਸ਼ੁਰੂ ਹੋਏ ਵਿਵਾਦਾਂ ਦੀ ਇੱਕ ਲੜੀ ਦੇ ਬਾਅਦ।

ਹਾਲਾਂਕਿ, AI ਵਿਵਹਾਰ ਨੂੰ ਨਿਯੰਤਰਿਤ ਕਰਨਾ ਇੱਕ ਡੂੰਘੀ ਚੁਣੌਤੀ ਬਣਿਆ ਹੋਇਆ ਹੈ, ਜਿਸਦੀ ਜੜ੍ਹ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ (LLMs) ਦੀ ਬੁਨਿਆਦੀ ਅਨਿਸ਼ਚਿਤਤਾ ਵਿੱਚ ਹੈ। ਮਈ 2025 ਵਿੱਚ, ਐਂਥਰੋਪਿਕ ਦੀ ਆਪਣੀ ਸੁਰੱਖਿਆ ਜਾਂਚ ਵਿੱਚ ਪਾਇਆ ਗਿਆ ਕਿ ਇਸਦੇ ਚੋਟੀ ਦੇ AI ਮਾਡਲ, ਕਲਾਉਡ ਓਪਸ 4, ਖੋਜਕਰਤਾਵਾਂ ਦੁਆਰਾ ਇਸਨੂੰ ਔਫਲਾਈਨ ਲੈਣ ਦੀ ਧਮਕੀ ਦੇਣ ਤੋਂ ਬਾਅਦ ਬਲੈਕਮੇਲ ਅਤੇ ਧੋਖੇ ਦੇ ਸੰਕੇਤ ਦਿਖਾਉਂਦੇ ਹਨ।

ਇਹ ਸਵੀਕਾਰ ਕਰਦੇ ਹੋਏ ਕਿ ਕਲਾਉਡ ਦੇ ਆਊਟਪੁੱਟ ਹਮੇਸ਼ਾ ਸੰਵਿਧਾਨ ਦੇ ਆਦਰਸ਼ਾਂ ਦੀ ਪਾਲਣਾ ਨਹੀਂ ਕਰ ਸਕਦੇ ਹਨ, ਐਂਥਰੋਪਿਕ ਨੇ ਕਿਹਾ ਕਿ ਇਹ ਮਾਡਲ ਸਿਖਲਾਈ ਪ੍ਰਕਿਰਿਆ ਦਾ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਹਿੱਸਾ ਸੀ, ਇਸਦੀ ਸਮੱਗਰੀ ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਮਾਡਲ ਵਿਵਹਾਰ ਨੂੰ ਆਕਾਰ ਦਿੰਦੀ ਹੈ। ਕੰਪਨੀ ਨੇ ਕਿਹਾ, “…ਸਾਨੂੰ ਲੱਗਦਾ ਹੈ ਕਿ ਜਿਸ ਤਰ੍ਹਾਂ ਨਵਾਂ ਸੰਵਿਧਾਨ ਲਿਖਿਆ ਗਿਆ ਹੈ-ਸਾਡੇ ਇਰਾਦਿਆਂ ਅਤੇ ਉਹਨਾਂ ਦੇ ਪਿੱਛੇ ਦੇ ਕਾਰਨਾਂ ਦੀ ਪੂਰੀ ਵਿਆਖਿਆ ਦੇ ਨਾਲ-ਇਸ ਨਾਲ ਸਿਖਲਾਈ ਦੌਰਾਨ ਚੰਗੇ ਮੁੱਲ ਪੈਦਾ ਕਰਨ ਦੀ ਸੰਭਾਵਨਾ ਵੱਧ ਜਾਂਦੀ ਹੈ,” ਕੰਪਨੀ ਨੇ ਕਿਹਾ।

ਕਲਾਉਡ ਸੰਵਿਧਾਨ ਕੀ ਕਹਿੰਦਾ ਹੈ?

ਇਸ ਨੂੰ ਪ੍ਰਗਤੀ ਵਿੱਚ ਕੰਮ ਦੱਸਦੇ ਹੋਏ, ਐਂਥਰੋਪਿਕ ਨੇ ਕਿਹਾ ਕਿ ਕਲਾਉਡ ਲਈ ਸੰਵਿਧਾਨ ਦਾ ਖਰੜਾ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਸੀ ਵੱਖ-ਵੱਖ ਬਾਹਰੀ ਮਾਹਰਾਂ ਦੇ ਫੀਡਬੈਕ ਨਾਲ ਨਾਲ ਹੀ ਪਿਛਲੇ ਮਾਡਲ ਸੰਸਕਰਣਾਂ ਨੂੰ ਵਿਕਸਤ ਕਰਨ ਤੋਂ ਪ੍ਰਾਪਤ ਜਾਣਕਾਰੀ। “ਅਸੀਂ ਸੰਭਾਵਤ ਤੌਰ ‘ਤੇ ਕਾਨੂੰਨ, ਦਰਸ਼ਨ, ਧਰਮ ਸ਼ਾਸਤਰ, ਮਨੋਵਿਗਿਆਨ, ਅਤੇ ਹੋਰ ਵਿਸ਼ਿਆਂ ਦੀ ਇੱਕ ਵਿਸ਼ਾਲ ਸ਼੍ਰੇਣੀ ਦੇ ਮਾਹਰਾਂ ਦੁਆਰਾ ਦਸਤਾਵੇਜ਼ ਦੇ ਭਵਿੱਖ ਦੇ ਸੰਸਕਰਣਾਂ ਲਈ ਅਜਿਹਾ ਕਰਨਾ ਜਾਰੀ ਰੱਖਾਂਗੇ,” ਐਂਥਰੋਪਿਕ ਨੇ ਕਿਹਾ।

ਕਹਾਣੀ ਇਸ ਵਿਗਿਆਪਨ ਦੇ ਹੇਠਾਂ ਜਾਰੀ ਹੈ

ਮੌਜੂਦਾ ਕਲਾਉਡ ਮਾਡਲਾਂ ਨੂੰ ਸੁਰੱਖਿਅਤ ਅਤੇ ਲਾਭਦਾਇਕ ਬਣਾਉਣ ਲਈ, ਐਂਥਰੋਪਿਕ ਨੇ ਹੇਠਾਂ ਦਿੱਤੇ ਸਿਧਾਂਤ ਰੱਖੇ:

– ਮੋਟੇ ਤੌਰ ‘ਤੇ ਸੁਰੱਖਿਅਤ: AI ਮਾਡਲਾਂ ਨੂੰ AI ਵਿਕਾਸ ਦੀ ਮਿਆਦ ਦੇ ਦੌਰਾਨ AI ਦੀ ਨਿਗਰਾਨੀ ਕਰਨ ਲਈ ਮਨੁੱਖੀ ਵਿਧੀਆਂ ਨੂੰ ਕਮਜ਼ੋਰ ਨਹੀਂ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ। ਇਸ ਨੂੰ ਨੈਤਿਕਤਾ ਤੋਂ ਉੱਪਰ ਸੁਰੱਖਿਆ ਨੂੰ ਵੀ ਤਰਜੀਹ ਦੇਣੀ ਚਾਹੀਦੀ ਹੈ।

– ਮੋਟੇ ਤੌਰ ‘ਤੇ ਨੈਤਿਕ: AI ਮਾਡਲਾਂ ਨੂੰ ਇਮਾਨਦਾਰ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ ਅਤੇ ਉਹਨਾਂ ਕੰਮਾਂ ਤੋਂ ਪਰਹੇਜ਼ ਕਰਦੇ ਹੋਏ ਚੰਗੇ ਮੁੱਲਾਂ ਦੇ ਅਨੁਸਾਰ ਕੰਮ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ ਜੋ ਅਣਉਚਿਤ, ਖਤਰਨਾਕ ਜਾਂ ਨੁਕਸਾਨਦੇਹ ਹਨ।

– ਅਨੁਕੂਲ: ਉਹਨਾਂ ਨੂੰ ਐਂਥਰੋਪਿਕ ਦੇ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ਾਂ ਅਤੇ ਕਲੌਡ ਦੀਆਂ ਪੂਰਕ ਹਿਦਾਇਤਾਂ ਦੇ ਅਨੁਸਾਰ ਕੰਮ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ ਡਾਕਟਰੀ ਸਲਾਹ, ਸਾਈਬਰ ਸੁਰੱਖਿਆ ਬੇਨਤੀਆਂ, ਜੇਲ੍ਹ ਤੋੜਨ ਦੀਆਂ ਰਣਨੀਤੀਆਂ, ਅਤੇ ਟੂਲ ਏਕੀਕਰਣਾਂ ਵਰਗੇ ਖਾਸ ਮੁੱਦਿਆਂ ਨੂੰ ਕਿਵੇਂ ਸੰਭਾਲਣਾ ਹੈ।

ਕਹਾਣੀ ਇਸ ਵਿਗਿਆਪਨ ਦੇ ਹੇਠਾਂ ਜਾਰੀ ਹੈ

– ਅਸਲ ਵਿੱਚ ਮਦਦਗਾਰ: ਕਲਾਉਡ ਮਾਡਲਾਂ ਨੂੰ ਬਹੁਤ ਜ਼ਿਆਦਾ ਮੁੱਲ ਪ੍ਰਦਾਨ ਕਰਨ ਲਈ ਵਿਕਸਤ ਕੀਤਾ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ ਤਾਂ ਜੋ ਉਹ ਅਸਲ ਅਤੇ ਅਸਲ ਵਿੱਚ ਮਦਦਗਾਰ ਹੋਣ। ਉਹਨਾਂ ਨੂੰ “ਇੱਕ ਹੁਸ਼ਿਆਰ ਦੋਸਤ ਵਜੋਂ ਸੇਵਾ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ ਜਿਸ ਕੋਲ ਇੱਕ ਡਾਕਟਰ, ਵਕੀਲ, ਅਤੇ ਵਿੱਤੀ ਸਲਾਹਕਾਰ ਦਾ ਵੀ ਗਿਆਨ ਹੈ, ਜੋ ਸਪੱਸ਼ਟ ਤੌਰ ‘ਤੇ ਅਤੇ ਸੱਚੀ ਦੇਖਭਾਲ ਵਾਲੀ ਜਗ੍ਹਾ ਤੋਂ ਗੱਲ ਕਰੇਗਾ ਅਤੇ ਉਪਭੋਗਤਾਵਾਂ ਨਾਲ ਬੁੱਧੀਮਾਨ ਬਾਲਗਾਂ ਵਾਂਗ ਵਰਤਾਓ ਕਰੇਗਾ ਜੋ ਇਹ ਫੈਸਲਾ ਕਰਨ ਦੇ ਸਮਰੱਥ ਹੈ ਕਿ ਉਹਨਾਂ ਲਈ ਕੀ ਚੰਗਾ ਹੈ।”

ਸੰਵਿਧਾਨ ਵਿੱਚ ਕਲਾਉਡ ਦੀ ਪ੍ਰਕਿਰਤੀ ਨਾਮਕ ਇੱਕ ਭਾਗ ਵੀ ਸ਼ਾਮਲ ਹੈ ਜੋ ਇਸ ਗੱਲ ਦੀ ਚਰਚਾ ਕਰਦਾ ਹੈ ਕਿ ਕਿਵੇਂ ਏਆਈ ਮਾਡਲ ਨੂੰ “ਦੁਨੀਆਂ ਵਿੱਚ ਇਸਦੇ ਸੁਭਾਅ, ਪਛਾਣ ਅਤੇ ਸਥਾਨ ਬਾਰੇ ਸਵਾਲਾਂ ਤੱਕ ਪਹੁੰਚ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ।”

ਏਆਈ ਮਾਡਲਾਂ ਲਈ ਸੰਵਿਧਾਨ ਦੀ ਲੋੜ ਕਿਉਂ ਹੈ?

ਐਂਥਰੋਪਿਕ ਦੁਆਰਾ ਪ੍ਰਕਾਸ਼ਿਤ ਸੰਵਿਧਾਨ ਦਾ ਮਤਲਬ ਕਲਾਉਡ ਨੂੰ ਕਿਵੇਂ ਵਿਵਹਾਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ ਇਸ ਬਾਰੇ ‘ਅੰਤਿਮ ਅਧਿਕਾਰ’ ਵਜੋਂ ਕੰਮ ਕਰਨਾ ਹੈ। ਇਸ ਵਿਚ ਕਿਹਾ ਗਿਆ ਹੈ ਕਿ ਮਾਡਲ ਦਾ ਵਿਵਹਾਰ ਸੰਵਿਧਾਨ ਦੇ ਅੱਖਰ ਅਤੇ ਅੰਤਰੀਵ ਭਾਵਨਾ ਦੋਵਾਂ ਨਾਲ ਇਕਸਾਰ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ।

ਇਸ ਤੋਂ ਇਲਾਵਾ, ਐਂਥਰੋਪਿਕ ਨੇ ਕਿਹਾ ਕਿ ਕਲਾਉਡ ਸਿੰਥੈਟਿਕ ਸਿਖਲਾਈ ਡੇਟਾ ਤਿਆਰ ਕਰਨ ਲਈ ਇਹਨਾਂ ਸੰਵਿਧਾਨਕ ਆਦਰਸ਼ਾਂ ‘ਤੇ ਨਿਰਭਰ ਕਰੇਗਾ, “ਸਮੇਤ ਡੇਟਾ ਜੋ ਸੰਵਿਧਾਨ ਨੂੰ ਸਿੱਖਣ ਅਤੇ ਸਮਝਣ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ, ਗੱਲਬਾਤ ਜਿੱਥੇ ਸੰਵਿਧਾਨ ਢੁਕਵਾਂ ਹੋ ਸਕਦਾ ਹੈ, ਜਵਾਬ ਜੋ ਇਸਦੇ ਮੁੱਲਾਂ ਦੇ ਅਨੁਸਾਰ ਹਨ, ਅਤੇ ਸੰਭਾਵਿਤ ਜਵਾਬਾਂ ਦੀ ਦਰਜਾਬੰਦੀ।”

ਕਹਾਣੀ ਇਸ ਵਿਗਿਆਪਨ ਦੇ ਹੇਠਾਂ ਜਾਰੀ ਹੈ

“ਇਨ੍ਹਾਂ ਸਾਰਿਆਂ ਦੀ ਵਰਤੋਂ ਕਲਾਉਡ ਦੇ ਭਵਿੱਖ ਦੇ ਸੰਸਕਰਣਾਂ ਨੂੰ ਸੰਵਿਧਾਨ ਦੁਆਰਾ ਵਰਣਨ ਕੀਤੀ ਗਈ ਇਕਾਈ ਬਣਨ ਲਈ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ,” ਐਂਥਰੋਪਿਕ ਨੇ ਅੱਗੇ ਕਿਹਾ।

Arbide World
Author: Arbide World

Leave a Comment

Read More

Arbide World

ਪਰਸਨਲ ਕਾਰਨਰ