ਮਹੀਨਿਆਂ → ਦਿਨ: ਓਪਨਏਆਈ ਨੂੰ ਸੁੰਗੜਦੇ ਮਾਡਲ ਸੁਰੱਖਿਆ ਟੈਸਟਿੰਗ ਦੇ ਸੰਪਰਕ ਵਿੱਚ ਲਿਆਂਦਾ ਗਿਆ ਸੀ, ਅਤੇ ਏਆਈ ਰੇਸ ਨੇ ਲੁਕੇ ਹੋਏ ਖਤਰਿਆਂ ਨੂੰ ਦਫਨਾਇਆ ਸੀ
ਅੱਪਡੇਟ ਕੀਤਾ ਗਿਆ: 39-0-0 0:0:0

IT之家 4 月 12 日消息,金融时报(FT)昨日(4 月 11 日)发布博文,报道称 OpenAI 大幅压缩最新大型语言模型(LLM)安全测试时间,此前需要数月时间,而最新 o3 模型仅有ਕੁਝ ਦਿਨ।

ਮੁਕਾਬਲੇ-ਸੰਚਾਲਿਤ, ਸੁਰੱਖਿਆ ਰਿਆਇਤਾਂ

ਇਸ ਮਾਮਲੇ ਤੋਂ ਜਾਣੂ ਅੱਠ ਲੋਕਾਂ ਦੇ ਅਨੁਸਾਰ, ਓਪਨਏਆਈ ਨੇ ਆਪਣੇ ਮਾਡਲਾਂ ਦੇ ਸੁਰੱਖਿਆ ਟੈਸਟਿੰਗ ਸਮੇਂ ਨੂੰ ਮਹੱਤਵਪੂਰਣ ਤੌਰ 'ਤੇ ਘਟਾ ਦਿੱਤਾ ਹੈ, ਜਿਸ ਨਾਲ ਕਰਮਚਾਰੀਆਂ ਅਤੇ ਤੀਜੀ ਧਿਰ ਦੀਆਂ ਟੈਸਟਿੰਗ ਟੀਮਾਂ ਕੋਲ "ਮੁਲਾਂਕਣ" ਕਰਨ ਲਈ ਸਿਰਫ ਕੁਝ ਦਿਨ ਬਚੇ ਹਨ (ਭਾਵ, ਮਾਡਲ ਦੇ ਜੋਖਮ ਅਤੇ ਪ੍ਰਦਰਸ਼ਨ ਦੀ ਜਾਂਚ ਕਰੋ).ਪਹਿਲਾਂ, ਇਸ ਨੂੰ ਆਮ ਤੌਰ 'ਤੇ ਮਹੀਨਿਆਂ ਦਾ ਸਮਾਂ ਲੱਗਦਾ ਸੀ.

ਇੱਕ ਬਲਾਗ ਪੋਸਟ ਦੇ ਅਨੁਸਾਰ, ਓਪਨਏਆਈ ਨੂੰ ਮੈਟਾ, ਗੂਗਲ ਅਤੇ ਐਕਸਏਆਈ ਵਰਗੇ ਮੁਕਾਬਲੇਬਾਜ਼ਾਂ ਤੋਂ ਸਖਤ ਮੁਕਾਬਲੇ ਦਾ ਸਾਹਮਣਾ ਕਰਨਾ ਪੈਂਦਾ ਹੈ, ਅਤੇ ਮਾਰਕੀਟ ਦੇ ਫਾਇਦਿਆਂ ਨੂੰ ਬਣਾਈ ਰੱਖਣ ਲਈ ਨਵੇਂ ਮਾਡਲਾਂ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਲਾਂਚ ਕਰਨ ਦੀ ਜ਼ਰੂਰਤ ਹੈ. ਓ4 ਮਾਡਲ ਨੂੰ ਅਗਲੇ ਹਫਤੇ ਦੇ ਸ਼ੁਰੂ ਵਿਚ ਜਾਰੀ ਕੀਤਾ ਜਾਣਾ ਹੈ, ਜਿਸ ਨਾਲ ਟੈਸਟਰਾਂ ਕੋਲ ਸੁਰੱਖਿਆ ਦੀ ਜਾਂਚ ਕਰਨ ਲਈ ਇਕ ਹਫਤੇ ਤੋਂ ਵੀ ਘੱਟ ਸਮਾਂ ਬਚਿਆ ਹੈ, ਜਦੋਂ ਕਿ ਜੀਪੀਟੀ -0 ਦੀ ਛੇ ਮਹੀਨਿਆਂ ਦੀ ਟੈਸਟਿੰਗ ਮਿਆਦ ਹੈ.

ਜੀਪੀਟੀ -4 ਦੀ ਜਾਂਚ ਕਰਨ ਵਾਲੇ ਇੱਕ ਵਿਅਕਤੀ ਨੇ ਖੁਲਾਸਾ ਕੀਤਾ ਕਿ ਪਹਿਲਾਂ, ਸੁਰੱਖਿਆ ਟੈਸਟ ਵਧੇਰੇ ਵਿਆਪਕ ਸਨ, ਅਤੇ ਕੁਝ ਖਤਰਨਾਕ ਯੋਗਤਾਵਾਂ ਸਿਰਫ ਦੋ ਮਹੀਨਿਆਂ ਦੀ ਜਾਂਚ ਤੋਂ ਬਾਅਦ ਲੱਭੀਆਂ ਗਈਆਂ ਸਨ, ਪਰ ਹੁਣ ਮੁਕਾਬਲੇਬਾਜ਼ੀ ਦੇ ਦਬਾਅ ਕੰਪਨੀਆਂ ਨੂੰ ਗਤੀ ਵਧਾਉਣ ਅਤੇ ਸੰਭਾਵਿਤ ਜੋਖਮਾਂ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਕਰਨ ਲਈ ਮਜਬੂਰ ਕਰਦੇ ਹਨ.

ਨਾਕਾਫੀ ਟੈਸਟਿੰਗ ਅਤੇ ਨਿਯਮਾਂ ਦੀ ਘਾਟ

ਇਸ ਸਮੇਂ ਏਆਈ ਸੁਰੱਖਿਆ ਟੈਸਟਿੰਗ ਲਈ ਕੋਈ ਗਲੋਬਲ ਮਾਪਦੰਡ ਨਹੀਂ ਹੈ, ਪਰ ਯੂਰਪੀਅਨ ਯੂਨੀਅਨ ਦਾ ਏਆਈ ਐਕਟ, ਜੋ ਇਸ ਸਾਲ ਦੇ ਅਖੀਰ ਵਿੱਚ ਲਾਈਵ ਹੋਵੇਗਾ, ਕੰਪਨੀਆਂ ਨੂੰ ਆਪਣੇ ਸਭ ਤੋਂ ਮਜ਼ਬੂਤ ਮਾਡਲਾਂ ਨੂੰ ਸੁਰੱਖਿਅਤ ਢੰਗ ਨਾਲ ਟੈਸਟ ਕਰਨ ਦੀ ਜ਼ਰੂਰਤ ਹੋਏਗੀ.

ਏਆਈ ਫਿਊਚਰਜ਼ ਪ੍ਰੋਜੈਕਟ ਦੇ ਮੁਖੀ ਡੈਨੀਅਲ ਕੋਕੋਟਾਜਲੋ ਨੇ ਕਿਹਾ ਕਿ ਲਾਜ਼ਮੀ ਨਿਯਮਾਂ ਦੀ ਘਾਟ ਅਤੇ ਕੰਪਨੀਆਂ ਸਵੈ-ਇੱਛਾ ਨਾਲ ਆਪਣੇ ਮਾਡਲਾਂ ਦੀਆਂ ਖਤਰਨਾਕ ਸਮਰੱਥਾਵਾਂ ਦਾ ਖੁਲਾਸਾ ਨਹੀਂ ਕਰਦੀਆਂ, ਇਸ ਤੱਥ ਕਾਰਨ ਮੁਕਾਬਲੇ ਦੇ ਦਬਾਅ ਨੇ ਜੋਖਮ ਨੂੰ ਹੋਰ ਵਧਾ ਦਿੱਤਾ।

ਓਪਨਏਆਈ ਨੇ ਇਸ ਦੇ ਸੰਭਾਵਿਤ ਦੁਰਵਰਤੋਂ ਦੇ ਜੋਖਮਾਂ ਦੀ ਜਾਂਚ ਕਰਨ ਲਈ ਮਾਡਲ ਦਾ ਇੱਕ ਕਸਟਮ ਸੰਸਕਰਣ ਬਣਾਉਣ ਦਾ ਵਾਅਦਾ ਕੀਤਾ ਹੈ, ਜਿਵੇਂ ਕਿ ਕੀ ਇਹ ਵਧੇਰੇ ਛੂਤਕਾਰੀ ਜੈਵਿਕ ਵਾਇਰਸ ਬਣਾਉਣ ਵਿੱਚ ਮਦਦ ਕਰ ਸਕਦਾ ਹੈ।

ਇਸ ਕਿਸਮ ਦੀ ਟੈਸਟਿੰਗ ਲਈ ਸਰੋਤਾਂ ਦੇ ਮਹੱਤਵਪੂਰਣ ਨਿਵੇਸ਼ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਜਿਸ ਵਿੱਚ ਬਾਹਰੀ ਮਾਹਰਾਂ ਨੂੰ ਕਿਰਾਏ 'ਤੇ ਲੈਣਾ, ਵਿਸ਼ੇਸ਼ ਡੇਟਾਸੈਟ ਬਣਾਉਣਾ ਅਤੇ "ਫਾਈਨ-ਟਿਊਨਿੰਗ" ਸ਼ਾਮਲ ਹੈ. ਪਰ ਓਪਨਏਆਈ ਨੇ ਸਿਰਫ ਪੁਰਾਣੇ ਮਾਡਲਾਂ ਦੀ ਸੀਮਤ ਫਾਈਨ-ਟਿਊਨਿੰਗ ਕੀਤੀ ਹੈ, ਅਤੇ ਓ 3 ਅਤੇ ਓ0-ਮਿਨੀ ਵਰਗੇ ਨਵੀਨਤਮ ਮਾਡਲਾਂ ਦੀ ਪੂਰੀ ਤਰ੍ਹਾਂ ਜਾਂਚ ਨਹੀਂ ਕੀਤੀ ਗਈ ਹੈ. ਓਪਨਏਆਈ ਦੇ ਸਾਬਕਾ ਸੁਰੱਖਿਆ ਖੋਜਕਰਤਾ ਸਟੀਵਨ ਐਡਲਰ ਨੇ ਲੋਕਾਂ ਦੇ ਇਹ ਜਾਣਨ ਦੇ ਅਧਿਕਾਰ ਦੀ ਆਲੋਚਨਾ ਕੀਤੀ ਕਿ ਕੀ ਟੈਸਟਿੰਗ ਦਾ ਵਾਅਦਾ ਪੂਰਾ ਨਹੀਂ ਕੀਤਾ ਜਾਂਦਾ।

ਅੰਤਿਮ ਮਾਡਲ ਸੁਰੱਖਿਆ ਟੈਸਟਿੰਗ ਦੁਆਰਾ ਕਵਰ ਨਹੀਂ ਕੀਤਾ ਗਿਆ ਹੈ

ਇਕ ਹੋਰ ਸਮੱਸਿਆ ਇਹ ਹੈ ਕਿ ਸੁਰੱਖਿਆ ਟੈਸਟਿੰਗ ਅਕਸਰ ਅੰਤਿਮ ਰਿਲੀਜ਼ ਮਾਡਲ ਦੀ ਬਜਾਏ ਸ਼ੁਰੂਆਤੀ "ਚੈੱਕਪੁਆਇੰਟਾਂ" 'ਤੇ ਅਧਾਰਤ ਹੁੰਦੀ ਹੈ. ਇੱਕ ਸਾਬਕਾ ਓਪਨਏਆਈ ਟੈਕਨੀਸ਼ੀਅਨ ਨੇ ਕਿਹਾ ਕਿ ਇੱਕ ਅਪਡੇਟ ਕੀਤੇ ਮਾਡਲ ਨੂੰ ਜਾਰੀ ਕਰਨਾ "ਬੁਰਾ ਅਭਿਆਸ" ਸੀ ਜਿਸਦਾ ਟੈਸਟ ਨਹੀਂ ਕੀਤਾ ਗਿਆ ਸੀ, ਜਦੋਂ ਕਿ ਓਪਨਏਆਈ ਨੇ ਦਲੀਲ ਦਿੱਤੀ ਕਿ ਇਸਦੇ ਚੈੱਕਪੁਆਇੰਟ ਅੰਤਮ ਮਾਡਲ ਨਾਲ "ਕਾਫ਼ੀ ਹੱਦ ਤੱਕ ਇਕਸਾਰ" ਸਨ ਅਤੇ ਆਟੋਮੈਟਿਕ ਟੈਸਟਿੰਗ ਦੀ ਵਰਤੋਂ ਕੁਸ਼ਲਤਾ ਵਿੱਚ ਸੁਧਾਰ ਕਰਨ ਅਤੇ ਸੁਰੱਖਿਆ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਕੀਤੀ ਗਈ ਸੀ।