"ਦੁਨੀਆ ਦੇ ਸਭ ਤੋਂ ਹੁਸ਼ਿਆਰ" ਗ੍ਰੋਕ3 ਦੀ ਜਾਂਚ ਕਰ ਰਿਹਾ ਹੈ

AIPU ਵਾਟਨ ਗਰੁੱਪ (1)

ਜਾਣ-ਪਛਾਣ

ਕੀ ਤੁਹਾਨੂੰ ਲੱਗਦਾ ਹੈ ਕਿ Grok3 ਪਹਿਲਾਂ ਤੋਂ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਮਾਡਲਾਂ ਦਾ "ਅੰਤ ਬਿੰਦੂ" ਹੋਵੇਗਾ?

ਐਲੋਨ ਮਸਕ ਅਤੇ xAI ਟੀਮ ਨੇ ਇੱਕ ਲਾਈਵਸਟ੍ਰੀਮ ਦੌਰਾਨ Grok ਦੇ ਨਵੀਨਤਮ ਸੰਸਕਰਣ, Grok3 ਨੂੰ ਅਧਿਕਾਰਤ ਤੌਰ 'ਤੇ ਲਾਂਚ ਕੀਤਾ। ਇਸ ਪ੍ਰੋਗਰਾਮ ਤੋਂ ਪਹਿਲਾਂ, ਮਸਕ ਦੇ 24/7 ਪ੍ਰਚਾਰ ਸੰਬੰਧੀ ਪ੍ਰਚਾਰ ਦੇ ਨਾਲ, ਸੰਬੰਧਿਤ ਜਾਣਕਾਰੀ ਦੀ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਮਾਤਰਾ ਨੇ Grok3 ਲਈ ਵਿਸ਼ਵਵਿਆਪੀ ਉਮੀਦਾਂ ਨੂੰ ਬੇਮਿਸਾਲ ਪੱਧਰ ਤੱਕ ਵਧਾ ਦਿੱਤਾ। ਸਿਰਫ਼ ਇੱਕ ਹਫ਼ਤਾ ਪਹਿਲਾਂ, ਮਸਕ ਨੇ DeepSeek R1 'ਤੇ ਟਿੱਪਣੀ ਕਰਦੇ ਹੋਏ ਇੱਕ ਲਾਈਵਸਟ੍ਰੀਮ ਦੌਰਾਨ ਵਿਸ਼ਵਾਸ ਨਾਲ ਕਿਹਾ ਸੀ, "xAI ਇੱਕ ਬਿਹਤਰ AI ਮਾਡਲ ਲਾਂਚ ਕਰਨ ਵਾਲਾ ਹੈ।" ਲਾਈਵ ਪੇਸ਼ ਕੀਤੇ ਗਏ ਡੇਟਾ ਤੋਂ, Grok3 ਨੇ ਕਥਿਤ ਤੌਰ 'ਤੇ ਗਣਿਤ, ਵਿਗਿਆਨ ਅਤੇ ਪ੍ਰੋਗਰਾਮਿੰਗ ਲਈ ਬੈਂਚਮਾਰਕਾਂ ਵਿੱਚ ਸਾਰੇ ਮੌਜੂਦਾ ਮੁੱਖ ਧਾਰਾ ਮਾਡਲਾਂ ਨੂੰ ਪਛਾੜ ਦਿੱਤਾ ਹੈ, ਮਸਕ ਨੇ ਇਹ ਵੀ ਦਾਅਵਾ ਕੀਤਾ ਹੈ ਕਿ Grok3 ਨੂੰ SpaceX ਦੇ ਮੰਗਲ ਮਿਸ਼ਨਾਂ ਨਾਲ ਸਬੰਧਤ ਕੰਪਿਊਟੇਸ਼ਨਲ ਕਾਰਜਾਂ ਲਈ ਵਰਤਿਆ ਜਾਵੇਗਾ, "ਤਿੰਨ ਸਾਲਾਂ ਦੇ ਅੰਦਰ ਨੋਬਲ ਪੁਰਸਕਾਰ ਪੱਧਰ 'ਤੇ ਸਫਲਤਾਵਾਂ" ਦੀ ਭਵਿੱਖਬਾਣੀ ਕੀਤੀ ਗਈ ਹੈ। ਹਾਲਾਂਕਿ, ਇਹ ਵਰਤਮਾਨ ਵਿੱਚ ਸਿਰਫ਼ ਮਸਕ ਦੇ ਦਾਅਵੇ ਹਨ। ਲਾਂਚ ਤੋਂ ਬਾਅਦ, ਮੈਂ Grok3 ਦੇ ਨਵੀਨਤਮ ਬੀਟਾ ਸੰਸਕਰਣ ਦੀ ਜਾਂਚ ਕੀਤੀ ਅਤੇ ਵੱਡੇ ਮਾਡਲਾਂ ਲਈ ਕਲਾਸਿਕ ਟ੍ਰਿਕ ਸਵਾਲ ਪੁੱਛਿਆ: "ਕੌਣ ਵੱਡਾ ਹੈ, 9.11 ਜਾਂ 9.9?" ਅਫ਼ਸੋਸ ਦੀ ਗੱਲ ਹੈ ਕਿ ਬਿਨਾਂ ਕਿਸੇ ਯੋਗਤਾ ਜਾਂ ਨਿਸ਼ਾਨ ਦੇ, ਸਭ ਤੋਂ ਹੁਸ਼ਿਆਰ ਗ੍ਰੋਕ3 ਅਜੇ ਵੀ ਇਸ ਸਵਾਲ ਦਾ ਸਹੀ ਜਵਾਬ ਨਹੀਂ ਦੇ ਸਕਿਆ। ਗ੍ਰੋਕ3 ਸਵਾਲ ਦੇ ਅਰਥ ਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਪਛਾਣਨ ਵਿੱਚ ਅਸਫਲ ਰਿਹਾ।

 

ਇਸ ਟੈਸਟ ਨੇ ਬਹੁਤ ਸਾਰੇ ਦੋਸਤਾਂ ਦਾ ਧਿਆਨ ਬਹੁਤ ਜਲਦੀ ਖਿੱਚਿਆ, ਅਤੇ ਇਤਫ਼ਾਕ ਨਾਲ, ਵਿਦੇਸ਼ਾਂ ਵਿੱਚ ਕਈ ਸਮਾਨ ਟੈਸਟਾਂ ਨੇ Grok3 ਨੂੰ ਬੁਨਿਆਦੀ ਭੌਤਿਕ ਵਿਗਿਆਨ/ਗਣਿਤ ਦੇ ਸਵਾਲਾਂ ਨਾਲ ਜੂਝਦੇ ਦਿਖਾਇਆ ਹੈ ਜਿਵੇਂ ਕਿ "ਪੀਸਾ ਦੇ ਝੁਕੇ ਹੋਏ ਟਾਵਰ ਤੋਂ ਕਿਹੜੀ ਗੇਂਦ ਪਹਿਲਾਂ ਡਿੱਗਦੀ ਹੈ?" ਇਸ ਤਰ੍ਹਾਂ, ਇਸਨੂੰ ਹਾਸੋਹੀਣੇ ਢੰਗ ਨਾਲ "ਇੱਕ ਪ੍ਰਤਿਭਾਸ਼ਾਲੀ ਵਿਅਕਤੀ ਜੋ ਸਧਾਰਨ ਸਵਾਲਾਂ ਦੇ ਜਵਾਬ ਦੇਣ ਲਈ ਤਿਆਰ ਨਹੀਂ ਹੈ" ਵਜੋਂ ਲੇਬਲ ਕੀਤਾ ਗਿਆ ਹੈ।

640

Grok3 ਚੰਗਾ ਹੈ, ਪਰ ਇਹ R1 ਜਾਂ o1-Pro ਤੋਂ ਵਧੀਆ ਨਹੀਂ ਹੈ।

Grok3 ਨੂੰ ਅਭਿਆਸ ਵਿੱਚ ਕਈ ਆਮ ਗਿਆਨ ਟੈਸਟਾਂ ਵਿੱਚ "ਅਸਫਲਤਾਵਾਂ" ਦਾ ਸਾਹਮਣਾ ਕਰਨਾ ਪਿਆ। xAI ਲਾਂਚ ਈਵੈਂਟ ਦੌਰਾਨ, ਮਸਕ ਨੇ ਗੇਮ ਪਾਥ ਆਫ਼ ਐਕਸਾਈਲ 2 ਦੇ ਚਰਿੱਤਰ ਵਰਗਾਂ ਅਤੇ ਪ੍ਰਭਾਵਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਲਈ Grok3 ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਦਿਖਾਇਆ, ਜਿਸਨੂੰ ਉਸਨੇ ਅਕਸਰ ਖੇਡਣ ਦਾ ਦਾਅਵਾ ਕੀਤਾ ਸੀ, ਪਰ Grok3 ਦੁਆਰਾ ਦਿੱਤੇ ਗਏ ਜ਼ਿਆਦਾਤਰ ਜਵਾਬ ਗਲਤ ਸਨ। ਲਾਈਵਸਟ੍ਰੀਮ ਦੌਰਾਨ ਮਸਕ ਨੇ ਇਸ ਸਪੱਸ਼ਟ ਮੁੱਦੇ ਵੱਲ ਧਿਆਨ ਨਹੀਂ ਦਿੱਤਾ।

 

ਇਸ ਗਲਤੀ ਨੇ ਨਾ ਸਿਰਫ਼ ਵਿਦੇਸ਼ੀ ਨੇਟੀਜ਼ਨਾਂ ਨੂੰ ਗੇਮਿੰਗ ਵਿੱਚ "ਇੱਕ ਬਦਲ ਲੱਭਣ" ਲਈ ਮਸਕ ਦਾ ਮਜ਼ਾਕ ਉਡਾਉਣ ਲਈ ਹੋਰ ਸਬੂਤ ਪ੍ਰਦਾਨ ਕੀਤੇ, ਸਗੋਂ ਵਿਹਾਰਕ ਐਪਲੀਕੇਸ਼ਨਾਂ ਵਿੱਚ Grok3 ਦੀ ਭਰੋਸੇਯੋਗਤਾ ਬਾਰੇ ਵੀ ਮਹੱਤਵਪੂਰਨ ਚਿੰਤਾਵਾਂ ਪੈਦਾ ਕੀਤੀਆਂ। ਅਜਿਹੇ "ਪ੍ਰਤਿਭਾ" ਲਈ, ਇਸਦੀ ਅਸਲ ਸਮਰੱਥਾਵਾਂ ਦੀ ਪਰਵਾਹ ਕੀਤੇ ਬਿਨਾਂ, ਮੰਗਲ ਗ੍ਰਹਿ ਖੋਜ ਕਾਰਜਾਂ ਵਰਗੇ ਬਹੁਤ ਹੀ ਗੁੰਝਲਦਾਰ ਐਪਲੀਕੇਸ਼ਨ ਦ੍ਰਿਸ਼ਾਂ ਵਿੱਚ ਇਸਦੀ ਭਰੋਸੇਯੋਗਤਾ ਸ਼ੱਕ ਵਿੱਚ ਬਣੀ ਹੋਈ ਹੈ।

 

ਵਰਤਮਾਨ ਵਿੱਚ, ਬਹੁਤ ਸਾਰੇ ਟੈਸਟਰ ਜਿਨ੍ਹਾਂ ਨੂੰ ਹਫ਼ਤੇ ਪਹਿਲਾਂ Grok3 ਤੱਕ ਪਹੁੰਚ ਪ੍ਰਾਪਤ ਹੋਈ ਸੀ, ਅਤੇ ਜਿਨ੍ਹਾਂ ਨੇ ਕੱਲ੍ਹ ਕੁਝ ਘੰਟਿਆਂ ਲਈ ਮਾਡਲ ਸਮਰੱਥਾਵਾਂ ਦੀ ਜਾਂਚ ਕੀਤੀ ਸੀ, ਸਾਰੇ ਇੱਕ ਸਾਂਝੇ ਸਿੱਟੇ ਵੱਲ ਇਸ਼ਾਰਾ ਕਰਦੇ ਹਨ: "Grok3 ਚੰਗਾ ਹੈ, ਪਰ ਇਹ R1 ਜਾਂ o1-Pro ਤੋਂ ਬਿਹਤਰ ਨਹੀਂ ਹੈ।"

640 (1)

"Nvidia ਵਿੱਚ ਵਿਘਨ ਪਾਉਣ" ਬਾਰੇ ਇੱਕ ਆਲੋਚਨਾਤਮਕ ਦ੍ਰਿਸ਼ਟੀਕੋਣ

ਰਿਲੀਜ਼ ਦੌਰਾਨ ਅਧਿਕਾਰਤ ਤੌਰ 'ਤੇ ਪੇਸ਼ ਕੀਤੇ ਗਏ PPT ਵਿੱਚ, Grok3 ਨੂੰ ਚੈਟਬੋਟ ਅਰੇਨਾ ਵਿੱਚ "ਬਹੁਤ ਅੱਗੇ" ਦਿਖਾਇਆ ਗਿਆ ਸੀ, ਪਰ ਇਸਨੇ ਚਲਾਕੀ ਨਾਲ ਗ੍ਰਾਫਿਕ ਤਕਨੀਕਾਂ ਦੀ ਵਰਤੋਂ ਕੀਤੀ: ਲੀਡਰਬੋਰਡ 'ਤੇ ਲੰਬਕਾਰੀ ਧੁਰੀ ਨੇ ਸਿਰਫ 1400-1300 ਸਕੋਰ ਰੇਂਜ ਵਿੱਚ ਨਤੀਜੇ ਸੂਚੀਬੱਧ ਕੀਤੇ, ਜਿਸ ਨਾਲ ਟੈਸਟ ਦੇ ਨਤੀਜਿਆਂ ਵਿੱਚ ਅਸਲ 1% ਅੰਤਰ ਇਸ ਪੇਸ਼ਕਾਰੀ ਵਿੱਚ ਬਹੁਤ ਮਹੱਤਵਪੂਰਨ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ।

640

ਅਸਲ ਮਾਡਲ ਸਕੋਰਿੰਗ ਨਤੀਜਿਆਂ ਵਿੱਚ, Grok3 DeepSeek R1 ਅਤੇ GPT-4.0 ਤੋਂ ਸਿਰਫ਼ 1-2% ਅੱਗੇ ਹੈ, ਜੋ ਕਿ ਵਿਹਾਰਕ ਟੈਸਟਾਂ ਵਿੱਚ ਬਹੁਤ ਸਾਰੇ ਉਪਭੋਗਤਾਵਾਂ ਦੇ ਤਜ਼ਰਬਿਆਂ ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਨੇ "ਕੋਈ ਧਿਆਨ ਦੇਣ ਯੋਗ ਅੰਤਰ ਨਹੀਂ ਪਾਇਆ।" Grok3 ਆਪਣੇ ਉੱਤਰਾਧਿਕਾਰੀਆਂ ਤੋਂ ਸਿਰਫ਼ 1%-2% ਅੱਗੇ ਹੈ।

640

ਹਾਲਾਂਕਿ Grok3 ਨੇ ਮੌਜੂਦਾ ਸਮੇਂ ਵਿੱਚ ਜਨਤਕ ਤੌਰ 'ਤੇ ਟੈਸਟ ਕੀਤੇ ਗਏ ਸਾਰੇ ਮਾਡਲਾਂ ਨਾਲੋਂ ਵੱਧ ਸਕੋਰ ਪ੍ਰਾਪਤ ਕੀਤਾ ਹੈ, ਪਰ ਬਹੁਤ ਸਾਰੇ ਇਸਨੂੰ ਗੰਭੀਰਤਾ ਨਾਲ ਨਹੀਂ ਲੈਂਦੇ: ਆਖ਼ਰਕਾਰ, xAI ਨੂੰ ਪਹਿਲਾਂ Grok2 ਯੁੱਗ ਵਿੱਚ "ਸਕੋਰ ਹੇਰਾਫੇਰੀ" ਲਈ ਆਲੋਚਨਾ ਕੀਤੀ ਗਈ ਹੈ। ਜਿਵੇਂ ਕਿ ਲੀਡਰਬੋਰਡ ਨੇ ਉੱਤਰ ਲੰਬਾਈ ਸ਼ੈਲੀ ਨੂੰ ਸਜ਼ਾ ਦਿੱਤੀ, ਸਕੋਰ ਬਹੁਤ ਘੱਟ ਗਏ, ਜਿਸ ਨਾਲ ਉਦਯੋਗ ਦੇ ਅੰਦਰੂਨੀ ਲੋਕ ਅਕਸਰ "ਉੱਚ ਸਕੋਰਿੰਗ ਪਰ ਘੱਟ ਯੋਗਤਾ" ਦੇ ਵਰਤਾਰੇ ਦੀ ਆਲੋਚਨਾ ਕਰਨ ਲਈ ਪ੍ਰੇਰਿਤ ਹੁੰਦੇ ਹਨ।

 

ਭਾਵੇਂ ਲੀਡਰਬੋਰਡ "ਹੇਰਾਫੇਰੀ" ਰਾਹੀਂ ਹੋਵੇ ਜਾਂ ਚਿੱਤਰਾਂ ਵਿੱਚ ਡਿਜ਼ਾਈਨ ਟ੍ਰਿਕਸ ਰਾਹੀਂ, ਉਹ ਮਾਡਲ ਸਮਰੱਥਾਵਾਂ ਵਿੱਚ "ਪੈਕ ਦੀ ਅਗਵਾਈ" ਕਰਨ ਦੀ ਧਾਰਨਾ ਪ੍ਰਤੀ xAI ਅਤੇ ਮਸਕ ਦੇ ਜਨੂੰਨ ਨੂੰ ਪ੍ਰਗਟ ਕਰਦੇ ਹਨ। ਮਸਕ ਨੇ ਇਹਨਾਂ ਹਾਸ਼ੀਏ ਲਈ ਇੱਕ ਭਾਰੀ ਕੀਮਤ ਅਦਾ ਕੀਤੀ: ਲਾਂਚ ਦੌਰਾਨ, ਉਸਨੇ 200,000 H100 GPUs (ਲਾਈਵਸਟ੍ਰੀਮ ਦੌਰਾਨ "100,000 ਤੋਂ ਵੱਧ" ਦਾ ਦਾਅਵਾ ਕਰਦੇ ਹੋਏ) ਦੀ ਵਰਤੋਂ ਕਰਨ ਅਤੇ 200 ਮਿਲੀਅਨ ਘੰਟਿਆਂ ਦੇ ਕੁੱਲ ਸਿਖਲਾਈ ਸਮੇਂ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਨ ਦਾ ਮਾਣ ਕੀਤਾ। ਇਸ ਨਾਲ ਕੁਝ ਲੋਕਾਂ ਨੂੰ ਇਹ ਵਿਸ਼ਵਾਸ ਹੋਇਆ ਕਿ ਇਹ GPU ਉਦਯੋਗ ਲਈ ਇੱਕ ਹੋਰ ਮਹੱਤਵਪੂਰਨ ਵਰਦਾਨ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ ਅਤੇ DeepSeek ਦੇ ਸੈਕਟਰ 'ਤੇ ਪ੍ਰਭਾਵ ਨੂੰ "ਮੂਰਖਤਾਪੂਰਨ" ਮੰਨਣ ਲਈ ਪ੍ਰੇਰਿਤ ਕੀਤਾ। ਖਾਸ ਤੌਰ 'ਤੇ, ਕੁਝ ਮੰਨਦੇ ਹਨ ਕਿ ਮਾਡਲ ਸਿਖਲਾਈ ਦਾ ਭਵਿੱਖ ਸਿਰਫ਼ ਕੰਪਿਊਟੇਸ਼ਨਲ ਸ਼ਕਤੀ ਹੋਵੇਗੀ।

 

ਹਾਲਾਂਕਿ, ਕੁਝ ਨੇਟੀਜ਼ਨਾਂ ਨੇ DeepSeek V3 ਬਣਾਉਣ ਲਈ ਦੋ ਮਹੀਨਿਆਂ ਵਿੱਚ 2000 H800 GPUs ਦੀ ਖਪਤ ਦੀ ਤੁਲਨਾ ਕੀਤੀ, ਇਹ ਗਣਨਾ ਕੀਤੀ ਕਿ Grok3 ਦੀ ਅਸਲ ਸਿਖਲਾਈ ਪਾਵਰ ਖਪਤ V3 ਨਾਲੋਂ 263 ਗੁਣਾ ਹੈ। DeepSeek V3, ਜਿਸਨੇ 1402 ਅੰਕ ਪ੍ਰਾਪਤ ਕੀਤੇ, ਅਤੇ Grok3 ਵਿਚਕਾਰ ਅੰਤਰ 100 ਅੰਕਾਂ ਤੋਂ ਥੋੜ੍ਹਾ ਘੱਟ ਹੈ। ਇਸ ਡੇਟਾ ਦੇ ਜਾਰੀ ਹੋਣ ਤੋਂ ਬਾਅਦ, ਬਹੁਤ ਸਾਰੇ ਲੋਕਾਂ ਨੂੰ ਜਲਦੀ ਹੀ ਅਹਿਸਾਸ ਹੋਇਆ ਕਿ Grok3 ਦੇ "ਦੁਨੀਆ ਦੇ ਸਭ ਤੋਂ ਮਜ਼ਬੂਤ" ਸਿਰਲੇਖ ਦੇ ਪਿੱਛੇ ਇੱਕ ਸਪੱਸ਼ਟ ਸੀਮਾਂਤ ਉਪਯੋਗਤਾ ਪ੍ਰਭਾਵ ਹੈ - ਵੱਡੇ ਮਾਡਲਾਂ ਦੇ ਤਰਕ ਜੋ ਮਜ਼ਬੂਤ ​​ਪ੍ਰਦਰਸ਼ਨ ਪੈਦਾ ਕਰਦੇ ਹਨ, ਨੇ ਘਟਦੇ ਰਿਟਰਨ ਦਿਖਾਉਣੇ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤੇ ਹਨ।

640 (2)

"ਉੱਚ ਸਕੋਰਿੰਗ ਪਰ ਘੱਟ ਯੋਗਤਾ" ਦੇ ਬਾਵਜੂਦ, Grok2 ਕੋਲ X (ਟਵਿੱਟਰ) ਪਲੇਟਫਾਰਮ ਤੋਂ ਵਰਤੋਂ ਦਾ ਸਮਰਥਨ ਕਰਨ ਲਈ ਵੱਡੀ ਮਾਤਰਾ ਵਿੱਚ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲਾ ਪਹਿਲਾ-ਧਿਰ ਡੇਟਾ ਸੀ। ਹਾਲਾਂਕਿ, Grok3 ਦੀ ਸਿਖਲਾਈ ਵਿੱਚ, xAI ਨੂੰ ਕੁਦਰਤੀ ਤੌਰ 'ਤੇ ਉਸ "ਛੱਤ" ਦਾ ਸਾਹਮਣਾ ਕਰਨਾ ਪਿਆ ਜਿਸਦਾ OpenAI ਵਰਤਮਾਨ ਵਿੱਚ ਸਾਹਮਣਾ ਕਰ ਰਿਹਾ ਹੈ - ਪ੍ਰੀਮੀਅਮ ਸਿਖਲਾਈ ਡੇਟਾ ਦੀ ਘਾਟ ਤੇਜ਼ੀ ਨਾਲ ਮਾਡਲ ਦੀਆਂ ਸਮਰੱਥਾਵਾਂ ਦੀ ਸੀਮਾਂਤ ਉਪਯੋਗਤਾ ਨੂੰ ਉਜਾਗਰ ਕਰਦੀ ਹੈ।

 

Grok3 ਅਤੇ Musk ਦੇ ਡਿਵੈਲਪਰ ਸੰਭਾਵਤ ਤੌਰ 'ਤੇ ਇਨ੍ਹਾਂ ਤੱਥਾਂ ਨੂੰ ਡੂੰਘਾਈ ਨਾਲ ਸਮਝਣ ਅਤੇ ਪਛਾਣਨ ਵਾਲੇ ਪਹਿਲੇ ਵਿਅਕਤੀ ਹਨ, ਇਸੇ ਕਰਕੇ Musk ਨੇ ਸੋਸ਼ਲ ਮੀਡੀਆ 'ਤੇ ਲਗਾਤਾਰ ਜ਼ਿਕਰ ਕੀਤਾ ਹੈ ਕਿ ਉਪਭੋਗਤਾ ਹੁਣ ਜੋ ਸੰਸਕਰਣ ਅਨੁਭਵ ਕਰ ਰਹੇ ਹਨ ਉਹ "ਅਜੇ ਵੀ ਸਿਰਫ਼ ਬੀਟਾ" ਹੈ ਅਤੇ "ਪੂਰਾ ਸੰਸਕਰਣ ਆਉਣ ਵਾਲੇ ਮਹੀਨਿਆਂ ਵਿੱਚ ਜਾਰੀ ਕੀਤਾ ਜਾਵੇਗਾ।" Musk ਨੇ Grok3 ਦੇ ਉਤਪਾਦ ਮੈਨੇਜਰ ਦੀ ਭੂਮਿਕਾ ਨਿਭਾਈ ਹੈ, ਸੁਝਾਅ ਦਿੱਤਾ ਹੈ ਕਿ ਉਪਭੋਗਤਾ ਟਿੱਪਣੀ ਭਾਗ ਵਿੱਚ ਆਉਣ ਵਾਲੇ ਵੱਖ-ਵੱਖ ਮੁੱਦਿਆਂ 'ਤੇ ਫੀਡਬੈਕ ਪ੍ਰਦਾਨ ਕਰਨ। ਉਹ ਧਰਤੀ 'ਤੇ ਸਭ ਤੋਂ ਵੱਧ ਫਾਲੋ ਕੀਤਾ ਜਾਣ ਵਾਲਾ ਉਤਪਾਦ ਮੈਨੇਜਰ ਹੋ ਸਕਦਾ ਹੈ।

 

ਫਿਰ ਵੀ, ਇੱਕ ਦਿਨ ਦੇ ਅੰਦਰ, Grok3 ਦੇ ਪ੍ਰਦਰਸ਼ਨ ਨੇ ਬਿਨਾਂ ਸ਼ੱਕ ਉਨ੍ਹਾਂ ਲੋਕਾਂ ਲਈ ਚਿੰਤਾ ਪੈਦਾ ਕਰ ਦਿੱਤੀ ਜੋ ਮਜ਼ਬੂਤ ​​ਵੱਡੇ ਮਾਡਲਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ "ਵਿਸ਼ਾਲ ਕੰਪਿਊਟੇਸ਼ਨਲ ਮਾਸਪੇਸ਼ੀ" 'ਤੇ ਭਰੋਸਾ ਕਰਨ ਦੀ ਉਮੀਦ ਰੱਖਦੇ ਹਨ: ਜਨਤਕ ਤੌਰ 'ਤੇ ਉਪਲਬਧ ਮਾਈਕ੍ਰੋਸਾਫਟ ਜਾਣਕਾਰੀ ਦੇ ਆਧਾਰ 'ਤੇ, OpenAI ਦੇ GPT-4 ਦਾ ਪੈਰਾਮੀਟਰ ਆਕਾਰ 1.8 ਟ੍ਰਿਲੀਅਨ ਪੈਰਾਮੀਟਰ ਹੈ, ਜੋ ਕਿ GPT-3 ਨਾਲੋਂ ਦਸ ਗੁਣਾ ਜ਼ਿਆਦਾ ਹੈ। ਅਫਵਾਹਾਂ ਸੁਝਾਅ ਦਿੰਦੀਆਂ ਹਨ ਕਿ GPT-4.5 ਦਾ ਪੈਰਾਮੀਟਰ ਆਕਾਰ ਹੋਰ ਵੀ ਵੱਡਾ ਹੋ ਸਕਦਾ ਹੈ।

 

ਜਿਵੇਂ-ਜਿਵੇਂ ਮਾਡਲ ਪੈਰਾਮੀਟਰ ਦੇ ਆਕਾਰ ਵਧਦੇ ਜਾ ਰਹੇ ਹਨ, ਸਿਖਲਾਈ ਦੇ ਖਰਚੇ ਵੀ ਅਸਮਾਨ ਛੂਹ ਰਹੇ ਹਨ। Grok3 ਦੀ ਮੌਜੂਦਗੀ ਦੇ ਨਾਲ, GPT-4.5 ਵਰਗੇ ਦਾਅਵੇਦਾਰ ਅਤੇ ਹੋਰ ਜੋ ਪੈਰਾਮੀਟਰ ਆਕਾਰ ਦੁਆਰਾ ਬਿਹਤਰ ਮਾਡਲ ਪ੍ਰਦਰਸ਼ਨ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ "ਪੈਸੇ ਨੂੰ ਸਾੜਨਾ" ਜਾਰੀ ਰੱਖਣਾ ਚਾਹੁੰਦੇ ਹਨ, ਉਨ੍ਹਾਂ ਨੂੰ ਉਸ ਛੱਤ 'ਤੇ ਵਿਚਾਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ ਜੋ ਹੁਣ ਸਪੱਸ਼ਟ ਤੌਰ 'ਤੇ ਨਜ਼ਰ ਆ ਰਹੀ ਹੈ ਅਤੇ ਇਸ ਨੂੰ ਕਿਵੇਂ ਦੂਰ ਕਰਨਾ ਹੈ ਇਸ ਬਾਰੇ ਵਿਚਾਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ। ਇਸ ਸਮੇਂ, OpenAI ਦੇ ਸਾਬਕਾ ਮੁੱਖ ਵਿਗਿਆਨੀ, ਇਲਿਆ ਸੁਟਸਕੇਵਰ ਨੇ ਪਿਛਲੇ ਦਸੰਬਰ ਵਿੱਚ ਪਹਿਲਾਂ ਕਿਹਾ ਸੀ, "ਜਿਸ ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ ਤੋਂ ਅਸੀਂ ਜਾਣੂ ਹਾਂ, ਉਹ ਖਤਮ ਹੋ ਜਾਵੇਗੀ," ਜੋ ਕਿ ਚਰਚਾਵਾਂ ਵਿੱਚ ਮੁੜ ਉੱਭਰਿਆ ਹੈ, ਜਿਸ ਨਾਲ ਵੱਡੇ ਮਾਡਲਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਅਸਲ ਰਸਤਾ ਲੱਭਣ ਦੀਆਂ ਕੋਸ਼ਿਸ਼ਾਂ ਸ਼ੁਰੂ ਹੋ ਗਈਆਂ ਹਨ।

640 (3)

ਇਲਿਆ ਦੇ ਦ੍ਰਿਸ਼ਟੀਕੋਣ ਨੇ ਉਦਯੋਗ ਵਿੱਚ ਅਲਾਰਮ ਵਜਾ ਦਿੱਤਾ ਹੈ। ਉਸਨੇ ਪਹੁੰਚਯੋਗ ਨਵੇਂ ਡੇਟਾ ਦੇ ਆਉਣ ਵਾਲੇ ਥਕਾਵਟ ਨੂੰ ਸਹੀ ਢੰਗ ਨਾਲ ਦੇਖਿਆ, ਜਿਸ ਨਾਲ ਇੱਕ ਅਜਿਹੀ ਸਥਿਤੀ ਪੈਦਾ ਹੋ ਗਈ ਜਿੱਥੇ ਡੇਟਾ ਪ੍ਰਾਪਤੀ ਦੁਆਰਾ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਵਧਾਇਆ ਨਹੀਂ ਜਾ ਸਕਦਾ, ਇਸਦੀ ਤੁਲਨਾ ਜੈਵਿਕ ਇੰਧਨ ਦੇ ਥਕਾਵਟ ਨਾਲ ਕੀਤੀ ਗਈ। ਉਸਨੇ ਸੰਕੇਤ ਦਿੱਤਾ ਕਿ "ਤੇਲ ਵਾਂਗ, ਇੰਟਰਨੈੱਟ 'ਤੇ ਮਨੁੱਖੀ-ਤਿਆਰ ਸਮੱਗਰੀ ਇੱਕ ਸੀਮਤ ਸਰੋਤ ਹੈ।" ਸੁਟਸਕੇਵਰ ਦੀਆਂ ਭਵਿੱਖਬਾਣੀਆਂ ਵਿੱਚ, ਮਾਡਲਾਂ ਦੀ ਅਗਲੀ ਪੀੜ੍ਹੀ, ਪੋਸਟ-ਪ੍ਰੀ-ਟ੍ਰੇਨਿੰਗ, "ਮਨੁੱਖੀ ਦਿਮਾਗ ਦੇ ਸਮਾਨ" "ਸੱਚੀ ਖੁਦਮੁਖਤਿਆਰੀ" ਅਤੇ ਤਰਕ ਸਮਰੱਥਾਵਾਂ ਰੱਖਦੀਆਂ ਹੋਣਗੀਆਂ।

 

ਅੱਜ ਦੇ ਪਹਿਲਾਂ ਤੋਂ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਮਾਡਲਾਂ ਦੇ ਉਲਟ ਜੋ ਮੁੱਖ ਤੌਰ 'ਤੇ ਸਮੱਗਰੀ ਮੇਲਣ 'ਤੇ ਨਿਰਭਰ ਕਰਦੇ ਹਨ (ਪਹਿਲਾਂ ਸਿੱਖੇ ਗਏ ਮਾਡਲ ਸਮੱਗਰੀ ਦੇ ਅਧਾਰ ਤੇ), ਭਵਿੱਖ ਦੇ AI ਸਿਸਟਮ ਮਨੁੱਖੀ ਦਿਮਾਗ ਦੀ "ਸੋਚ" ਦੇ ਸਮਾਨ ਤਰੀਕੇ ਨਾਲ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਵਿਧੀਆਂ ਸਿੱਖਣ ਅਤੇ ਸਥਾਪਿਤ ਕਰਨ ਦੇ ਯੋਗ ਹੋਣਗੇ। ਇੱਕ ਮਨੁੱਖ ਸਿਰਫ਼ ਬੁਨਿਆਦੀ ਪੇਸ਼ੇਵਰ ਸਾਹਿਤ ਨਾਲ ਕਿਸੇ ਵਿਸ਼ੇ ਵਿੱਚ ਬੁਨਿਆਦੀ ਮੁਹਾਰਤ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦਾ ਹੈ, ਜਦੋਂ ਕਿ ਇੱਕ AI ਵੱਡੇ ਮਾਡਲ ਨੂੰ ਸਿਰਫ਼ ਸਭ ਤੋਂ ਬੁਨਿਆਦੀ ਐਂਟਰੀ-ਪੱਧਰ ਦੀ ਕੁਸ਼ਲਤਾ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਲੱਖਾਂ ਡੇਟਾ ਪੁਆਇੰਟਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਭਾਵੇਂ ਸ਼ਬਦਾਵਲੀ ਨੂੰ ਥੋੜ੍ਹਾ ਬਦਲਿਆ ਜਾਂਦਾ ਹੈ, ਇਹ ਬੁਨਿਆਦੀ ਸਵਾਲ ਸਹੀ ਢੰਗ ਨਾਲ ਨਹੀਂ ਸਮਝੇ ਜਾ ਸਕਦੇ, ਜੋ ਇਹ ਦਰਸਾਉਂਦੇ ਹਨ ਕਿ ਮਾਡਲ ਵਿੱਚ ਬੁੱਧੀ ਵਿੱਚ ਸੱਚਮੁੱਚ ਸੁਧਾਰ ਨਹੀਂ ਹੋਇਆ ਹੈ: ਲੇਖ ਦੇ ਸ਼ੁਰੂ ਵਿੱਚ ਦੱਸੇ ਗਏ ਬੁਨਿਆਦੀ ਪਰ ਅਣਸੁਲਝੇ ਸਵਾਲ ਇਸ ਵਰਤਾਰੇ ਦੀ ਇੱਕ ਸਪਸ਼ਟ ਉਦਾਹਰਣ ਦਰਸਾਉਂਦੇ ਹਨ।

微信图片_20240614024031.jpg1

ਸਿੱਟਾ

ਹਾਲਾਂਕਿ, ਵਹਿਸ਼ੀ ਤਾਕਤ ਤੋਂ ਪਰੇ, ਜੇਕਰ Grok3 ਸੱਚਮੁੱਚ ਉਦਯੋਗ ਨੂੰ ਇਹ ਦੱਸਣ ਵਿੱਚ ਸਫਲ ਹੋ ਜਾਂਦਾ ਹੈ ਕਿ "ਪਹਿਲਾਂ ਤੋਂ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਮਾਡਲ ਆਪਣੇ ਅੰਤ ਦੇ ਨੇੜੇ ਆ ਰਹੇ ਹਨ," ਤਾਂ ਇਸਦਾ ਖੇਤਰ ਲਈ ਮਹੱਤਵਪੂਰਨ ਪ੍ਰਭਾਵ ਹੋਵੇਗਾ।

ਸ਼ਾਇਦ ਜਦੋਂ Grok3 ਦੇ ਆਲੇ ਦੁਆਲੇ ਦਾ ਜਨੂੰਨ ਹੌਲੀ-ਹੌਲੀ ਘੱਟ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਅਸੀਂ Fei-Fei Li ਦੀ ਉਦਾਹਰਣ ਵਰਗੇ ਹੋਰ ਮਾਮਲੇ ਦੇਖਾਂਗੇ "ਸਿਰਫ਼ $50 ਲਈ ਇੱਕ ਖਾਸ ਡੇਟਾਸੈੱਟ 'ਤੇ ਉੱਚ-ਪ੍ਰਦਰਸ਼ਨ ਵਾਲੇ ਮਾਡਲਾਂ ਨੂੰ ਟਿਊਨ ਕਰਨਾ," ਅੰਤ ਵਿੱਚ AGI ਦੇ ਅਸਲ ਮਾਰਗ ਦੀ ਖੋਜ ਕਰੇਗਾ।

ELV ਕੇਬਲ ਹੱਲ ਲੱਭੋ

ਕੰਟਰੋਲ ਕੇਬਲ

BMS, BUS, ਉਦਯੋਗਿਕ, ਇੰਸਟਰੂਮੈਂਟੇਸ਼ਨ ਕੇਬਲ ਲਈ।

ਸਟ੍ਰਕਚਰਡ ਕੇਬਲਿੰਗ ਸਿਸਟਮ

ਨੈੱਟਵਰਕ ਅਤੇ ਡੇਟਾ, ਫਾਈਬਰ-ਆਪਟਿਕ ਕੇਬਲ, ਪੈਚ ਕੋਰਡ, ਮੋਡੀਊਲ, ਫੇਸਪਲੇਟ

2024 ਪ੍ਰਦਰਸ਼ਨੀਆਂ ਅਤੇ ਸਮਾਗਮਾਂ ਦੀ ਸਮੀਖਿਆ

16 ਅਪ੍ਰੈਲ-18, 2024 ਦੁਬਈ ਵਿੱਚ ਮੱਧ-ਪੂਰਬ-ਊਰਜਾ

16-18 ਅਪ੍ਰੈਲ, 2024 ਮਾਸਕੋ ਵਿੱਚ ਸੇਕੁਰਿਕਾ

9 ਮਈ, 2024 ਨੂੰ ਸ਼ੰਘਾਈ ਵਿੱਚ ਨਵੇਂ ਉਤਪਾਦਾਂ ਅਤੇ ਤਕਨਾਲੋਜੀਆਂ ਦਾ ਲਾਂਚ ਪ੍ਰੋਗਰਾਮ

22-25 ਅਕਤੂਬਰ, 2024 ਬੀਜਿੰਗ ਵਿੱਚ ਸੁਰੱਖਿਆ ਚੀਨ

ਨਵੰਬਰ.19-20, 2024 ਕਨੈਕਟਡ ਵਰਲਡ ਕੇਐਸਏ


ਪੋਸਟ ਸਮਾਂ: ਫਰਵਰੀ-19-2025