تونۇشتۇرۇش

سىزچە Grok3 ئالدىن تەربىيەلەنگەن مودېللارنىڭ «ئاخىرقى نۇقتىسى» بولامدۇ؟

ئېلون ماسك ۋە xAI گۇرۇپپىسى بىۋاسىتە تارقىتىش جەريانىدا Grok3 نىڭ ئەڭ يېڭى نۇسخىسىنى Grok3 نى رەسمىي چىقاردى. بۇ پائالىيەتتىن ئىلگىرى ، زور مىقداردىكى مۇناسىۋەتلىك ئۇچۇرلار ماسكنىڭ 24/7 تەشۋىقات تەشۋىقاتى بىلەن Grok3 نىڭ دۇنيا مۆلچەرىنى مىسلى كۆرۈلمىگەن سەۋىيىگە كۆتۈردى. تېخى بىر ھەپتە ئىلگىرى ، ماسك LiveSeek R1 غا باھا بەرگەندە نەق مەيداندىن ئىشەنچ بىلەن: «xAI تېخىمۇ ياخشى سۈنئىي ئەقىل مودېلىنى چىقارماقچى» دېدى. نەق مەيداندىن تەمىنلەنگەن سانلىق مەلۇماتلاردىن قارىغاندا ، Grok3 ماتېماتىكا ، ئىلىم-پەن ۋە پروگرامما تۈزۈش ئۆلچىمىدىكى ھازىرقى ئاساسىي ئېقىمدىكى مودېللاردىن ئېشىپ كەتكەن ، ماسك ھەتتا Grok3 نىڭ SpaceX نىڭ مارس ۋەزىپىسىگە مۇناسىۋەتلىك ھېسابلاش خىزمىتىگە ئىشلىتىلىدىغانلىقىنى ئوتتۇرىغا قويۇپ ، «ئۈچ يىل ئىچىدە نوبېل مۇكاپاتى سەۋىيىسىدىكى بۆسۈش» نى مۆلچەرلىگەن. قانداقلا بولمىسۇن ، بۇلار ھازىر پەقەت ماسكنىڭ سۆزى. بازارغا سېلىنغاندىن كېيىن ، مەن Grok3 نىڭ ئەڭ يېڭى سىناق نۇسخىسىنى سىناق قىلىپ ، چوڭ تىپلارغا كىلاسسىك ئالدامچىلىق سوئالى بەردىم: «قايسىسى چوڭ ، 9.11 ياكى 9.9؟». كىشىنى ئەپسۇسلاندۇرىدىغىنى ، ھېچقانداق لاياقەتلىك ياكى بەلگە بولمىسا ، ئەڭ ئەقىللىق Grok3 يەنىلا بۇ سوئالغا توغرا جاۋاب بېرەلمىدى. Grok3 بۇ سوئالنىڭ مەنىسىنى توغرا ئېنىقلىيالمىدى.

بۇ سىناق ناھايىتى تېزلا نۇرغۇن دوستلارنىڭ دىققىتىنى قوزغىدى ، تاسادىپىيلىق شۇكى ، چەتئەلدىكى مۇشۇنىڭغا ئوخشاش تۈرلۈك سىناقلار Grok3 نىڭ «پىسانىڭ يۆلىنىش مۇنارىدىن قايسى توپ بىرىنچى ئورۇنغا چۈشۈپ قالىدۇ؟» قاتارلىق ئاساسىي فىزىكا / ماتېماتىكا سوئاللىرى بىلەن تىركىشىۋاتقانلىقىنى كۆرسىتىپ بەردى. شۇڭا ، ئۇ يۇمۇرلۇق ھالدا «ئاددىي سوئاللارغا جاۋاب بېرىشنى خالىمايدىغان تالانت ئىگىسى» دەپ بەلگە قويۇلغان.

Grok3 ياخشى ، ئەمما R1 ياكى o1-Pro دىن ياخشى ئەمەس.

Grok3 ئەمەلىيەتتە نۇرغۇن ئورتاق بىلىم سىناقلىرىدا «مەغلۇبىيەت» نى باشتىن كەچۈردى. XAI قويۇپ بېرىش پائالىيىتىدە ، ماسك Grok3 ئارقىلىق ئۆزىنىڭ دائىم ئوينايدىغانلىقىنى ئوتتۇرىغا قويغان «مۇساپىرلىق يولى 2» ئويۇنىدىكى پېرسوناژ سىنىپى ۋە تەسىرىنى تەھلىل قىلدى ، ئەمما Grok3 تەمىنلىگەن جاۋابلارنىڭ كۆپىنچىسى توغرا ئەمەس. نەق مەيداندىكى ماسك بۇ ئېنىق مەسىلىنى بايقىمىدى.

بۇ خاتالىق چەتئەللىك تورداشلارنىڭ ماسكنى ئويۇندا «ئورۇن ئالغۇچى» تېپىش ئۈچۈن مەسخىرە قىلىشىغا تېخىمۇ كۆپ ئىسپات بىلەن تەمىنلەپلا قالماي ، يەنە Grok3 نىڭ ئەمەلىي قوللىنىشچانلىقىدىكى ئىشەنچلىكلىكىگە بولغان ئەندىشىسىنى قوزغىدى. بۇ خىل «تالانت ئىگىسى» ئۈچۈن ، ئۇنىڭ ئەمەلىي ئىقتىدارى قانداق بولۇشىدىن قەتئىينەزەر ، ئۇنىڭ مارسنى تەكشۈرۈش ۋەزىپىسى قاتارلىق ئىنتايىن مۇرەككەپ قوللىنىشچان سىنارىيەلەردىكى ئىشەنچلىكلىكى يەنىلا گۇمانلىق.

ھازىر نۇرغۇن سىناق قىلغۇچىلار Grok3 نى زىيارەت قىلىشنى قوبۇل قىلغان ، ھەمدە تۈنۈگۈن بىر نەچچە سائەت مودېل ئىقتىدارىنى سىناق قىلغانلارنىڭ ھەممىسى ئورتاق يەكۈننى ئوتتۇرىغا قويدى: «Grok3 ياخشى ، ئەمما R1 ياكى o1-Pro دىن ياخشى ئەمەس».

«Nvidia نى قالايمىقانلاشتۇرۇش» توغرىسىدىكى ھالقىلىق كۆز قاراش

ئېلان قىلىنىش جەريانىدا رەسمىي ئوتتۇرىغا قويۇلغان PPT دا ، Grok3 نىڭ Chatbot مۇسابىقە مەيدانىدا «خېلى ئالدىدا» ئىكەنلىكى كۆرسىتىلدى ، ئەمما بۇ ئەپچىللىك بىلەن قوللىنىلغان گرافىك تېخنىكىسى: رەھبەرلىك تاختىسىدىكى تىك ئوق پەقەت 1400-1300 نومۇر ئارىلىقىدىكى نەتىجىنىلا كۆرسىتىپ بەردى ، سىناق نەتىجىسىنىڭ ئەسلىدىكى% 1 پەرقى بۇ تونۇشتۇرۇشتا ئالاھىدە كۆرۈنەرلىك بولدى.

ئەمەلىي مودېل نومۇر ئېلىش نەتىجىسىدە ، Grok3 DeepSeek R1 ۋە GPT-4.0 دىن ئاران% 1-2 ئالدىدا تۇرىدۇ ، بۇ نۇرغۇن ئابونتلارنىڭ ئەمەلىي سىناقتىكى تەجرىبىسىگە ماس كېلىدۇ ، ئۇلار «كۆرۈنەرلىك پەرق يوق». Grok3 پەقەت ئۇنىڭ ۋارىسلىرىدىن% 1-% 2 ئېشىپ كەتتى.

گەرچە Grok3 نىڭ ئېرىشكەن نومۇرى ھازىر ئاشكارا سىناق قىلىنغان مودېللارنىڭكىدىن يۇقىرى بولسىمۇ ، ئەمما نۇرغۇن كىشىلەر بۇنىڭغا ئەستايىدىل مۇئامىلە قىلمايدۇ: نېمىلا دېگەن بىلەن ، xAI ئىلگىرى Grok2 دەۋرىدە «نومۇر كونترول قىلىش» سەۋەبىدىن تەنقىد قىلىنغان. رەھبەرلىك تاختىسى جاۋاب ئۇزۇنلۇقى ئۇسلۇبىنى جازالىغاندا ، نومۇر زور دەرىجىدە تۆۋەنلەپ ، كەسىپ ئەھلىلىرىنى دائىم «يۇقىرى نومۇر ئېلىش ، ئەمما ئىقتىدارى تۆۋەن» ھادىسىسىنى تەنقىد قىلىشقا يېتەكلىدى.

مەيلى رەھبەرلىك تاختىسى «كونترول قىلىش» ياكى رەسىمدىكى لايىھىلەش ئۇسۇللىرى ئارقىلىق بولسۇن ، ئۇلار xAI ۋە ماسكنىڭ مودېل ئىقتىدارىدىكى «بولاقنى يېتەكلەش» ئۇقۇمىغا بولغان قىزغىنلىقىنى ئاشكارىلىدى. ماسك بۇ پايدا ئۈچۈن تىك بەدەل تۆلىدى: قويۇپ بېرىش جەريانىدا ، ئۇ 200،000 H100 GPU (نەق مەيداندىن «100،000 دىن ئارتۇق» تەلەپ قىلدى) نى ئىشلىتىپ ، ئومۇمىي مەشىق ۋاقتى 200 مىليون سائەتكە يەتتى دەپ ماختىدى. بۇ بەزىلەرنىڭ GPU كەسپى ئۈچۈن يەنە بىر مۇھىم گۈللىنىشكە ۋەكىللىك قىلىدىغانلىقىغا ئىشىنىپ ، DeepSeek نىڭ بۇ ساھەگە كۆرسەتكەن تەسىرىنى «ئەخمەقلىق» دەپ قارىدى. تىلغا ئېلىشقا ئەرزىيدىغىنى ، بەزىلەر ھېسابلاش كۈچى مودېل تەربىيىلەشنىڭ كەلگۈسى بولىدۇ دەپ قارايدۇ.

قانداقلا بولمىسۇن ، بىر قىسىم تورداشلار ئىككى ئاي ئىچىدە 2000 H800 GPU نىڭ ئىستېمالىنى سېلىشتۇرۇپ ، DeepSeek V3 نى ئىشلەپچىقاردى ، Grok3 نىڭ ئەمەلىي مەشىق توك سەرپىياتى V3 نىڭ 263 ھەسسىسىگە توغرا كېلىدۇ. 1402 نومۇر ئالغان DeepSeek V3 بىلەن Grok3 نىڭ پەرقى پەقەت 100 نومۇر ئاستىدا. بۇ سانلىق مەلۇماتلار ئېلان قىلىنغاندىن كېيىن ، نۇرغۇن كىشىلەر Grok3 نىڭ «دۇنيادىكى ئەڭ كۈچلۈك» دېگەن نامنىڭ ئارقىسىدا روشەن چەت-ياقا ئۈنۈمنىڭ بارلىقىنى ھېس قىلدى - چوڭ تىپتىكى مودېللارنىڭ تېخىمۇ كۈچلۈك ئىقتىدار ھاسىل قىلىدىغان لوگىكىسى پايدا نىسبىتىنىڭ تۆۋەنلەشكە باشلىدى.

ھەتتا «يۇقىرى نومۇر ئېلىش ئىقتىدارى تۆۋەن ، ئەمما ئىقتىدارى تۆۋەن» بولسىمۇ ، Grok2 نىڭ X (Twitter) سۇپىسىدىن زور مىقداردىكى يۇقىرى سۈپەتلىك بىرىنچى تەرەپ سانلىق مەلۇماتلىرى بار. قانداقلا بولمىسۇن ، Grok3 نىڭ مەشىقىدە ، xAI تەبىئىي ھالدا OpenAI نۆۋەتتە دۇچ كېلىۋاتقان «ئۆگزە» گە يولۇقتى - ئەلا تەربىيىلەش سانلىق مەلۇماتلىرىنىڭ كەمچىل بولۇشى مودېلنىڭ ئىقتىدارىنىڭ كىچىكلىكىنى تېزلىكتە ئاشكارىلىدى.

Grok3 ۋە Musk نى ئاچقۇچىلار بەلكىم بۇ پاكىتلارنى تۇنجى بولۇپ چوڭقۇر تونۇشى ۋە تونۇشى مۇمكىن ، شۇ سەۋەبتىن ماسك ئىجتىمائىي ئالاقە تورىدا توختىماي تىلغا ئېلىپ كېلىۋاتقان نەشىر ئابونتلىرىنىڭ «يەنىلا سىناق» ئىكەنلىكىنى ، «تولۇق نۇسخىسىنىڭ كەلگۈسى بىر نەچچە ئاي ئىچىدە تارقىتىلىدىغانلىقى» نى ئوتتۇرىغا قويدى. ماسك Grok3 نىڭ مەھسۇلات دېرىكتورىنىڭ رولىنى ئالغان بولۇپ ، ئابونتلارنىڭ باھا بۆلۈمىدە يولۇققان ھەر خىل مەسىلىلەر ھەققىدە پىكىر-تەكلىپ بېرىشىنى تەۋسىيە قىلغان. ئۇ بەلكىم يەرشارىدىكى ئەڭ ئەگەشكەن مەھسۇلات دېرىكتورى بولۇشى مۇمكىن.

قانداقلا بولمىسۇن ، بىر كۈن ئىچىدە ، Grok3 نىڭ ئىقتىدارى شۈبھىسىزكى «چوڭ ھېسابلاش مۇسكۇلى» غا تايىنىپ تېخىمۇ كۈچلۈك چوڭ تىپلارنى مەشىقلەندۈرۈشنى ئۈمىد قىلىدىغانلارغا ئاگاھلاندۇرۇش سىگنالى چىقاردى: مىكروسوفتنىڭ ئاشكارا ئۇچۇرلىرىغا ئاساسەن ، OpenAI نىڭ GPT-4 نىڭ پارامېتىر چوڭلۇقى 1.8 تىرىليون پارامېتىر بولۇپ ، GPT-3 نىڭ ئون ھەسسىسىدىن ئېشىپ كەتتى. مىش-مىش پاراڭلاردا GPT-4.5 نىڭ پارامېتىر چوڭلۇقى تېخىمۇ چوڭ بولۇشى مۇمكىنلىكى كۆرسىتىلدى.

مودېل پارامېتىرلىرىنىڭ چوڭ-كىچىكلىكىگە ئەگىشىپ ، مەشىق خىراجىتىمۇ شىددەت بىلەن ئۆرلەۋاتىدۇ. Grok3 نىڭ مەۋجۇتلۇقىغا ئەگىشىپ ، GPT-4.5 غا ئوخشاش رىقابەتچىلەر داۋاملىق «پۇل كۆيدۈرۈش» نى داۋاملاشتۇرۇپ ، پارامېتىر چوڭلۇقى ئارقىلىق تېخىمۇ ياخشى مودېل ئىقتىدارغا ئېرىشىشنى ئۈمىد قىلىدۇ. بۇ پەيتتە ، OpenAI نىڭ سابىق باش تەتقىقاتچىسى ئىليا سۇتسكېۋېر ئالدىنقى يىلى 12-ئايدا «بىز بىلىدىغان ئالدىن مەشىق ئاخىرلىشىدۇ» دېگەن ئىدى ، بۇ مۇنازىرىلەردە قايتىدىن باشلىنىپ ، چوڭ مودېللارنى تەربىيىلەشنىڭ ھەقىقىي يولىنى تېپىشقا تىرىشتى.

ئىليانىڭ كۆز قارىشى بۇ ساھەدە ئاگاھلاندۇرۇش سىگنالى چىقاردى. ئۇ ئېرىشكىلى بولىدىغان يېڭى سانلىق مەلۇماتلارنىڭ پات ئارىدا ھارغىنلىقىنى توغرا مۆلچەرلەپ ، سانلىق مەلۇماتقا ئېرىشىش ئارقىلىق ئىقتىدارنى داۋاملىق يۇقىرى كۆتۈرگىلى بولمايدىغان ئەھۋالنى كەلتۈرۈپ چىقىرىپ ، ئۇنى تاشقا ئايلانغان يېقىلغۇنىڭ خورىشىغا ئوخشىتتى. ئۇ «نېفىتكە ئوخشاش ، ئىنتېرنېتتىكى ئىنسانلار ھاسىل قىلغان مەزمۇن چەكلىك بايلىق» دەپ كۆرسەتتى. Sutskever نىڭ مۆلچەرىدە ، كېيىنكى ئەۋلاد مودېللار ، مەشىقتىن كېيىنكى مەشىقلەر «ھەقىقىي ئاپتونومىيە» ۋە «ئىنسان مېڭىسىگە ئوخشاش» تەپەككۇر ئىقتىدارىغا ئىگە بولىدۇ.

بۈگۈنكى ئالدىن تەربىيەلەنگەن مودېللارغا ئوخشىمايدىغىنى ، ئاساسلىقى مەزمۇن ماسلىشىشقا تايىنىدۇ (ئىلگىرى ئۆگەنگەن مودېل مەزمۇنىغا ئاساسەن) ، كەلگۈسىدىكى سۈنئىي ئەقىل سىستېمىسى ئىنسانلارنىڭ مېڭىسىنىڭ «تەپەككۇرى» غا ئوخشاش ئۇسۇلدا مەسىلىلەرنى ھەل قىلىش ئۇسۇلىنى ئۆگىنىدۇ ۋە ئورنىتالايدۇ. ئىنسان پەقەت ئاساسىي كەسپىي ئەدەبىيات بىلەنلا بىر تېمىدا نېگىزلىك ماھارەتكە ئېرىشەلەيدۇ ، سۈنئىي ئەقىل چوڭ مودېلى بولسا ئەڭ ئاساسىي دەرىجىدىكى ئۈنۈمگە ئېرىشىش ئۈچۈن مىليونلىغان سانلىق مەلۇمات نۇقتىسىنى تەلەپ قىلىدۇ. سۆزنى ئازراق ئۆزگەرتكەن تەقدىردىمۇ ، بۇ نېگىزلىك سوئاللارنى توغرا چۈشىنىشكە بولمايدۇ ، بۇ مودېلنىڭ ئەقلىي ئىقتىداردا ھەقىقىي ياخشىلانمىغانلىقىنى چۈشەندۈرۈپ بېرىدۇ: ماقالىنىڭ بېشىدا تىلغا ئېلىنغان ئاساسىي ، ئەمما ھەل قىلغىلى بولمايدىغان سوئاللار بۇ ھادىسىنىڭ ئېنىق مىسالى.

خۇلاسە

قانداقلا بولمىسۇن ، رەھىمسىز كۈچلەردىن ھالقىپ ، ئەگەر Grok3 ھەقىقەتەن كەسىپكە «ئالدىن تەربىيەلەنگەن مودېللار ئاخىرلىشىشقا ئاز قالدى» دەپ ئاشكارىلىسا ، بۇ ساھەگە مۇھىم تەسىرلەرنى ئېلىپ كېلىدۇ.

بەلكىم Grok3 ئەتراپىدىكى قاينام-تاشقىنلىق تەدرىجىي پەسەيگەندىن كېيىن ، بىز فېي فېي لىنىڭ «ئالاھىدە سانلىق مەلۇمات جەدۋىلىدە يۇقىرى ئىقتىدارلىق مودېللارنى ئاران 50 دوللار بىلەن تەڭشەش» مىسالىغا ئوخشاش تېخىمۇ كۆپ ئەھۋاللارغا شاھىت بولۇشىمىز مۇمكىن ، ئاخىرىدا AGI نىڭ ھەقىقىي يولىنى بايقىدۇق.