DeepSeek дүрбелеңі: ЖИ нарығындағы жаңа ойыншы қалай ережені өзгертті
АСТАНА. KAZINFORM — Қаңтар айында жарыққа шыққан қытайлық DeepSeek стартапының жаңа әзірлемесі ЖИ нарығын дүр сілкіндірді. Қосымша іске қосылысымен санаулы сағаттарда App Store-дағы ең көп жүктелген тегін бағдарламалардың ТОП-5 тізіміне енді.

Бұның салдарынан АҚШ-тың кейбір технологиялық компаниялары акцияларының бағасы құлдырап кеткен. Kazinform меншікті тілшісі DeepSeek-тің қандай құпиясы барын зерделеп көрді.
DeepSeek деген не?
DeepSeek Artificial Intelligence Fundamental Technology Research Co., Ltd. компаниясы 2023 жылы шілде айында құрылған. Инновациялық технологиялық стартап «озық үлкен тілдік модельдерді» (LLM) және соған қатысты технологияларды жасаумен айналысады.
Xinhua мәліметінше, өткен жылдың қаңтарында өзінің алғашқы «DeepSeek LLM» моделін шығарғаннан бері компания интеграцияланудың бірнеше кезеңін басынан өткеріп үлгерген. 2024 жылдың желтоқсанында олар өзінің «V3» атты LLM ашық моделін шығарды. Америкалық БАҚ-тар ол «Meta компаниясының барлық LLM ашық модельдерін басып озып, тіпті OpenAI-дың GPT4-o жабық моделіне бәсекелестік танытқанын» жарыса жазды.
Ал қаңтарда шыққан DeepSeek-R1 жаңа моделі терең «оқыту» әдістемесін қолданудың арқасында маңызды технологиялық серпіліс жасады. Қарапайым тілмен айтқанда, ол ЖИ-ге «пайымдау» қабілетін бітірді.
Chain-of-Thought (CoT) және Supervised Fine-Tuning (SFT) секілді дәстүрлі жолмен жүрмей, DeepSeek Reinforcement Learning (RL) әдістемесін негізгі әдістеме ретінде алу арқылы ЖИ индустриясында өзгеше жүріс жасады.
Мәселен CoT пен SFT сатылы ойлау тәсіліне арқа сүйеп, ауқымды белгіленген мәліметтер арқылы жұмыс істейді. Ал RL қоршаған ортамен әрекеттесе отырып, модельдердің «оқуын» негізге алады. Бұл оны қиын әрі аяқасты берілген тапсырмаларға жауап таба алатын етеді.
RL-ді енгізу стартапқа өз модельдерінің ойлау, талдау қасиетін арттырып, тез бейімделе алатын нұсқаға айналдырды. Дәл осы артықшылығы оны өз саласында алдыңғы қатарға алып шықты.
V3 моделінің техникалық есебіне сүйенсек, DeepSeek-ті жасап шығу құны бар болғаны $5,57 млн. Бұл LLM жасау саласындағы ең төменгі баға.
Жаңа жасанды интеллектінің жарыққа шығуы қор нарығында жаппай сатылымдар санын күрт арттырып, соның салдарынан Nvidia, Broadcom және Oracle секілді америкалық ірі технологиялық компаниялар бар-жоғы 24 сағаттың ішінде 1 триллион доллар көлемінде шығынға ұшырады. Nvidia (NVDA) 596 млрд долларын жоғалтты.
Сондай-ақ DeepSeek-R жаңа моделі — бастапқы коды ашық нұсқа, ал OpenAI-дың бастапқы коды жабық, соған сай экожүйесі де күрделі.
Анықтама: Кез келген код әуелде ашық болады, «бастапқы коды жабық» деп тек кейбір адамға ғана, көп жағдайда бағрдарламаны әзірлеушілер үшін ашық нұсқаны айтады. Ашық кодтың артықшылығы сол, кез келген маман оның атқарушы файлдарын өз бетінше толықтыра алады және кодтың өзін де көре алады. Егер код жабық болса, қолданушыға тек атқарушы файл ғана қолжетімді болады.
DeepSeek-тің негізін қалаушы Лян Вэньфэн ашық кодтар негізінде ықпалдастықтың және инновацияның маңызына тоқтала келе, сенімді технологиялық экожүйе құру басты мақсаты екенін атап өтті.
— Біз жабық бастапқы кодты таңдамаймыз, — деген сөзін келтіреді Xinhua.
Кибершабуыл және қорғаныс
Жетістікке қол жеткізіп, кең танылғанына қарамастан DeepSeek жаңа қатерге жолықты. 27 қаңтар күні компанияға жаппай кибершабуыл жасалды. Соның кесірінен жаңа қолданушыларды тіркеуге уақытша шектеу қойылды. Ең қызығы шабуыл DeepSeek жүктеулер саны бойынша ChatGPT-ді басып озған сәтте басталған. Бұл техникалық қоғамдастықтық ішінде де, өзге ортада да дүрбелең туғызды.
Мәселе мұнымен біткен жоқ. Жақында Wiz киберқауіпсіздік сарапшылары DeepSeek-тің жүйесінде әжептәуір осал тұс барын анықтады. Қолданушының чаттағы хат алмасулары, API құпиялары секілді жеке деректері және серверлік бөліктің ерекше тұстарына қатысты мәліметтер ClickHouse мәліметтер базасында жарияланып кетті. Бұл қолданушының қауіпсіздігі мен деректерін қорғауға қатысты үлкен олқылық барын көрсетті. Яғни мәліметтер базасында қолданушының өзі екенін анықтамай-ақ (аутентификация жасамай-ақ) әрекеттерді басқару мүмкіндігі толықтай берілетіні білінді.
Осы мәліметтен соң АҚШ Конгресі өз қызметкерлеріне DeepSeek-ті пайдалануға тыйым салды.
Одан бөлек Еуропаның бірнеше елінде қосымшаны жүктеуге AppStore мен Google-дан өшіріп тастау арқылы шектеу қойылды және компаниядан қолданушылардың жеке деректері қалай өңделетіні жайлы мәлімет беру талап етілді.
Әлемдік ЖИ нарығындағы бәсекелестік
Қытайлық DeepSeek компаниясының R-1 және Janus-Pro модельдерінің шығуы технологиялық өндіріс саласындағы жағдай қалай күрт өзгеруі мүмкін екенін көрсетеді.
— Шамасы, ендігі жерде күштің теңгерімі екі негізгі ось бойында таласқа түсетін сыңайлы. Ол АҚШ пен Қытайдың, ашық код пен жабық кодтың арасы, — деген Google-дың бұрынғы бас директоры Эрик Шмид The Washington Post-қа берген пікірінде.
Оның айтуынша, «бұл ерекше сәт — қытайлық компания ашық бастапқы код саласында нақты көшбасшыға айналып жатқанда, ірі америкалық компаниялардың басым бөлігі, Мета-ны қоспағанда, өз әдістерін құпия сақтауды жалғастыруда. Бұл шын мәнінде Minimax сияқты стартаперлерден бастап, Alibaba сынды технологиялық алыптарға дейінгі қытайлық жасанды интеллект компанияларының өсіп келе жатқанын көрсететін үрдіс. Олар өздерінің ЖИ модельдерін бүкіл әлемдегі әзірлеушілерге еркін қолжетімді етіп отыр».
Эрик Шмидт атап өткендей, АҚШ әлемдегі ең мықты жабық модельдерге ие, алайда бәсекеге қабілеттілікті сақтау үшін ол әзірлеушілерді ашық бастапқы код экожүйесін дамытуға шақырды.
Ол сондай-ақ: «Ашық және жабық бастапқы коды бар ЖИ арасындағы, сондай-ақ АҚШ пен Қытай арасындағы технологиялық бәсекеде әлі айқын жеңімпаз жоқ. Егер DeepSeek әлдеқайда аз ресурстарды пайдалана отырып, америкалық ірі технологиялық компанияларға бәсекелестік тудырса, оларға деген қысым арта беретіні анық», — деп есептейді.
— Америкалық инновациялардың алға жылжуы тек ашық бастапқы кодтағы әзірлемелерді кеңейтуді ғана емес, сонымен қатар оқыту әдістерімен алмасуды ынталандыруды және ЖИ зерттеу мен әзірлеуге инвестицияларды ұлғайтуды қамтуы керек. Мұның жарқын мысалы — Ақ үйдің жақында жариялаған Stargate («Жұлдызды қақпа») жобасы, ол алдағы төрт жылда ЖИ инфрақұрылымына 500 миллиард доллар жұмсауды көздейді, — деп түйіндеді Шмидт.
SCMP басылымының хабарлауынша, ҚХР Мемлекеттік кеңесінің Премьері Ли Цян төрағалығымен 20 қаңтарда симпозиум өткен. Оған DeepSeek негізін қалауши Лян Вэньфэн технология, білім және ғылым саласындағы сарапшылар тобымен бірге қатысқан. Сол жиында Ли Цян ғылыми-техникалық инновациялар арқылы қалыптасатын экономиканың «жаңа өсім драйверлерін» адамдардың өмір сүру деңгейін қамтамасыз етуге және жақсартуға көмектесуі тиіс» деп мәлімдеді.
China International Capital Corp (CICC) мемлекеттік инвестициялық компаниясының мәліметінше, 2030 жылға қарай Қытайдың ЖИ нарығының көлемі 5,6 трлн юаньды ($765 млрд) құрайды. CICC болжамына сәйкес, 2025 жылдан бастап алты жыл ішінде Қытайдың жасанды интеллект индустриясына $1,4 трлн инвестиция құйылуы мүмкін.
Осыған дейін жасанды интеллект Қазақстанның еңбек нарығына қалай әсер ететіні туралы материал жариялаған едік.