Çinə məxsus olan DeepSeek şirkəti son zamanlarda AI dünyasında böyük qəzəb yaradaraq, öz R1 modelini 20 yanvar tarixində buraxdıqdan sonra nəhəng şəkildə gəlmis kimi görünür. DeepSeek hazırda iPhon’un App Store-da aparıcı tərəfdən yayılan bir proqramdır. Şirkətin son LLM-ləri olan DeepSeek-V3 və DeepSeek-R1 rakipləri olan ChatGPT-4o və ChatGPT-o1 ilə mübarizə aparaq, API bağlantıları üçün rəqabətçi qiymətlər təklif edir. Məlum olduğu kimi, son vaxtlarda TikTok ətrafında yaranan qanuni münaqişə verən məlumatların Çin dövlətinin əlində düşə biləcəyindən narahatlıq ifadə edən təhlükəkar ekspertlər var. DeepSeek zaten bir neçə “zəruri hücumla” üzləşib və xidməti dayandırmışdır ki, bu da onların kimin qeydiyyatdan keçə biləcəyini məhdudlaşdırır. Qapalılıqla əlaqədar son xəbərləri canlı bloqumuzda oxuyun.
DeepSeek nədir?
DeepSeek, Liang Wenfeng tərəfindən 2023-cü ilin mayında təsis edilmiş olan və həm qeyri-konsistent olan rəqabətlər ilə müqayisədə sərin qiymətləndirmə təklif edən İncək olan DeepSeek-V3 və DeepSeek-R1 LLM-lərinin adıdır. Şirkətin ilk məhsulu DeepSeek Coder, 2023-cü ilin noyabrında buraxıldı. DeepSeek-V2 isə qiymət saxlayan bir qiymətləndirmə planı ilə May 2024-cü ildə tələbələrə zərbə endirən Çin AI bazarında dayandı.
Buradan əldə etmək olar ki, DeepSeek’in cərəyan LLM modelləri müqavimətli test nöqtələrinə malikdir və fəallıq yoluyla əldə edilmiş resursların xeyli az istifadə edilməsinin səbəbindən çox az resurs istifadə etdiklərindən istifadə edir. DeepSeek-V3, əksinə, DeepSeek-R1 məntiq tapşırıqlarına yönəldir. DeepSeek yeni sürətlə LLM-lər inkişaf etdirə də, özü-tərəzilik etmə əqidəsini tətbiq edərək qüvvə yordamı ilə təlim prosesindən istifadə edir. Yəni əsasən, DeepSeek’in LLM modelləri insan öyrənməsi kimi öyrənir, əməllərinə əsaslanan feedback alaraq. Onlar ayrıca MoE (Mixture-of-Experts) memarlığını istifadə edirlər, beləliklə hər bir vaxt ancaq parametrlərin balacasını fəaliyyətə keçirirlər, ki, bu da hesablama xərclərini ciddi bir şəkildə azaldır və onları daha effektiv edir.