दीपसेक वायरल हो गया है।
चीनी एआई लैब डीपसेक इस सप्ताह मुख्यधारा की चेतना में टूट गया, जब उसके चैटबॉट ऐप ऐप्पल ऐप स्टोर चार्ट (और Google Play, साथ ही) के शीर्ष पर पहुंच गए। दीपसेक के एआई मॉडल, जिन्हें गणना-कुशल तकनीकों का उपयोग करके प्रशिक्षित किया गया था, ने वॉल स्ट्रीट विश्लेषकों-और प्रौद्योगिकीविदों का नेतृत्व किया है-यह सवाल करने के लिए कि क्या अमेरिका एआई दौड़ में अपनी बढ़त बनाए रख सकता है और क्या एआई चिप्स की मांग बनाए रखेगी।
लेकिन दीपसेक कहां से आया, और यह इतनी जल्दी अंतर्राष्ट्रीय प्रसिद्धि के लिए कैसे बढ़ा?
दीपसेक के व्यापारी मूल
दीपसेक उच्च-फ्लाइर कैपिटल मैनेजमेंट द्वारा समर्थित है, एक चीनी मात्रात्मक हेज फंड जो अपने व्यापारिक निर्णयों को सूचित करने के लिए एआई का उपयोग करता है।
एआई उत्साही लिआंग वेनफेंग ने 2015 में हाई-फ्लायर की सह-स्थापना की। वेनफेंग, जिन्होंने कथित तौर पर व्यापार में डबिंग करना शुरू किया, जबकि झेजियांग विश्वविद्यालय में एक छात्र ने 2019 में हेज फंड के रूप में उच्च-फ्लाइर कैपिटल मैनेजमेंट को लॉन्च किया, जो एआई एल्गोरिदम को विकसित करने और तैनात करने पर केंद्रित था।
2023 में, हाई-फ्लाइर ने डीपसेक को अपने वित्तीय व्यवसाय से अलग एआई टूल्स पर शोध करने के लिए समर्पित एक प्रयोगशाला के रूप में शुरू किया। अपने निवेशकों में से एक के रूप में हाई-फ्लायर के साथ, लैब अपनी कंपनी में बंद हो गया, जिसे दीपसेक भी कहा जाता है।
पहले दिन से, डीपसेक ने मॉडल प्रशिक्षण के लिए अपने स्वयं के डेटा सेंटर क्लस्टर का निर्माण किया। लेकिन चीन की अन्य एआई कंपनियों की तरह, डीपसेक हार्डवेयर पर यूएस एक्सपोर्ट बैन से प्रभावित हुआ है। अपने हाल के मॉडलों में से एक को प्रशिक्षित करने के लिए, कंपनी को NVIDIA H800 चिप्स का उपयोग करने के लिए मजबूर किया गया था, जो एक चिप का कम शक्तिशाली संस्करण, H100, अमेरिकी कंपनियों के लिए उपलब्ध है।
दीपसेक की तकनीकी टीम को कमज़ोर युवा कहा जाता है। कंपनी कथित तौर पर आक्रामक रूप से भर्ती शीर्ष चीनी विश्वविद्यालयों के डॉक्टरेट एआई शोधकर्ताओं। दीपसेक भी बिना किसी कंप्यूटर विज्ञान पृष्ठभूमि के लोगों को काम पर रखता है न्यूयॉर्क टाइम्स के अनुसार, अपनी तकनीक को बेहतर ढंग से विषयों की एक विस्तृत श्रृंखला को समझने में मदद करने के लिए।
दीपसेक के मजबूत मॉडल
दीपसेक ने नवंबर 2023 में अपने मॉडल-डीपसेक कोडर, डीपसेक एलएलएम और डीपसेक चैट के अपने पहले सेट का अनावरण किया। लेकिन यह पिछले वसंत तक नहीं था, जब स्टार्टअप ने अपने अगले-जीन डीपसेक-वी 2 को मॉडल के परिवार को जारी किया, कि एआई उद्योग ने नोटिस लेना शुरू कर दिया।
दीपसेक-वी 2, एक सामान्य-उद्देश्य पाठ- और छवि-एनालिजिंग सिस्टम, विभिन्न एआई बेंचमार्क में अच्छा प्रदर्शन किया-और उस समय तुलनीय मॉडल की तुलना में चलाने के लिए बहुत सस्ता था। इसने डीपसेक की घरेलू प्रतिस्पर्धा को अपने कुछ मॉडलों के लिए उपयोग की कीमतों में कटौती करने और दूसरों को पूरी तरह से मुक्त करने के लिए, बाईडेंस और अलीबाबा सहित, को मजबूर किया।
डीपसेक-वी 3, दिसंबर 2024 में लॉन्च किया गया, केवल डीपसेक की कुख्याति में जोड़ा गया।
दीपसेक के आंतरिक बेंचमार्क परीक्षण के अनुसार, डीपसेक वी 3 दोनों को डाउनलोड करने योग्य, खुले तौर पर उपलब्ध मॉडल जैसे मेटा के लामा और “बंद” मॉडल से बेहतर प्रदर्शन करते हैं, जो केवल एक एपीआई के माध्यम से एक्सेस किया जा सकता है, जैसे कि ओपनईआई के जीपीटी -4 ओ।
समान रूप से प्रभावशाली डीपसेक का आर 1 “रीज़निंग” मॉडल है। जनवरी में जारी, डीपसेक का दावा है कि आर 1 के साथ -साथ ओपनईआई के ओ 1 मॉडल को प्रमुख बेंचमार्क पर भी प्रदर्शन करता है।
एक तर्क मॉडल होने के नाते, R1 प्रभावी रूप से तथ्य-जाँच करता है, जो इसे कुछ नुकसान से बचने में मदद करता है जो सामान्य रूप से मॉडल की यात्रा करते हैं। रीजनिंग मॉडल थोड़ा अधिक समय लेते हैं-आमतौर पर कुछ मिनटों तक लंबे समय तक-एक विशिष्ट गैर-रेनिंग मॉडल की तुलना में समाधान पर पहुंचने के लिए। उल्टा यह है कि वे भौतिकी, विज्ञान और गणित जैसे डोमेन में अधिक विश्वसनीय होते हैं।
हालांकि, R1, DeepSeek V3, और DeePseek के अन्य मॉडलों के लिए एक नकारात्मक पहलू है। चीनी-विकसित एआई होने के नाते, वे अधीन हैं बेंच मार्किंग चीन के इंटरनेट नियामक द्वारा यह सुनिश्चित करने के लिए कि इसकी प्रतिक्रियाएं “कोर समाजवादी मूल्यों को मूर्त रूप देती हैं।” उदाहरण के लिए, डीपसेक के चैटबॉट ऐप में, आर 1 तियानमेन स्क्वायर या ताइवान की स्वायत्तता के बारे में सवालों के जवाब नहीं देगा।
मार्च में, दीपसेक ने 16.5 मिलियन की यात्राओं को पार कर लिया। “(एफ) या मार्च, डीपसेक दूसरे स्थान पर है, ट्रैफिक ड्रॉप 25% देखने के बावजूद, जहां से फरवरी में यह दैनिक यात्राओं के आधार पर था,” इसीव्यूब के संपादक डेविड कार ने TechCrunch को बताया। यह अभी भी CHATGPT की तुलना में तालमेल करता है, जो मार्च में 500 मिलियन साप्ताहिक सक्रिय उपयोगकर्ताओं को बढ़ाता है।
एक विघटनकारी दृष्टिकोण
यदि दीपसेक के पास एक व्यवसाय मॉडल है, तो यह स्पष्ट नहीं है कि वह मॉडल क्या है, बिल्कुल। कंपनी अपने उत्पादों और सेवाओं की कीमतों में अच्छी तरह से बाजार मूल्य से कम है – और दूसरों को मुफ्त में देती है। वीसी ब्याज के एक टन के बावजूद, यह निवेशक के पैसे भी नहीं ले रहा है।
जिस तरह से दीपसेक इसे बताता है, दक्षता सफलताओं ने इसे अत्यधिक लागत प्रतिस्पर्धा बनाए रखने में सक्षम बनाया है। कुछ विशेषज्ञ विवाद हालांकि कंपनी ने जो आंकड़े आपूर्ति की हैं।
जो भी मामला हो, डेवलपर्स ने डीपसेक के मॉडल में ले जाया है, जो खुले स्रोत नहीं हैं क्योंकि वाक्यांश आमतौर पर समझा जाता है, लेकिन अनुमेय लाइसेंस के तहत उपलब्ध हैं जो वाणिज्यिक उपयोग के लिए अनुमति देते हैं। क्लेम डेलंग्यू के अनुसार, गले लगाने वाले चेहरे के सीईओ, डीपसेक के मॉडल की मेजबानी करने वाले प्लेटफार्मों में से एक, हगिंग फेस पर डेवलपर्स ने आर 1 के 500 से अधिक “व्युत्पन्न” मॉडल बनाए हैं इसने 2.5 मिलियन डाउनलोड किए हैं।
बड़े और अधिक स्थापित प्रतिद्वंद्वियों के खिलाफ दीपसेक की सफलता रही है “एआई” के रूप में वर्णित है और “ओवर-हाइप्ड।” कंपनी की सफलता कम से कम NVIDIA के शेयर की कीमत के कारण जनवरी में 18% की गिरावट के लिए जिम्मेदार थी, और इसके लिए एक सार्वजनिक प्रतिक्रिया प्राप्त करना Openai के सीईओ सैम अल्टमैन से। मार्च में, अमेरिकी वाणिज्य विभाग ब्यूरो ने कर्मचारियों को बताया कि दीपसेक को उनके सरकारी उपकरणों पर प्रतिबंधित कर दिया जाएगारायटर के अनुसार।
Microsoft ने घोषणा की कि DeepSeek अपनी Azure AI फाउंड्री सेवा पर उपलब्ध है, Microsoft का मंच जो एक बैनर के तहत उद्यमों के लिए AI सेवाओं को एक साथ लाता है। अपनी पहली तिमाही की कमाई के दौरान मेटा के एआई खर्च पर दीपसेक के प्रभाव के बारे में पूछे जाने पर, सीईओ मार्क जुकरबर्ग ने कहा कि एआई इन्फ्रास्ट्रक्चर पर खर्च मेटा के लिए “रणनीतिक लाभ” जारी रहेगा। मार्च में, ओपनई ने दीपसेक को “राज्य-सब्सिडी” और “राज्य-नियंत्रित” कहा, और अनुशंसा की कि अमेरिकी सरकार डीपसेक से मॉडल पर प्रतिबंध लगाने पर विचार करती है।
एनवीडिया की चौथी तिमाही के आय कॉल के दौरान, सीईओ जेन्सेन हुआंग ने दीपसेक के “उत्कृष्ट नवाचार” पर जोर देते हुए कहा कि यह और अन्य “तर्क” मॉडल एनवीडिया के लिए महान हैं क्योंकि उन्हें इतनी अधिक गणना की आवश्यकता है।
इसी समय, कुछ कंपनियां डीपसेक पर प्रतिबंध लगा रही हैं, और इसलिए पूरे हैं देशों और दक्षिण कोरिया सहित सरकारें। न्यूयॉर्क राज्य भी सरकारी उपकरणों पर इस्तेमाल किए जाने से दीपसेक पर प्रतिबंध लगा दिया।
दीपसेक का भविष्य क्या हो सकता है, यह स्पष्ट नहीं है। बेहतर मॉडल एक दिए गए हैं। लेकिन अमेरिकी सरकार प्रतीत होती है यह हानिकारक विदेशी प्रभाव के रूप में क्या मानता है, इसकी सावधानी बरती। मार्च में, वॉल स्ट्रीट जर्नल ने बताया कि अमेरिका की संभावना सरकारी उपकरणों पर दीपसेक पर प्रतिबंध लगाएगी।
यह कहानी मूल रूप से 28 जनवरी, 2025 को प्रकाशित की गई थी, और इसे नियमित रूप से अपडेट किया जाएगा।