استارتآپ چینی دیپسیک (DeepSeek) که تنها کمی بیش از یک سال از تأسیس آن میگذرد، بهتازگی با نمایش مدلهای پیشرو در حوزهی هوش مصنوعی توجه فراوانی را در سیلیکونولی برانگیخته است؛ مدلهایی که عملکردشان با برترین چتباتهای دنیا قابل قیاس است اما ظاهراً با هزینهای بسیار کمتر توسعه مییابند. این اتفاق میتواند باور رایج را که گمان میکند آیندهی هوش مصنوعی مستلزم صرف انرژی و توان محاسباتی سرسامآوری است، به چالش بکشد.
دیپسیک دقیقاً چیست؟
دیپسیک در سال ۲۰۲۳ به دست لیانگ ونفنگ، مدیر ارشد صندوق پوشش ریسک (هج فاند) مبتنی بر هوش مصنوعی به نام High-Flyer، بنیانگذاری شد. این شرکت روی مدلهای هوش مصنوعی متنباز کار میکند، به این معنا که جامعهی توسعهدهندگان میتواند کد آن را مشاهده و ارتقا دهد. اپلیکیشن موبایلی دیپسیک که اوایل ژانویه عرضه شد، خیلی سریع به صدر فهرست دانلودهای آیفون در آمریکا راه یافت.
تمایز اصلی این اپ با چتباتهایی نظیر ChatGPT از شرکت OpenAI در این است که پیش از ارائهی پاسخ، فرایند استدلال خود را توضیح میدهد. بنا به ادعای شرکت، نسخهی R1 دیپسیک عملکردی همسطح جدیدترین محصول OpenAI دارد و همزمان این امکان را در اختیار علاقهمندان قرار داده تا از زیرساخت آن برای توسعهی چتباتهای خود استفاده کنند.
دیپسیک R1 در مقایسه با OpenAI یا Meta AI چگونه است؟
هرچند این شرکت هنوز جزییات دقیقی منتشر نکرده، اما شواهد حاکی است که هزینهی آموزش و توسعهی مدلهای دیپسیک کمتر از هزینهی مورد نیاز برای محصولات برتر OpenAI یا متا است. این راندمان بالا تردیدهایی را دربارهی نیاز به صرف سرمایههای هنگفت برای خرید پردازندهها و شتابدهندههای پیشرفتهی هوش مصنوعی، نظیر محصولات انویدیا (Nvidia)، برانگیخته است.
به گفتهی دیپسیک، مدل R1 در چندین بنچمارک پیشروی دنیا – از جمله AIME 2024 برای وظایف ریاضی، MMLU برای سنجش دانش عمومی و AlpacaEval 2.0 برای ارزیابی توان پرسشوپاسخ – با رقبای همتراز خود برابری میکند یا حتی از آنها پیشی میگیرد. همچنین در فهرست Chatbot Arena که متعلق به دانشگاه برکلی (UC Berkeley) است، از برترینهای این حوزه محسوب میشود.
![دیپسیک R1 در مقایسه با سایر مدل ها](https://nabzarz.com/wp-content/uploads/2025/01/ds-1024x529.png)
چرا آمریکا نگران شده است؟
دولت آمریکا با هدف جلوگیری از پیشرفتهای چین در زمینهی هوش مصنوعی – که رقابتی کلیدی میان واشنگتن و پکن به شمار میرود – صادرات فناوریهای پیشرفته، نظیر تراشههای گرافیکی (GPU)، به چین را ممنوع کرده است. اما پیشرفت دیپسیک نشان میدهد که مهندسان هوش مصنوعی چینی با تأکید بر کارآمدی بیشتر در استفاده از منابع محدود، توانستهاند تا حدی از سد محدودیتهای تجاری عبور کنند.
در حالی که همچنان مشخص نیست دیپسیک به چه میزان سختافزارهای پیشرفته برای آموزش مدلهای هوش مصنوعی در اختیار داشته، عملکرد این شرکت ثابت میکند که ممنوعیتهای صادراتی ایالات متحده تاکنون نتوانسته پیشرفت چین را بهطور کامل متوقف کند.
دیپسیک چه زمانی توجه جهانی را برانگیخت؟
از زمان عرضهی نخستین مدل این شرکت در سال ۲۰۲۳، دیپسیک بهدقت زیر نظر فعالان حوزهی هوش مصنوعی بوده است. در ماه نوامبر، این شرکت با معرفی مدل استدلالی DeepSeek R1 – که هدفش تقلید فرایند تفکر انسانی است – نگاههای بیشتری را به خود جلب کرد. مدل یادشده زیربنای چتبات موبایلی دیپسیک را تشکیل میدهد و همراه با نسخهی تحتوب آن، در ژانویه بهعنوان جایگزینی بسیار مقرونبهصرفهتر نسبت به محصولات OpenAI مطرح شد. سرمایهگذار معروف، مارک اندریسن، از این رویداد با عنوان «لحظهی اسپوتنیک برای هوش مصنوعی» یاد کرده است.
مؤسس DeepSeek چه کسی است؟
لیانگ که در سال ۱۹۸۵ در استان گوانگدونگ متولد شده، مدارک کارشناسی و کارشناسی ارشد خود را در رشته مهندسی الکترونیک و اطلاعات از دانشگاه ژجیانگ دریافت کرده است. بر اساس دادههای پایگاه اطلاعاتی Tianyancha، او شرکت DeepSeek را با سرمایه ثبتشدهای به مبلغ ۱۰ میلیون یوان (معادل ۱.۴ میلیون دلار) بنیانگذاری کرد.
لیانگ در مصاحبهای با رسانه چینی 36kr اظهار داشت:
مانع اصلی پیشرفتهای بیشتر، کمبود سرمایه نیست، بلکه محدودیتهای ایالات متحده در دسترسی به بهترین تراشههاست.
او توضیح داد که
اکثر پژوهشگران ارشد تیمش فارغالتحصیلان تازهکار از دانشگاههای تراز اول چین هستند و بر ضرورت ایجاد اکوسیستمی داخلی مشابه آنچه پیرامون تراشههای هوش مصنوعی انویدیا شکل گرفته، تأکید کرد.
وی افزود:
«افزایش سرمایهگذاری الزاماً به نوآوری بیشتر منجر نمیشود؛ در غیر این صورت، شرکتهای بزرگ همه نوآوریها را در اختیار میگرفتند.»
موقعیت DeepSeek در عرصه هوش مصنوعی چین چگونه است؟
غولهای فناوری چین—از گروه علیبابا و بایدو گرفته تا تنسنت—مبالغ هنگفتی را برای خرید سختافزار و جذب مشتریان در حوزه هوش مصنوعی سرمایهگذاری کردهاند. در این میان، استارتاپ 01.AI متعلق به کای-فو لی و همچنین DeepSeek با رویکرد متنباز خود متمایز شدهاند؛ رویکردی که هدف آن، جذب سریع بیشترین تعداد کاربر و سپس تدوین راهبردهای درآمدزایی بر بستر این جامعه کاربری گسترده است.
از آنجا که مدلهای DeepSeek مقرونبهصرفهتر هستند، این شرکت تاکنون نقشی مهم در کاهش هزینههای توسعه هوش مصنوعی در چین ایفا کرده است؛ بهویژه در شرایطی که شرکتهای بزرگ درگیر یک جنگ قیمتی شدهاند و طی یک سال و نیم گذشته، چندین دور کاهش قیمت را تجربه کردهاند.
پیامدهای این موفقیت در بازار جهانی هوش مصنوعی چیست؟
موفقیت DeepSeek ممکن است شرکتهایی مانند OpenAI و سایر ارائهدهندگان آمریکایی را وادار کند برای حفظ جایگاه پیشتاز خود، قیمتهایشان را کاهش دهند. علاوه بر این، اگر مدلهای کارآمدتر بتوانند با هزینه بسیار کمتری رقابت کنند، هزینههای هنگفت شرکتهایی نظیر متا و مایکروسافت—which هر یک امسال بیش از ۶۵ میلیارد دلار عمدتاً در زیرساختهای هوش مصنوعی سرمایهگذاری کردهاند—زیر سؤال میرود.
این تحولات باعث نوسان در بازارهای سهام آسیا نیز شد؛ زیرا سرمایهگذاران به دنبال خرید سهام شرکتهای چینی مرتبط با DeepSeek (مانند Iflytek) رفتند و همزمان از سهام شرکتهایی در زنجیره تأمین تراشه نظیر Advantest فاصله گرفتند. دلیل این رفتار، احتمال کاهش تقاضای مورد انتظار برای نیمهرساناهای هوش مصنوعی است.
در حال حاضر، توسعهدهندگان در سراسر جهان سرگرم آزمایش نرمافزار DeepSeek هستند و قصد دارند ابزارهای جدیدی بر مبنای آن بسازند. این امر میتواند پذیرش مدلهای پیشرفته استدلال هوش مصنوعی را شتاب ببخشد، اما در عین حال ممکن است نگرانیهایی درباره ضرورت اعمال قوانین و محدودیتهای مرتبط با نحوه استفاده از این فناوری ایجاد کند. پیشرفتهای DeepSeek همچنین ممکن است روند تدوین مقررات برای کنترل چگونگی توسعه هوش مصنوعی را سرعت بخشد.
نقاط ضعف DeepSeek چیست؟
مانند دیگر مدلهای هوش مصنوعی چینی، DeepSeek در مورد موضوعاتی که در چین حساس تلقی میشوند، دست به خودسانسوری میزند. برای نمونه، پرسشها درباره اعتراضات میدان تیانآنمن در سال ۱۹۸۹ یا سوالات حساس ژئوپولیتیکی از جمله احتمال حمله چین به تایوان را نادیده میگیرد. در آزمایشها، ربات DeepSeek قادر بود پاسخهای مفصل درباره چهرههایی مانند نارندرا مودی، نخستوزیر هند، ارائه دهد؛ اما درباره رئیسجمهور چین، شی جینپینگ، از پاسخگویی خودداری کرد.
از سوی دیگر، زیرساخت ابری DeepSeek نیز احتمالاً در پی محبوبیت ناگهانیاش با فشار بیشتری مواجه خواهد شد. این شرکت در تاریخ ۲۷ ژانویه با قطعی گستردهای روبهرو شد و باید بتواند با افزایش حجم ترافیک ناشی از سیل پرسشهای کاربران جدید و بازگشتی، سازگار شود تا از بروز اختلالات جدیتر جلوگیری کند.