دیپ‌سیک چینی چیست و چرا لرزه بر اندام دنیای هوش مصنوعی انداخته است؟

استارت‌آپ چینی دیپ‌سیک (DeepSeek) که تنها کمی بیش از یک سال از تأسیس آن می‌گذرد، به‌تازگی با نمایش مدل‌های پیشرو در حوزه‌ی هوش مصنوعی توجه فراوانی را در سیلیکون‌ولی برانگیخته است؛ مدل‌هایی که عملکردشان با برترین چت‌بات‌های دنیا قابل قیاس است اما ظاهراً با هزینه‌ای بسیار کمتر توسعه می‌یابند. این اتفاق می‌تواند باور رایج را که گمان می‌کند آینده‌ی هوش مصنوعی مستلزم صرف انرژی و توان محاسباتی سرسام‌آوری است، به چالش بکشد.

هم‌زمان با شدت گرفتن هیاهوی مربوط به نوآوری دیپ‌سیک، سهام شرکت‌های فناوری در اواخر ژانویه سقوط کرد. دلیل این امر آن بود که سرمایه‌گذاران شروع به ارزیابی پیامدهای احتمالی دیپ‌سیک برای رقبای آمریکایی و تأمین‌کنندگان سخت‌افزار کردند.

آنچه خواهید خواند:

دیپ‌سیک دقیقاً چیست؟

دیپ‌سیک در سال ۲۰۲۳ به دست لیانگ ونفنگ، مدیر ارشد صندوق پوشش ریسک (هج فاند) مبتنی بر هوش مصنوعی به نام High-Flyer، بنیان‌گذاری شد. این شرکت روی مدل‌های هوش مصنوعی متن‌باز کار می‌کند، به این معنا که جامعه‌ی توسعه‌دهندگان می‌تواند کد آن را مشاهده و ارتقا دهد. اپلیکیشن موبایلی دیپ‌سیک که اوایل ژانویه عرضه شد، خیلی سریع به صدر فهرست دانلودهای آیفون در آمریکا راه یافت.

تمایز اصلی این اپ با چت‌بات‌هایی نظیر ChatGPT از شرکت OpenAI در این است که پیش از ارائه‌ی پاسخ، فرایند استدلال خود را توضیح می‌دهد. بنا به ادعای شرکت، نسخه‌ی R1 دیپ‌سیک عملکردی هم‌سطح جدیدترین محصول OpenAI دارد و هم‌زمان این امکان را در اختیار علاقه‌مندان قرار داده تا از زیرساخت آن برای توسعه‌ی چت‌بات‌های خود استفاده کنند.

دیپ‌سیک R1 در مقایسه با OpenAI یا Meta AI چگونه است؟

هرچند این شرکت هنوز جزییات دقیقی منتشر نکرده، اما شواهد حاکی است که هزینه‌ی آموزش و توسعه‌ی مدل‌های دیپ‌سیک کمتر از هزینه‌ی مورد نیاز برای محصولات برتر OpenAI یا متا است. این راندمان بالا تردیدهایی را درباره‌ی نیاز به صرف سرمایه‌های هنگفت برای خرید پردازنده‌ها و شتاب‌دهنده‌های پیشرفته‌ی هوش مصنوعی، نظیر محصولات انویدیا (Nvidia)، برانگیخته است.

همین موضوع توجه بیشتری را نیز به محدودیت‌های صادراتی ایالات متحده در زمینه‌ی نیم‌رساناهای پیشرفته به چین جلب می‌کند؛ محدودیت‌هایی که دقیقاً با هدف پیشگیری از موفقیت‌هایی همچون دستاوردهای دیپ‌سیک اعمال شده‌اند.

به گفته‌ی دیپ‌سیک، مدل R1 در چندین بنچمارک پیشروی دنیا – از جمله AIME 2024 برای وظایف ریاضی، MMLU برای سنجش دانش عمومی و AlpacaEval 2.0 برای ارزیابی توان پرسش‌وپاسخ – با رقبای هم‌تراز خود برابری می‌کند یا حتی از آن‌ها پیشی می‌گیرد. همچنین در فهرست Chatbot Arena که متعلق به دانشگاه برکلی (UC Berkeley) است، از برترین‌های این حوزه محسوب می‌شود.

بخوانید

تأثیر انقلابی هوش مصنوعی در معاملات فارکس؛ یک راهنمای جامع

چرا آمریکا نگران شده است؟

دولت آمریکا با هدف جلوگیری از پیشرفت‌های چین در زمینه‌ی هوش مصنوعی – که رقابتی کلیدی میان واشنگتن و پکن به شمار می‌رود – صادرات فناوری‌های پیشرفته، نظیر تراشه‌های گرافیکی (GPU)، به چین را ممنوع کرده است. اما پیشرفت دیپ‌سیک نشان می‌دهد که مهندسان هوش مصنوعی چینی با تأکید بر کارآمدی بیشتر در استفاده از منابع محدود، توانسته‌اند تا حدی از سد محدودیت‌های تجاری عبور کنند.

در حالی که همچنان مشخص نیست دیپ‌سیک به چه میزان سخت‌افزارهای پیشرفته برای آموزش مدل‌های هوش مصنوعی در اختیار داشته، عملکرد این شرکت ثابت می‌کند که ممنوعیت‌های صادراتی ایالات متحده تاکنون نتوانسته پیشرفت چین را به‌طور کامل متوقف کند.

دیپ‌سیک چه زمانی توجه جهانی را برانگیخت؟

از زمان عرضه‌ی نخستین مدل این شرکت در سال ۲۰۲۳، دیپ‌سیک به‌دقت زیر نظر فعالان حوزه‌ی هوش مصنوعی بوده است. در ماه نوامبر، این شرکت با معرفی مدل استدلالی DeepSeek R1 – که هدفش تقلید فرایند تفکر انسانی است – نگاه‌های بیشتری را به خود جلب کرد. مدل یادشده زیربنای چت‌بات موبایلی دیپ‌سیک را تشکیل می‌دهد و همراه با نسخه‌ی تحت‌وب آن، در ژانویه به‌عنوان جایگزینی بسیار مقرون‌به‌صرفه‌تر نسبت به محصولات OpenAI مطرح شد. سرمایه‌گذار معروف، مارک اندریسن، از این رویداد با عنوان «لحظه‌ی اسپوتنیک برای هوش مصنوعی» یاد کرده است.

اپلیکیشن موبایل DeepSeek تا تاریخ ۲۵ ژانویه ۱.۶ میلیون بار دانلود شد و بر اساس داده‌های مؤسسه رصد بازار App Figures، در فروشگاه‌های اپ آیفون در استرالیا، کانادا، چین، سنگاپور، ایالات متحده و بریتانیا به رتبه اول دست یافت.

مؤسس DeepSeek چه کسی است؟

لیانگ که در سال ۱۹۸۵ در استان گوانگدونگ متولد شده، مدارک کارشناسی و کارشناسی ارشد خود را در رشته مهندسی الکترونیک و اطلاعات از دانشگاه ژجیانگ دریافت کرده است. بر اساس داده‌های پایگاه اطلاعاتی Tianyancha، او شرکت DeepSeek را با سرمایه ثبت‌شده‌ای به مبلغ ۱۰ میلیون یوان (معادل ۱.۴ میلیون دلار) بنیان‌گذاری کرد.

بخوانید

ترامپ دستورالعمل اجرایی هوش مصنوعی بایدن را در روز تحلیف لغو کرد

لیانگ در مصاحبه‌ای با رسانه چینی 36kr اظهار داشت:

مانع اصلی پیشرفت‌های بیشتر، کمبود سرمایه نیست، بلکه محدودیت‌های ایالات متحده در دسترسی به بهترین تراشه‌هاست.

او توضیح داد که

اکثر پژوهشگران ارشد تیمش فارغ‌التحصیلان تازه‌کار از دانشگاه‌های تراز اول چین هستند و بر ضرورت ایجاد اکوسیستمی داخلی مشابه آنچه پیرامون تراشه‌های هوش مصنوعی انویدیا شکل گرفته، تأکید کرد.

وی افزود:

«افزایش سرمایه‌گذاری الزاماً به نوآوری بیشتر منجر نمی‌شود؛ در غیر این صورت، شرکت‌های بزرگ همه نوآوری‌ها را در اختیار می‌گرفتند.»

موقعیت DeepSeek در عرصه هوش مصنوعی چین چگونه است؟

غول‌های فناوری چین—از گروه علی‌بابا و بایدو گرفته تا تنسنت—مبالغ هنگفتی را برای خرید سخت‌افزار و جذب مشتریان در حوزه هوش مصنوعی سرمایه‌گذاری کرده‌اند. در این میان، استارتاپ 01.AI متعلق به کای-فو لی و همچنین DeepSeek با رویکرد متن‌باز خود متمایز شده‌اند؛ رویکردی که هدف آن، جذب سریع بیشترین تعداد کاربر و سپس تدوین راهبردهای درآمدزایی بر بستر این جامعه کاربری گسترده است.

از آنجا که مدل‌های DeepSeek مقرون‌به‌صرفه‌تر هستند، این شرکت تاکنون نقشی مهم در کاهش هزینه‌های توسعه هوش مصنوعی در چین ایفا کرده است؛ به‌ویژه در شرایطی که شرکت‌های بزرگ درگیر یک جنگ قیمتی شده‌اند و طی یک سال و نیم گذشته، چندین دور کاهش قیمت را تجربه کرده‌اند.

پیامدهای این موفقیت در بازار جهانی هوش مصنوعی چیست؟

موفقیت DeepSeek ممکن است شرکت‌هایی مانند OpenAI و سایر ارائه‌دهندگان آمریکایی را وادار کند برای حفظ جایگاه پیشتاز خود، قیمت‌هایشان را کاهش دهند. علاوه بر این، اگر مدل‌های کارآمدتر بتوانند با هزینه بسیار کمتری رقابت کنند، هزینه‌های هنگفت شرکت‌هایی نظیر متا و مایکروسافت—which هر یک امسال بیش از ۶۵ میلیارد دلار عمدتاً در زیرساخت‌های هوش مصنوعی سرمایه‌گذاری کرده‌اند—زیر سؤال می‌رود.

بخوانید

GPT-4 اوپن‌ای‌آی؛تحولی در هوش مصنوعی برای کسب و کار

این تحولات باعث نوسان در بازارهای سهام آسیا نیز شد؛ زیرا سرمایه‌گذاران به دنبال خرید سهام شرکت‌های چینی مرتبط با DeepSeek (مانند Iflytek) رفتند و هم‌زمان از سهام شرکت‌هایی در زنجیره تأمین تراشه نظیر Advantest فاصله گرفتند. دلیل این رفتار، احتمال کاهش تقاضای مورد انتظار برای نیمه‌رساناهای هوش مصنوعی است.

در حال حاضر، توسعه‌دهندگان در سراسر جهان سرگرم آزمایش نرم‌افزار DeepSeek هستند و قصد دارند ابزارهای جدیدی بر مبنای آن بسازند. این امر می‌تواند پذیرش مدل‌های پیشرفته استدلال هوش مصنوعی را شتاب ببخشد، اما در عین حال ممکن است نگرانی‌هایی درباره ضرورت اعمال قوانین و محدودیت‌های مرتبط با نحوه استفاده از این فناوری ایجاد کند. پیشرفت‌های DeepSeek همچنین ممکن است روند تدوین مقررات برای کنترل چگونگی توسعه هوش مصنوعی را سرعت بخشد.

نقاط ضعف DeepSeek چیست؟

مانند دیگر مدل‌های هوش مصنوعی چینی، DeepSeek در مورد موضوعاتی که در چین حساس تلقی می‌شوند، دست به خودسانسوری می‌زند. برای نمونه، پرسش‌ها درباره اعتراضات میدان تیان‌آن‌من در سال ۱۹۸۹ یا سوالات حساس ژئوپولیتیکی از جمله احتمال حمله چین به تایوان را نادیده می‌گیرد. در آزمایش‌ها، ربات DeepSeek قادر بود پاسخ‌های مفصل درباره چهره‌هایی مانند نارندرا مودی، نخست‌وزیر هند، ارائه دهد؛ اما درباره رئیس‌جمهور چین، شی جین‌پینگ، از پاسخگویی خودداری کرد.

از سوی دیگر، زیرساخت ابری DeepSeek نیز احتمالاً در پی محبوبیت ناگهانی‌اش با فشار بیشتری مواجه خواهد شد. این شرکت در تاریخ ۲۷ ژانویه با قطعی گسترده‌ای روبه‌رو شد و باید بتواند با افزایش حجم ترافیک ناشی از سیل پرسش‌های کاربران جدید و بازگشتی، سازگار شود تا از بروز اختلالات جدی‌تر جلوگیری کند.