دیپ سیک-پارس دیجی
بازدید 3

طوفان DeepSeek در بازار آمریکا | معرفی هوش مصنوعی DeepSeek

خبر جدیدی که اخیراٌ درباره شرکت چینی DeepSeek منتشر شده است گفته که مسیر هوش مصنوعی در ایالات متحده تنها راه هوش مصنوعی نیست.

دیپ سیک در بازار بورس آمریکا-پارس دیجی

هفته گذشته، شرکت نوپای چینی DeepSeek باعث شد تا بزرگان صنعت هوش مصنوعی در ایالات متحده از خواب بیدار شوند، زیرا این شرکت با مدل جدید خود، R1، رکوردی تریلیون دلاری از ارزش شرکت هایی چون Nvidia و OpenAI را از بین برد. دروازه بانان این فناوری به شدت نگران شده اند و این نگرانی کاملاٌ منطقی است، زیرا مدل DeepSeek نشان می دهد که نقشه راه پرهزینه فعلی دیگر تنها مسیر پیش رو نیست.

این تحول انقلابی به واسطه مدل جدید شرکت (DeepSeek-R19) است که از 10 ژانویه بر روی کامپیوترهای رومیزی و اخیراٌ برای گوشی های هوشمند در سراسر جهان عرضه شده است.

در هفته اخیر چه اتفاقی برای شرکت (DeepSeek) افتاده؟
شرکت DeepSeek تا چند هفته گذشته فناوری ارائه نمیاد، آخرین فناوری بعد از اینکه چت‌بات V3 این در 26 دسامبر منتشر شد و گزارش هایی از عملکرد مشابه آن با برترین های ایالات متحده مانند GPT‌ ها منتشر شد، چیزی که اکثر رسانه ها (از جمله ما) به آن توجه نکرده بودیم. با وجود سرعت بالای نوآوری های شرکت های بزرگ هوش مصنوعی آمریکایی، تصور نمی شد که این مدل زبان بزرگ که در بسیاری از جنبه ها متفاوت بود و بر روی کاغذ نیز چشمگیر به نظر می رسید، بتوانند بازار را مختل کنند.

اما همه چیز یک شبه تغییر کرد، در 27 ژانویه 2025 زمانی که چین شب قبل از شب سال نو قمری بیدار شد، DeepSeek به اپلیکیشن شماره 1 در دنیای هوش مصنوعیGPT تبدیل شد و قیمت سهام بزرگان این صنعت را به شدت کاهش داد علاوه بر Nvidia و OpenAI، شرکت هایی مانند Meta، شرکت مادر گوگل Alphabet، شرکای Nvidia از جمله Oracle و بسیاری دیگر از شرکت های فعال در حوزه انرژی و مراکز داده آسیب دیده اند. ایلان ماسک از این سقوط جان سالم به در برد زیرا X دیگر در بازار سهام نیست.

در حالی که کاهش بازار احتمالاٌ یک بحران موقتی است، DeepSeek مسیر زمانی هوش مصنوعی را به طور دائمی تغییر داده است. تا کنون، ایالات متحده در این زمینه پیشرو بوده و همه انتظار داشتند که فقط نسخه های ضعیف تری از مدل های استاندارد آن ها مشابه مشاهده شود. به همین دلیل است که DeepSeek جالب است، زیرا مسیر خود رادر این زمینه ایجاد کرده است و چین را به رقیب جدید در دیجیتال تبدیل کرده است.

چرا DeepSeek اینقدر متفاوت است؟
آنچه DeepSeek را متمایز می کند، تعدادی از ویژگی ها آن است. این مدل با استفاده از چیپ های قدیمی تر و ارزان تر Nvidia ساخته شده و تعدادی از مراحل پرهزینه ای که تا کنون استاندارد در توسعه چت بات ها بودند، کنار گذاشته شده است. به همین دلیل، هزینه توسعه مدل فقط 5.6 میلیون دلار برای اجاره سخت افزار مورد نیاز برای آموزش آن گزارش شده است، در حالی که برای مدل هایی مانند Llama 3.1 405B این هزینه حدود 60 میلیون دلار بوده که 11 برابر منابع محاسباتی بیشتری نیز مصرف کرده است. GPT-4 بیش از 100 میلیون دلار هزینه داشت. همچنین، مایکروسافت اعلام کرده که قصد دارد 80 میلیارد دلار برای توسعه هوش مصنوعی در سال 2025 هزینه کند. R1 همچنین منبع باز است که به جای اینکه به صورت مالکیتی و بسته نگه داشته شود، این مدل می تواند به راحتی در دسترس محققان قرار گیرد و به آن ها امکان استفاده و توسعه بیشتر بدهد.

بررسی چگونگی تولید مدل و مزایای آن
این مدل همچنین 680 میلیارد پارامتر دارد که آن را از بزرگ ترین مدل ها مانند Llama سری Meta با 405 میلیارد پارامتر جلوتر می برد. اما نکته مهم تر این است که DeepSeek مدل خود را با هزینه ای به مراتب کمتر از رقبای خود توسعه داده است. برای مقایسه، Llama 3.1 هزینه ای معادل 60 میلیون دلار داشت، در حالی که DeepSeek فقط 5.5 میلیون دلار برای ساخت مدل خود هزینه کرده است. این یعنی اکنون مدل های AI می توانند به همان کیفیت مدل های پیشرفته موجود، با هزینه بسیار کمتر تولید شوند.

 

آغاز DeepSeek
برای درک اهمیت DeepSeek باید به تاریخچه آن نگاه کنیم. بنیان گذار آن، تاجر کمی (quantitative) یا معامله گر کمی، Liang Wenfung، هزاران چیپ Nvidia را در سال 2021 خریداری کرده بوده است تا روی پروژه ای های جانبی خود برای کمک به شغل ها در رأس یکی از بزرگ ترین شرکت های صندوق های سرمایه گذاری چین، High-Flyer، به کار برده است. وی از این چیپ ها برای ساخت الگوریتم ها و مدل های ریاضی برای پیش بینی روند‌های بازار و هدایت سرمایه گذاری ها استفاده کرد و DeepSeek تنها در سال 2023 تأسیس شد.

 

مدل DeepSeek-R1 و مدل تجاری آن
این مدل جدید به خاطر نحوه آموزش خاص خود که از روش های سنتی در توسعه مدل های زبان بزرگ (LLM) عبور کرده و به جای استفاده از آموزش نظارت شده معمول، از فرآیند یادگیری تقویتی خالص برای تکامل خود استفاده کرده است، انقلاب بزرگی در این زمینه به راه انداخته است.

از سوی دیگر، DeepSeek مدل خود را به صورت open weight منتشر کرده است که به محققان اجازه می دهد از آن استفاده کرده و بر روی آن کار کنند، در حالی که مدل های پیشرفته بازار به صورت “جعبه سیاه” بسته باقی مانده اند.

این روش جدید به پژوهشگران کمک می کند که بدون نیاز به ساخت مدل های خود از صفر، از یک مدل موجود استفاده کنند. این مدل های رقیق شده DeepSeek برای استفاده محققانی با قدرت محاسباتی محدود نیز در دسترس قرار گرفته است.

حمله های سایبری و واکنش ها
در حالی که DeepSeek باعث سقوط بازار شده، با حملات سایبری مختلفی به سرورهای خود مواجه شده است. آن ها اعلام کرده اند که برای اطمینان از ادامه خدمات، به طور موقت ثبت نام ها را محدود کرده اند.

پاسخ ها و تبعات جهانی
در نهایت، این تغییرات به طور گسترده ای بر آینده فناوری و رقابت در عرصه هوش مصنوعی تأثیر می گذارد. آنچه که تا پیش از این، انحصار ایالات متحده به نظر می رسید، اکنون با ظهور DeepSeek به چالش کشیده شده و امکان دسترسی به این فناوری ها را برای سایر کشورها فراهم کرده است.

نتیجه‌گیری
ظهور DeepSeek یک لحظه تاریخی در انقلاب هوش مصنوعی است. اکنون، برای اولین بار در تاریخ این فناوری، کشوری غیر از ایالات متحده (چین) به یک رقیب جدی تبدیل شده است و آینده رقابت در این زمینه به شکلی کاملاً متفاوت از گذشته پیش خواهد رفت.

بخش تبلیغات

نظرات کاربران

  •  چنانچه دیدگاهی توهین آمیز باشد و متوجه نویسندگان و سایر کاربران باشد تایید نخواهد شد.
  •  چنانچه دیدگاه شما جنبه ی تبلیغاتی داشته باشد تایید نخواهد شد.
  •  چنانچه از لینک سایر وبسایت ها و یا وبسایت خود در دیدگاه استفاده کرده باشید تایید نخواهد شد.
  •  چنانچه در دیدگاه خود از شماره تماس، ایمیل و آیدی تلگرام استفاده کرده باشید تایید نخواهد شد.
  • چنانچه دیدگاهی بی ارتباط با موضوع آموزش مطرح شود تایید نخواهد شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *