استخراج ۳۰۰ ترابایتی داده از آرشیو Spotify
در پایان سال ۲۰۲۵ خبر عجیبی درباره Spotify، یکی از بزرگترین سرویسهای پخش موسیقی آنلاین، منتشر شده است: گزارشی از یک پروژه استخراج داده عظیم — scrape حدود ۳۰۰ ترابایت اطلاعات موسیقی و متادیتا از آرشیو این پلتفرم منتشر شده است.
براساس این گزارش، دادههای «scrape» شامل موارد زیر هستند:
-
۲۵۶ میلیون ردیف متادیتا (اطلاعات درباره آهنگها مثل نام آهنگ، هنرمند، آلبوم و…)
-
۸۶ میلیون فایل صوتی که مربوط به محبوبترین آهنگهای Spotify است
-
حجم کل این مجموعه حدود ۳۰۰ ترابایت و در قالب تورنیتهای P2P برای اشتراکگذاری منتشر شده است.
Spotify تأیید کرد که این اتفاق رخ داده و اعلام کرد دستگاههای مسئول استخراج از روشهای غیرمجاز برای دسترسی به برخی از فایلهای صوتی و متادیتا استفاده کردند. شرکت گفته که در حال تحقیق و فعالانه بررسی این موضوع است.
جزئیات استخراج ۳۰۰ ترابایتی داده از آرشیو Spotify
گروهی به نام Anna’s Archive که بیشتر بهخاطر جمعآوری و آرشیو کتابها و اسناد علمی شناخته میشود، اعلام کرده که توانسته راهی برای استخراج بخش بزرگی از آرشیو Spotify پیدا کند و آن را بهعنوان چیزی که میگوید یک «آرشیو حفاظت از موسیقی» است منتشر کند.
طبق گفته این گروه:
-
فایلهای صوتی ۸۶ میلیون آهنگ، که حدود ۳۷٪ کل آهنگهای Spotify را تشکیل میدهند (ولی حدود ۹۹.۶٪ از تعداد کل شنیدهشدنها یعنی محبوبترینها را پوشش میدهند) استخراج شدهاند.
-
همچنین متادیتا (آلبوم، هنرمند، اطلاعات دیگر) برای حدود ۲۵۶ میلیون آهنگ منتشر شده است.
-
این گروه مدعی است که قصد دارد این مجموعه عظیم را بهعنوان «اولین آرشیو جهان برای حفاظت از موسیقی» در دسترس عموم قرار دهد.
البته Spotify تصریح کرده که برخی از این فایلها با روشهایی دورزدن حفاظت DRM (مدیریت حقوق دیجیتال) بهدست آمدهاند و شرکت آنها را متوقف و حسابهای مربوطه را غیر فعال کرده است.
آیا کاربران باید نگران باشند؟
طبق تأیید Spotify، هیچ نشانهای وجود ندارد که اطلاعات خصوصی کاربران، مثل رمز عبور یا دادههای مالی، فاش شده باشد. مواردی که استخراج شده بیشتر اطلاعات عمومی و بخشهایی از کتابخانه موسیقی است که در دسترس همه قرار دارد، ولی بهصورت یکجا و قابل دانلود منتشر شده است.
در حال حاضر به نظر نمیرسد لیستهای پخش یا پلیلیستهای شخصی کاربران تغییر کرده یا حذف شده باشند، و Spotify اعلام کرده که اقدامات امنیتی جدیدی برای جلوگیری از حوادث مشابه در آینده اتخاذ کرده است.
اهمیت و پیامدهای این واقعه
این موضوع چند نکته مهم دارد:
-
با اینکه دادههای استخراجشده حجم بسیار بزرگی دارند، فایلهای صوتی هنوز بهطور کامل منتشر نشدهاند (فعلاً متادیتا عمومیتر شده است).
-
این اتفاق نشاندهنده آسیبپذیری سیستمهای پخش موسیقی عظیم آنلاین است، بهخصوص وقتی صحبت از پایگاه دادهای با میلیاردها قطعه موسیقی میشود.
-
گروههای ثالث ممکن است سعی کنند این دادهها را برای مقاصد مختلف بهکار ببرند از جمله ایجاد سرویسهای پخش موسیقی غیرمجاز، یا حتی استفاده در پروژههای آموزشی/AI که میتواند پیامدهای حقوقی و تجاری گسترده داشته باشد.
پرسشهای متداول
1- آیا رمز عبور یا اطلاعات شخصی کاربران Spotify لو رفته؟
تا این لحظه هیچ نشانهای از نشت اطلاعات خصوصی کاربران مثل رمز عبور یا دادههای مالی وجود ندارد و موضوع بیشتر مربوط به آرشیو موسیقی و دادههای عمومی است.
2- دادههای استخراجشده شامل چه مواردی هستند؟
این استخراج شامل ۲۵۶ میلیون ردیف متادیتا آهنگها و ۸۶ میلیون فایل صوتی محبوب (بخشی از آرشیو موسیقی) است که مجموعاً حدود ۳۰۰ ترابایت حجم دارند.
3- آیا این دادهها قابل استفاده هستند؟
گروه منتشرکننده این دادهها تلاش دارد آن را بهصورت تورنت منتشر کند، اما استفاده از آنها بهطور بالقوه نقض قوانین حق نشر محسوب میشود و Spotify و دیگر شرکتها با آن مقابله خواهند کرد.
4- آیا فایلهای صوتی کامل موسیقی منتشر شدهاند؟
فعلاً بخش قابل استفاده عمومی بیشتر متادیتا و اطلاعات آهنگها است، و انتشار فایلهای صوتی کامل ممکن است مرحله بعدی باشد.

محمد عسکری هستم . سئو کار ، کارشناس و نویسنده ی وبسایت پارس دیجی . از سال 1403 شروع به نوشتن ، تحقیق و ترجمه مطالب در حوزه ی تکنولوژی ، دیجیتال و گجت های تکنولوژی کردم و به این حوزه خیلی علاقه مند هستم.
نظرات کاربران