روشی جدید برای کاهش مصرف انرژی ماهوارههای اینترنت اشیا در مدار لئو

اینترنت اشیا ماهوارهای مدتی است که بهعنوان تنها روش برای پوشش سراسری جهان بدون نیاز به زیرساختهای زمینی جانبی شناخته میشود؛ شبکهای متشکل از ماهوارهها در مدار لئو که در مقایسه با ماهوارههای مدار ژئو از قابلیت چرخش به دور زمین برخوردارند. اینترنت اشیا بهطورکلی به آن دسته از اشیا و تجهیزات محیط پیرامون بشر اشاره دارد که به شبکه اینترنت متصل شده و توسط برنامههای نرمافزاری موجود در تلفنهای هوشمند و تبلت قابل کنترل و مدیریت هستند. این فناوری به زبان ساده، ارتباط حسگرها و دستگاهها با شبکهای است که از طریق آن میتوانند با یکدیگر و با کاربرانشان تعامل کنند. چنین مفهومی میتواند بهسادگی ارتباط یک گوشی هوشمند با تلویزیون باشد، یا بهپیچیدگی نظارت بر زیرساختهای شهری و ترافیک؛ از ماشین لباسشویی و یخچال گرفته تا پوشاک. این شبکه بسیاری از دستگاههای اطراف ما را در برمیگیرد.
ماهوارههای مدار لئو همواره با سرعتی بالا به دور زمین در گردشاند؛ بهطوریکه یک منطقه را در مدت ۵ تا ۱۲ دقیقه در هر گذر خود پوشش میدهند و بدین ترتیب پویایی بالایی را برای دسترسی به شبکه فراهم میآورند. از طرفی منابع طیفهای فرکانسی برای این ماهوارهها بسیار محدود و کمتر از ۱۰ درصد ماهوارههای مدار ژئو است که ارائه یک طرح تخصیص منابع کارآمد برای اینترنت اشیا ماهوارهای بهمنظور استفاده کامل از ظرفیت چنین منابعی، در میان کارشناسان حوزه فضا بهعنوان موضوعی چالشبرانگیز درنظر گرفته میشود.
تمرکز طرحهای فعلی تخصیص منابع برای ماهوارهها بیشتر به مدار ژئو معطوف است و این طرحها بسیاری از مشکلات خاص ماهوارههای مدار لئو را در نظر نمیگیرند؛ از جمله انرژی محدود، خصوصیات حرکتی ماهوارهها، پویایی اتصالات ماهوارهای و مخابره دادهها. ازاینرو یک تیم پژوهشی طی مطالعهای مدلی مبتنیبر یادگیری تقویتی (Reinforcement learning) برای تخصیص موثر منابع اینترنت اشیا ماهوارهای در مدار لئو توسعه داده است. یادگیری تقویتی یکی از گرایشهای یادگیری ماشین است که از روانشناسی رفتارگرایی الهام میگیرد. این روش بر رفتارهایی تمرکز دارد که ماشین باید برای بیشینه کردن کارآیی خود انجام دهد.
این تیم در ابتدا طرحی برای تسهیل مدلسازی دینامیکی ماهوارههای مدار لئو و فرمولبندی مسئله تخصیص کانال پویا (Dynamic Channel Allocation) در موضوع اینترنت اشیا ماهوارهای را تحت فرآیندهای تصمیمگیری مارکوف (Markov Decision Process بهاختصار MDP) ارائه کرده، سپس یک الگوریتم یادگیری تقویتی را جهت تخصیص بهینه کانال پیشنهاد داده است. فرآیندهای تصمیمگیری مارکوف یک چارچوب ریاضی برای مدلسازی تصمیمگیری در شرایطی است که نتایج تا حدودی تصادفی و تقریبا تحت کنترل یک تصمیمگیرنده باشند. MDPs بهمنظور مطالعه طیف گستردهای از مسائل بهینهسازی که از طریق برنامهنویسی پویا و تقویت یادگیری حل میشوند، مورد استفاده قرار میگیرد.
تیم پژوهشی مذکور طرح خود را بهگونهای تنظیم کرده است تا درخواستهای کاربران برای کاهش دادههای ورودی را نشان داده، سپس هر عملیات را به چند عملیات کوچک تقسیم میکند تا از میزان مجموعه عملیاتها کاسته شود. شبیهسازیهای گسترده نشان میدهد که روش آنها در مقایسه با الگوریتم های معمول میتواند حداقل ۶۷.۸۶ درصد در مصرف انرژی صرفهجویی کند.
تیم مذکور با توجه به محدودیت منابع ماهوارههای مدار لئو از یک سو و از سوی دیگر تقاضای گسترده برای دادههای ماهوارههای این مدار، ضمن بهرهگیری از ارتباطات سبز (Green Communication)، راههایی را بهمنظور حل مسئله تخصیص منابع ماهوارهها در مدار لئو ارائه داده است. ارتباطات سبز به روشی میگویند که طی آن مخابرات و فناوریهای شبکه و محصولات با بهرهوری مناسب انتخاب میشوند و در هر زمان ممکن بهرهگیری از منابع در همه شاخههای ارتباطات به حداقل میرسد. همچنین مطابق ادعای این تیم، استفاده از راهحل ارائهشده توسط آنها بهرهمندی از ماهوارههای لئو برای اپراتورها را به حداکثر میرساند. بر اساس اظهارات تیم پژوهشی، شبیهسازی طرح پیشنهادی آنها در مقیاس وسیع، نشاندهنده عملکرد بسیار بهتر آن در مقایسه با طرحهای قدیمی است.