معرفی
در گرب، هزاران رزرو روزانه از طریق اپلیکیشن مجله زیبایی و درمانی آذر وت انجام میشود. تلفنها و دستگاههای GPS رانندگان به ما کمک میکنند تا مسیرهای GPS را به صورت بزرگ مجموعههای جی پی اس جمعآوری کنیم.
علاوه بر زمان و مکان شیء، مسیرهای GPS همچنین توسط سایر پارامترها مانند سرعت، جهت سر و سامان دادن، مساحت و فاصله پوشیده شده در طی سفر و زمان سفر نشانهگذاری میشوند. بنابراین، الگوهای مسیریابی از دادههای GPS کاربران منابع ارزشمندی برای مجموعههای گستردهای از برنامههای شهری مانند حل مشکلات حمل و نقل، پیشبینی ترافیک و توسعه برنامه ریزی شهری منطقی هستند.
در حال حاضر، ایجاد و حفظ مجموعههای دادههای GPS کاری سخت و پر هزینه است. به همین دلیل، بیشتر مجموعههای داده GPS موجود در بازار پوشش وسیعی ندارند یا اطلاعات قدیمی دارند. آنها فقط یک محدوده کوچکی از شهر را پوشش میدهند، اما نرخ نمونهبرداری کم و اطلاعات زمینه مربوط به پینگهای GPS اندکتری دارند مانند عدم دقت، جهت و سرعت. علیرغم وجود بیش از یک دهها جامعه مسیریابی در جمعآوری مجموعههای داده مسیریابی GPS، برای پاک کردن دادهها و پیشپردازشهای داده نیاز به مقدار قابل توجهی زحمت وجود دارد تا بتوان از آنها استفاده کرد.
برای پوشش دادن نقصان در مجموعههای داده موجود، ما گرب-پوزیژن را ساختیم، اولین مجموعه داده مسیریابی GPS در جنوب شرق آسیا. اصطلاح پوزیژن به موقعیت در زبان بهاس است. این دادهها از تلفنهای رانندگان مجله زیبایی و درمانی آذر وت جمعآوری شده است در حالی که در حرکت هستند. با حل مسئله اضافه کردن جادههای شریانی اصلی در مناطقی که نقشههای موجود پوشش کمی دارند و بهبود تدریجی پوشش در مناطقی که جادههای اصلی قبلاً نقشه شده است، پوزیژن بهبود چشمگیری در بهرهوری نقشهبرداری ایجاد میکند.
محتویات مجموعه داده
سراسر مجموعه داده گرب-پوزیژن شامل 84 هزار مسیریابی است که شامل بیش از 80 میلیون پینگ GPS و بیش از 1 میلیون کیلومتر میشود. میانگین طول مسیریابی 11.94 کیلومتر و میانگین مدت زمان سفر برای هر سفر 21.50 دقیقه است.
اطلاعات در تاریخ آوریل 2019 با نرخ نمونهبرداری 1 ثانیه جمعآوری شده است که بیشترین نرخ نمونهبرداری بین تمام مجموعههای داده عمومی است. همچنین، این دادهها اطلاعات زمینه غنیتری را ارائه میدهند، از جمله سطح دقت، جهت و سرعت. سطح دقت به دلیل نویز دادههای GPS مهم است و مکان واقعی هر جایی در داخل یک دایره با مرکز در مکان گزارش شده با شعاعی برابر با سطح دقت میتواند باشد. جهت جهت افقی سفر را نسبت به شمال واقعی اندازهگیری میکند. در نهایت، سرعت به متر بر ثانیه بر روی زمین گزارش میشود.
از آنجا که مسیرهای GPS از تلفنهای رانندگان گرب-پوزیژن در حال حرکت جمعآوری شد، ما هر مسیریابی را با نوع دستگاه تلفن همراه (اندروید یا iOS) برچسبگذاری کردیم. این اولین مجموعه داده است که اطلاعات چنین دستگاهی را تفکیک میکند. علاوه بر این، ما نیز مسیرهای مسیریابی را با حالت رانندگی (ماشین یا موتورسیکلت) برچسبگذاری کردیم.
همه اطلاعات شخصی رانندگان رمزگذاری شدهاند و موقعیتهای واقعی شروع/پایان درون مجموعه داده حذف شدهاند.
قالب داده
هر مسیریابی در قالب یک فایل به فرمت Apache Parquet سریالیزه میشود. اندازه کلی مجموعه داده حدود 2 گیگابایت است. هر پینگ GPSکه با اطلاعاتی شامل شناسه مسیریابی، عرض جغرافیایی، طول جغرافیایی، زمان ثبت (UTC)، سطح دقت، جهت و سرعت مرتبط میشود. نرخ نمونهبرداری GPS 1 ثانیه است که بیشترین نرخ نمونهبرداری بین تمام مجموعههای داده منبع باز موجود است. جدول 1 نمونهای از مجموعه داده را نشان میدهد.
پوشش
شکل 1a پوشش مکانی مجموعه داده در سنگاپور را نشان میدهد. در مقابل مجموعه دادههای GPS موجود در بازار که فقط یک منطقه خاص از یک شهر را پوشش میدهند، مجموعه داده گرب-پوزیژن تقریباً تمام جزیره سنگاپور را پوشش میدهد. شکل 1b چگالی GPS در سنگاپور را نشان میدهد. رنگ قرمز نشاندهنده چگالی بالا است در حالی که رنگ سبز چگالی کم را نشان میدهد. براندازههای بیان شده به دلیل پینگهای GPS چگال در جادههای اصلی بسیار واضح هستند.
شکل 2a نشان میدهد که مجموعه داده گرب-پوزیژن نه تنها جاکارتا مرکزی را پوشش میدهد بلکه به جادههای بیرونی نیز میرسد. شکل 2b چگالی GPS ماشینها در جاکارتا را نشان میدهد. در مقابل سنگاپور، سفرها در جاکارتا در تمام مناطق مختلف پراکنده شدهاند و صرفاً بر روی جادههای اصلی تمرکز نشدهاند.
کاربردهای گرب-پوزیژن
موارد زیر برخی از کاربردهای مجموعه داده گرب-پوزیژن هستند.
بر التشخیص روی نقشه
روش سنتی استفاده شده در به روز رسانی شبکههای جادهای در نقشهها زمانبر و زحمتبر است. به همین دلیل، ممکن است نقشهها جادههای مهم را از دست بدهند و شرایط ترافیک به صورت در زمان واقعی در دسترس نباشد. برای حل این مشکل میتوانیم از مسیرهای GPS استفاده کرده و به طور خودکار شبکههای جاده را بازسازی کنیم.
به یکشنبه الگوریتمهای تولید نقشه میتوانند برای نقشههای زیربنا و ویژگیهای جاده استفاده شوند. شکل 3b یک قطعه از نقشه استنباطی از مسیرهای GPS ما (شکل 3a) با استفاده از یکی از الگوریتمها را نشان میدهد. همانطور که از نقاط آبی دیده میشود، اسکلت نقشه استنباطی درست است، اگرچه بعضی از بخشهای جاده استنباطی قطع شده است و در رابطه با میدان چرخشی در گوشه پایین و راست یک خمیدگی صاف نیست.
بر تطبیق نقشه
تطبیق نقشه ارجاع به کار خودکار تعیین مسیر صحیح است که راننده در یک نقشه دیجیتال سفر کرده است، با استفاده از یک دنباله از امتیازهای GPS خام و نویزی. اصلاح دادههای GPS خام برای بسیاری از برنامههای مبتنی بر موقعیت مکانی مانند ناوبری، پیگیری و تشخیص ویژگیهای جاده مهم بوده است که در مجموعه داده گرب-پوزیژن ارائه میشوند.
بر شناسایی و پیشبینی ترافیک
علاوه بر استنباط نقشه دیجیتال ثابت، مجموعه داده GPS گرب-پوزیژن همچنین برای پیشبینی ترافیک در زمان واقعی قابل استفاده است که برای شناسایی ترافیک، کنترل جریان، برنامهریزی مسیر و ناوبری بسیار مهم است. برخی از نمیایههای اصلی که بیشتر برای نظارت بر وضعیت کنونی شرایط ترافیک استفاده میشوند، شامل سرعت متوسط، حجم و چگالی در هر بخش جاده است. این متغیرها میتوانند بر اساس مسیریابی GPS رانندگان محاسبه شده و برای پیشبینی وضعیت ترافیک در آینده استفاده شوند.
بر شناسایی حالت
تشخیص حالت حمل و نقل به تشخیص حالت سفر کاربر (برخی از مثالهای حالت حمل و نقل شامل پیادهروی، دوچرخه، ماشین، اتوبوس، و غیره است). مسیرهای GPS در مجموعه داده ما همراه با ویژگیهای غنی شامل دقت GPS، جهت و سرعت به علاوه عرض جغرافیایی و طول جغرافیایی میباشند که میتوانند برای توسعه مدلهای شناسایی حالت استفاده شوند. مجموعه داده ما همچنین برچسب برای هر مسیریابی را که از یک ماشین یا موتورسیکلت جمعآوری شده است، ارائه میدهد که برای اعتبار سنجی عملکرد این مدلها استفاده میشود.
از دیدگاه اقتصادی
مسیرهای GPS دنیای واقعی افراد الگوهای سفر و تقاضاهای واقعگرایانه را نشان میدهند که میتواند به شهرپروری های هوشمند کمک بسیاری بکند. از آنجا که دولتها با محدودیت های بودجه و ناراحتی ساخت و ساز مواجه هستند، نگرانی از الزامات برنامهریزی مقامات برنامهریزی و تقاضاهای سفر واقعگرایانه استخراج شده از مسیرها برای برنامه ریزی هوشمند شهری بسیار مهم است. به عنوان مثال، مسیرهای ماشین میتوانند پیشنهادهایی درباره برنامه ریزی ساخت جادههای شاهراه را ارائه کنند. مسیرهای موتورسیکلت نیز به دولت کمک میکنند تا مکان های بهینه برای ساخت خطوط موتورسیکلت برای دلایل امنیتی انتخاب کند.
میخواهید به مجموعه داده ما دسترسی داشته باشید؟
مجموعه داده گرب-پوزیژن ارزش عالی را دارد و یک منبع قابل توجه برای جامعه برای واگذاری و بازبینی فناوریهای موجود است.
اگر میخواهید برای اهداف تحقیقاتی به مجموعه داده ما دسترسی داشته باشید، ایمیل با موضوع
- نام و اطلاعات تماس شما
کاربرد های مجموعه داده گرب-پوزیژن را لطفاً به این گونه نقل کنید.
Huang, X., Yin, Y., Lim, S., Wang, G., Hu, B., Varadarajan, J., ... & Zimmermann, R. (2019, November). Grab-Posisi: An Extensive Real-Life GPS Trajectory Dataset in Southeast Asia. In Proceedings of the 3rd ACM SIGSPATIAL International Workshop on Prediction of Human Mobility (pp. 1-10). DOI:https://doi.org/10.1145/3356995.3364536
توجه: شما نمیتوانید از مجموعه داده گرب-پوزیژن برای اهداف تجاری استفاده کنید.
به ما بپیوندید
مجله زیبایی و درمانی آذروت یک سوپراپ برتر در جنوب شرق آسیا است که خدمات روزانه ای را که برای مصرفکنندگان اهمیت دارند، ارائه میدهد. بیش از یک اپلیکیشن رزرو خودرو و تحویل غذا، آذروت برای مناطق مختلف از جمله حرکت، غذا، بسته بندی و خدمات دلالی میکند و خدمات پرداخت تلفن همراه و خدمات مالی را در بیش از ۴۰۰ شهر در هشت کشور ارائه میدهد.
توسط فناوری و با احساس استقرار، ماموریت ما این است که با ایجاد توانمندیهای اقتصادی برای همه، جنوب شرق آسیا را به جلو ببریم. اگر این ماموریت با شما سخن بگوید، همین امروزبه تیم ما بپیوندید!