مقدمه
این مقاله معرفی میکند موتور تصمیم گیری GrabX، یک بستهی منبع باز داخلی که یک چارچوب جامع برای طراحی و تحلیل آزمایشهای انجام شده در پلتفرمهای آزمایش آنلاین ارائه میدهد. این بسته شامل یک مشاور قبل از آزمایش، یک مجموعه ابزار تجزیه و تحلیل پس از آزمایش و ابزارهای پیشرفته دیگر است. در این مقاله، ما به بررسی دلیل پشت ساخت این قابلیتها، یکپارچگی آنها در اکوسیستم منحصر به فرد چند جانبه Grab و چگونگی تقویت فرهنگ و کیفیت آزمایش در Grab میپردازیم.
پس زمینه
امروزه، پلتفرم آزمایشگری (GrabX) Grab، آزمایش هزاران نمونه آزمایشی در هر هفته را هماهنگ میکند. همانطور که پلتفرم ادامه مییابد و مدیریت حجم رشد آزمایشهای زیادتر، نیاز به ابزارهای آزمایش قابل اعتماد، قابل مقیاس و قابل اعتماد برای تصمیمگیری مبتنی بر داده روز به روز بیشتر میشود.
در مقاله قبلی ما، برنامه تحلیل آزمایش خودکار را معرفی کردیم، یک ابزار طراحی شده برای خودکار سازی لولههای داده برای تجزیه و تحلیل. با این حال، در طول توسعه این برنامه برای انجمن آزمایشگران Grab، یک روند غالب مشاهده شد: آزمایشها در بیشتر موارد به صورت یک به یک و با روش دستی تجزیه و تحلیل میشدند. در حالی که این رویکرد فدرال در چندین مورد لازم است، اما با چالشهای زیادی در سطح سازمانی همراه است:
- عدم وجود یک مجموعه ابزار متناسب: GrabX امکان اجرای مجموعهای متنوع از طرحهای آزمایش را فراهم میکند که به نیازها و زمینههای مختلف تیمهای فنی مختلف در سازمان پاسخ میدهد. با این حال، آزمایشگران ممکن است اغلب بر روی ابزارهای آنلاین عمومی برای پیکربندی آزمایش (مانند محاسبه اندازه نمونه) حساب کنند، که برای پاسخگویی به جزئیات آزمایشهای GrabX یا روش ارزیابی توصیه شده در طراحی، طراحی نشده است. این تشدید میشود توسط این واقعیت که بیشتر آموزشها یا دورههای آنلاین درباره طراحی آزمایش به طور معمول به جزئیات بازارهای چند جانبه پرداخته نمیشوند و نمیتوانند باطریخبازیها یا محدودیتهای آزمایشهای خاص را مدنظر قرار دهند.عدم وجود استانداردها: در این مدل فدرال، عدم وجود روشها و رویههای استاندارد ممکن است منجر به مسائل قابل اعتمادی شود. در برخی موارد، این موارد میتواند شامل آزمایشهای ضعیف طراحی شده، روشهای ارزیابی نامناسب، انتخابهای تست نامناسب و استنتاج ناقص باشد، که برای مانیتورینگ و تصحیح آنها دشوار است.عدم قابلیت مقیاس پذیری و کارآیی: آزمایشگران با تجارب زمینهای متنوع و مجموعه مهارتهای متفاوت، معمولاً رویکردهای متفاوتی را در آزمایش و استدلال پذیرفته میکنند. این تنوع، در حالی که ارزشمند است، اغلب منتقل شدن و به اشتراک گذاری روشها را مانع میشود و چارچوبی سازگار و قابل مقیاس آزمایش را با مشکلات رویکرد میکند. علاوه بر این، این تنوع در روشها میتواند عمر تجزیه و تحلیل آزمایش را افزایش دهد، زیرا تعارض درباره رویکردها میتواند منجر به درخواستهای تکراری برای بررسی یا تغییر شود.
راهحل
برای مقابله با این چالشها، ما موتور تصمیم گیری GrabX را توسعه دادیم، یک بسته پایتون که در سراسر پلتفرمهای توسعه Grab به صورت منبع باز ارائه شده است. هدف اصلی آن تامین استانداردهای بهتر در کارآیی آزمایش و تجزیه و تحلیل، در نتیجه اطمینان حاصل شده از استنتاج دقیق و قابل اطمینان از هر آزمایش است.
به ویژه، این مجموعه ابزار یکپارچه به طور قابل توجهی فرآیندهای آزمایش از ابتدا تا انتها را بهبود میبخشد، از طریق:
- تضمین سازگاری با GrabX و تجزیه و تحلیل آزمایش خودکار: این بسته به طور کامل با برنامه تجزیه و تحلیل آزمایش خودکار یکپارچه شده است و تحلیل های و تستهای متناسب با طرح های پشتیبانی شده توسط GrabX را ارائه می دهد. نتایج می توانند برای کارهای پایین دستی دیگری مانند مدلسازی بازار، کالیبراسیون مبتنی بر شبیهسازی و تنظیم پیکربندی خودکار استفاده شود.استانداردسازی تجزیه و تحلیل آزمایش: با ارائه یک چارچوب یکپارچه، این بسته تضمین میکند که منطق طراحی آزمایش و تفسیر نتایج تجزیه و تحلیل با استاندارد سازمانی همراه باشد، که توافق و آسانی در مرور تیمهای مختلف را ترویج میکند.بهبود همکاری و کیفیت: به عنوان یک بسته منبع باز، این بسته نه تنها فرهنگ همکاری را ترویج میدهد، بلکه از طریق مرورهای همکاران تضمین کیفیت میکند. آن دعوت میکند کاربران از ویژگیهای غنی آن استفاده کنند و در آن برای بهبود و ارتقاء قابلیتهای ابزارکتابخانه اساسی
این بسته برای همه افرادی که در فرآیند آزمایش مشغول هستند، طراحی شده است، با دانشمندان داده و تجزیه و تحلیل محصول به عنوان کاربران اصلی. در این مقاله به آنها به عنوان آزمایشگران ارجاع میدهیم، این مشارکت کنندگان کلیدی نه تنها میتوانند از قابلیتهای موجود بسته برای پشتیبانی از پروژههای خود استفاده کنند، بلکه میتوانند نوآوریهای خود را نیز ارائه دهند. در نهایت، نتایج و بینشهای حاصل از بسته از طریق برنامه تجزیه و تحلیل آزمایش خودکار دارای دسترسی به سایر صاحبان سمت
در بخش بعدی، به عمق در اجزای کلیدی بسته میرویم.
جزئیات ویژگی
این بسته شامل سه مؤلفه کلیدی است:
- یک مشاور قبل از آزمایشیک مجموعه ابزار جامع برای تجزیه و تحلیل پس از آزمایشابزارهای پیشرفته
اینها بر اساس نوع آزمایش هایی که معمولا در Grab انجام می دهیم طراحی شده اند. برای درک قابلیتها خود، مناسب است ابتدا درباره طرحهای آزمایشی اصلی پشتیبانی شده توسط GrabX صحبت کنیم.
یک یادداشت در مورد طرحهای آزمایشی
اگرچه انواع مختلفی از طرحهای آزمایشی مشخصی پیاده سازی شده است، آنها را میتوان به دو دسته اصلی تقسیم کرد: طرح بین زیرجمعی و طرح داخل زیرجمعی.
در یک طرح بین-زیرجمعی، شرکت کنندگان مانند کاربران برنامه ما، رانندگان-شرکا و بازرگانان-شرکا به گروههای آزمایشی تقسیم میشوند و هر گروه در طول آزمایش به یک شرایط متمایز میشوند. یک چالش در این طرح این است که هر شرکت کننده ممکن است مشاهدات چندگانه ای به نمونه تجزیه و تحلیل آزمایشی ما ارائه دهد، که منجر به همبستگی شدید داخل زیرجمعی بین مشاهدات و انحرافات بین روشنایی و واحد جلسه میشود. این میتواند دقت تجزیه و تحلیل قدرت قبل از آزمایش و استنباط بعد از آزمایش را تحت تأثیر قرار دهد، زیرا نیاز به تنظیمات، مانند خوشه بندی خطاهای استاندارد در هنگام انجام آزمون فرضی میشود.
بالعکس، یک طرح داخل زیرجمعی شامل همه شرکت کنندگان تجربه همه شرایط است. آزمایشات بازاریابی سطح بازار، مورد استفاده متداولی است که یک بخش زمانی به عنوان واحد آزمایشی تبدیل میشود. این طرح نه تنها با چالشهای گفته شده مواجه میشود، بلکه مشکلات دیگری را که باید در نظر گرفت مانند اثرات حاشیهنویسی بر روی واحدهای زمانی.
طراحی و تجزیه و تحلیل نتایج هر دو رویکرد آزمایشی نیازمند ابزارهای آماری دقیق و دقیق هستند. تأمین مدت زمان مناسب، اندازه نمونه، کنترل از تبلیغات آزمون و آدرس دهی به تنبیهکننده ها ملاکهای مهمی است برای افزایش اعتبار نتایج.
مشاور قابل اعتماد
اولین اجزای کلیدی موتور تصمیم گیری، مشاور قابل اعتماد است که بازگو کننده یک توصیه به آزمایشگر در مورد ویژگیهای کلیدی آزمایش است که باید در هنگام آمادهسازی آزمایش در نظر گرفته شود. این بستگی به طراحی است؛ در حداقل، آزمایشگر باید تعیین کند آیا طراحی آزمایش بین-زیرجمعی است یا داخل-زیرجمعی.
طراحی بین-زیرجمعی: ما به شدت توصیه میکنیم آزمایشگران از قابلیت "مشاور قابل اعتماد" در موتور تصمیم گیری برای برآورد اندازه نمونه مورد نیاز خود استفاده کنند. این برای در نظر گرفتن مشاهدات چندگانه در آزمایش مورد انتظار و تنظیم خطاهای خوشهای (Moffatt، 2020؛ List، Sadoff، & Wagner، 2011) طراحی شده است. این قابلیت به کاربران امکان می دهد تا داده های خود را به عنوان یک چارک یا یک جدول PySpark وارد کنند. به طور جایگزین، یک تابع برای استخراج آمارههای خلاصه از داده های خود در اختیار کاربران قرار میدهد، که سپس می تواند وارد مشاور قابل اعتماد شود. در واقع، بدست آوردن داده قبل از اینکه ضروری نباشد؛ کاربران دارای گزینهای هستند که به طور مستقیم از معیارهای معمول مشتق شده از یک عمومی استخراج شده