هنر برنامه ریزی ظرفیت توسط جان Allspaw

  • 2022-12-21

دسترسی کامل به هنر برنامه ریزی ظرفیت و 60K+ عناوین دیگر ، با آزمایش 10 روزه رایگان اوریلی.

همچنین رویدادهای آنلاین زنده ، محتوای تعاملی ، مواد آماده سازی صدور گواهینامه و موارد دیگر وجود دارد.

فصل 4. پیش بینی روندها

من فرض می کنم که شما چند پاس را از فصل 3 ساخته اید و به تازگی یک سیستم فوق العاده جذاب ، کاملاً شگفت انگیز ، نظارت ، روند ، گرافیکی و اندازه گیری مستقر کرده اید. شما هرچه بیشتر می توانید دست خود را به دست آورید ، نمودار می کنید. شما احتمالاً از نمودار کردن دوره های اوج پارس سگ همسایه خود چیزی به دست نیاوردید - اما سلام ، شما این کار را کردید ، و من به شما افتخار می کنم.

اکنون می توانید مانند یک توپ کریستالی از این داده ها (به استثنای آمار پارس) استفاده کنید و آینده مانند Nostradamus را پیش بینی کنید. اما بیایید برای لحظه ای در اینجا متوقف شویم تا یک جزئیات کوچک تحریک کننده را به خاطر بسپاریم: پیش بینی دقیق آینده غیرممکن است.

پیش بینی نیازهای ظرفیت ، بخشی از شهود و ریاضی بخشی است. این همچنین هنر خرد کردن و ریختن داده های تاریخی شما و ایجاد حدس های تحصیل کرده در مورد آینده است. در خارج از آن انفجارهای نادر و سنبله های بار در سیستم شما ، امید بلند مدت امیدوارم یکی از استفاده های مداوم در حال افزایش باشد. با قرار دادن همه این داده های تاریخی ، می توانید تخمین هایی را برای آنچه برای حفظ رشد وب سایت خود نیاز دارید ، تهیه کنید. همانطور که بعداً خواهیم دید ، کلید پیش بینی دقیق ، داشتن یک روند پیش بینی قابل تنظیم است.

قبل از اینکه بیش از حد از ترسیم رشد گسترده و ایجاد سرورهای جدید برای رسیدگی به آبشارها بسیار هیجان زده شوید ، بگذارید یکی از عوامل اصلی اقتصادی را که برای مقابله با آن نیاز دارید یادآوری کنم: خرید تجهیزات خیلی زود بی فایده است.

این قانون به طور مستقیم از روند آشکار در هزینه های محاسباتی بدست می آید: همه اشکال سخت افزار ارزان تر می شوند ، حتی اگر سریعتر و قابل اطمینان تر شوند. این که آیا قانون مور (Gordon E. مور مشهور در سال 1965 در سال 1965 که تعداد ترانزیستورها را بر روی یک مدار یکپارچه تقریباً دو برابر می کند ، هر هجده ماه) برای همیشه صادق است ، می توانیم پیش بینی کنیم که تولید کنندگان با گذشت زمان هزینه های کمتری را ادامه می دهند. اگر می توانید شش ماه قبل از خرید یک قطعه تجهیزات صبر کنید ، احتمالاً در آن زمان با تجهیزات سریعتر و ارزان تر به پایان خواهید رسید.

مطمئناً، شما نمی‌خواهید در زمان رشد، ناآمادگی گرفتار شوید - این کتاب تماماً در مورد نجات شما از آن موقعیت خطرناک شغلی است. برعکس، افسران مالی شرکت نیز وقتی تجهیزات زیادی را خریداری کرده اید که در حالت بیکار هستند، به شما احترام زیادی نمی گذارند، فقط چند ماه بعد شاهد کاهش قیمت آن هستند.

سوار بر امواج شما

یک برنامه ظرفیت خوب به دانستن نیازهای شما برای مهم ترین منابع و چگونگی تغییر آن نیازها در طول زمان بستگی دارد. هنگامی که داده های تاریخی در مورد ظرفیت را جمع آوری کردید، می توانید تجزیه و تحلیل آن را با چشمی به سمت تشخیص هر گونه روند و الگوهای تکرار شونده شروع کنید.

برای مثال، در آخرین فصلی که توضیح دادم که چگونه در فلیکر، متوجه شدیم که یکشنبه از نظر تاریخی بالاترین روز آپلود عکس در هفته بوده است. این به دلایل زیادی جالب است. همچنین ممکن است ما را به سؤالات دیگری هدایت کند: آیا اوج یکشنبه در طول زمان تغییر کرده است، و اگر چنین است، نسبت به روزهای دیگر هفته چگونه تغییر کرده است؟آیا بالاترین روز آپلود همیشه یکشنبه بوده است؟آیا با اضافه کردن اعضای جدید ساکن در طرف دیگر خط تاریخ بین المللی، این تغییر می کند؟آیا یکشنبه همچنان بالاترین روز آپلود در تعطیلات آخر هفته است؟به همه این سؤالات می‌توان زمانی که داده‌ها را در اختیار داشت پاسخ داد، و پاسخ‌ها به نوبه خود می‌توانند بینش فراوانی را در رابطه با برنامه‌ریزی راه‌اندازی ویژگی‌های جدید، قطع‌های عملیاتی یا پنجره‌های تعمیر و نگهداری ارائه دهند.

شناخت روندها به دلایل زیادی ارزشمند است، نه فقط برای برنامه ریزی ظرفیت. وقتی در فصل 3 به مصرف فضای دیسک نگاه کردیم، به طور تصادفی با الگوهای آپلود هفتگی مواجه شدیم. آگاهی از هر گونه الگوی تکرار شونده می تواند در تصمیم گیری های بعدی بسیار ارزشمند باشد. گرایش‌ها همچنین می‌توانند مدیریت جامعه، مراقبت و پشتیبانی مشتری، مدیریت محصول و امور مالی را اطلاع دهند. چند مثال از اینکه چگونه اندازه گیری متریک می تواند مفید باشد عبارتند از:

گروه عملیات شما می‌تواند از برنامه‌ریزی تعمیر و نگهداری که می‌تواند بر ماشین‌های پردازش تصویر در روز یکشنبه تأثیر بگذارد، اجتناب کند و به جای آن جمعه را انتخاب کند تا هرگونه اثرات نامطلوب بر روی کاربران را به حداقل برساند.

اگر کد جدیدی را که زیرساخت پردازش آپلود را لمس می‌کند، مستقر می‌کنید، ممکن است بخواهید یکشنبه بعد توجه ویژه‌ای داشته باشید تا ببینید آیا وقتی سیستم بالاترین بار خود را تجربه می‌کند، همه چیز به خوبی حفظ می‌شود یا خیر.

آگاه کردن پشتیبانی مشتری از این الگوهای اوج به آنها اجازه می دهد تا تأثیر هر گونه بازخورد کاربر را در مورد آپلودها بسنجند.

ممکن است مدیریت محصول بخواهد ویژگی‌های جدیدی را بر اساس دوره‌های ترافیک کم یا زیاد در روز راه‌اندازی کند. یک تمرین خوب این است که مطمئن شوید همه اعضای تیم شما می دانند این معیارها در کجا قرار دارند و معنی آنها چیست.

بخش مالی شما نیز ممکن است بخواهد در مورد این روندها بداند زیرا می تواند به آنها کمک کند تا برای هزینه های سرمایه ای برنامه ریزی کنند.

روندها، منحنی ها و زمان

بیایید نگاهی به داده‌های مصرف روزانه ذخیره‌سازی که در فصل گذشته جمع‌آوری کرده‌ایم داشته باشیم و از آن برای پیش‌بینی نیازهای ذخیره‌سازی آینده استفاده کنیم. ما قبلاً معیار تعیین کننده را می دانیم: کل فضای موجود دیسک. ترسیم نمودار مجموع تجمعی این داده ها دیدگاه مناسبی را برای پیش بینی نیازهای آتی فراهم می کند. با نگاهی به شکل 4-1، می‌توانیم ببینیم که مصرف به کجا می‌رود، چگونه در طول زمان تغییر می‌کند و چه زمانی احتمالاً فضای خالی ما تمام می‌شود.

Total disk consumption: cumulative view

اکنون، اجازه دهید محدودیت خود را اضافه کنیم: کل فضای موجود در حال حاضر دیسک. فرض کنید برای این مثال در مجموع 20 ترابایت (یا 20480 گیگابایت) ظرفیت نصب شده داریم. از نمودار، می بینیم که حدود 16 ترابایت مصرف کرده ایم. با افزودن یک خط ثابت که به آینده ادامه می‌یابد تا کل فضای نصب شده را نشان دهد، نموداری شبیه شکل 4-2 به دست می‌آوریم. این تصویر یک اصل اساسی برنامه ریزی ظرفیت را نشان می دهد: پیش بینی ها به دو بیت ضروری از اطلاعات نیاز دارند، سقف شما و داده های تاریخی شما.

Cumulative disk consumption and available space

تعیین زمان رسیدن به محدودیت فضایی گام بعدی ما است. همانطور که قبلاً پیشنهاد کردم، می‌توانیم به سادگی یک خط مستقیم بکشیم که از داده‌های اندازه‌گیری شده تا نقطه‌ای که خط حد فعلی ما را قطع می‌کند، امتداد می‌یابد. اما آیا رشد ما در واقع خطی است؟ممکن است نباشد.

اکسل این مرحله بعدی را "افزودن خط روند" می نامد، اما برخی از خوانندگان ممکن است این فرآیند را به عنوان برازش منحنی بدانند. این فرآیندی است که در آن سعی می‌کنید معادله‌ای ریاضی پیدا کنید که داده‌هایی را که به آن نگاه می‌کنید تقلید کند. سپس می‌توانید از این معادله برای حدس‌های آموزشی در مورد مقادیر گمشده در داده‌ها استفاده کنید. در این مورد، از آنجایی که داده‌های ما در یک خط زمانی قرار دارند، مقادیر گمشده‌ای که به آن‌ها علاقه داریم در آینده هستند. یافتن یک معادله خوب برای تناسب با داده ها می تواند به همان اندازه هنر باشد که علم. خوشبختانه، اکسل یکی از بسیاری از برنامه هایی است که برازش منحنی دارد.

برای نمایش روند با استفاده از یک ظاهر ریاضی تر، بیایید نوع نمودار را در اکسل از Line به XY (Scatter) تغییر دهیم.

XY (پراکندگی) مقادیر تاریخ را فقط به نقاط داده واحد تغییر می دهد. سپس می توانیم از ویژگی روند اکسل استفاده کنیم تا به ما نشان دهیم که چگونه این روند در آینده به نظر می رسد. برای نمایش یک منوی کشویی ، روی داده ها روی نمودار کلیک راست کنید. از آن فهرست ، Add Trendline را انتخاب کنید. همانطور که در شکل 4-3 نشان داده شده است ، یک کادر گفتگو باز می شود.

Add Trendline Type dialog box

در مرحله بعد ، یک نوع خط روند را انتخاب کنید. در حال حاضر ، بیایید چند جمله ای را انتخاب کنیم و سفارش را تنظیم کنیم. ممکن است دلایل خوبی برای انتخاب نوع روند دیگری وجود داشته باشد ، بسته به اینکه داده های شما چقدر متغیر است ، داده های شما چقدر و تا چه حد به آینده می خواهید برون یابی کنیدوادبرای اطلاعات بیشتر ، به نوار کناری آینده ، "منحنی های مناسب" مراجعه کنید.

در این مثال ، داده ها به همان اندازه خطی ظاهر می شوند ، اما از آنجا که من می دانم که این داده ها در مدت زمان طولانی تر خطی نیستند (این شتاب می یابد) ، من یک نوع روند را انتخاب می کنم که می تواند مقداری از شتاب را ضبط کندما می دانیم که رخ خواهد داد.

پس از انتخاب یک نوع روند ، روی برگه گزینه ها کلیک کنید تا کادر گفتگوی Add Trendline Options را مطرح کنید ، همانطور که در شکل 4-4 نشان داده شده است.

برای نشان دادن معادله ای که برای تقلید از داده های فضای دیسک ما استفاده می شود ، برای "نمایش معادله در نمودار" روی کادر انتخاب کلیک کنید. ما همچنین می توانیم با کلیک بر روی کادر "نمایشگر" نمایشگر R-Squared در نمودار "مقدار R 2 را برای این معادله بررسی کنیم.

مقدار R 2 در دنیای آمار به عنوان ضریب تعیین شناخته شده است. بدون اینکه به جزئیات چگونگی محاسبه این موضوع بپردازیم ، اساساً نشانگر چگونگی مطابقت یک معادله با مجموعه خاصی از داده ها است. مقدار R 2 از 1 نشان دهنده تناسب ریاضی کامل است. با داده هایی که برای این مثال استفاده می کنیم ، هر مقدار بالاتر از 0. 85 باید کافی باشد. نکته مهمی که باید بدانید این است که ، همانطور که مقدار R 2 شما کاهش می یابد ، اعتماد به نفس شما در مورد پیش بینی ها نیز باید باشد. تغییر نوع روند در مرحله قبلی بر مقادیر R 2 تأثیر می گذارد - گاهی اوقات برای بهتر ، گاهی اوقات برای بدتر - بنابراین برخی از آزمایشات در هنگام جستجوی مجموعه های مختلف داده ها در اینجا لازم است.

در برنامه ریزی ظرفیت ، اتصالات منحنی جایی است که خلاق می تواند با علمی برخورد کند. در بیشتر موارد ، از برنامه ریزی ظرفیت برای ماندن از رشد استفاده می شود ، که به طور کلی از طریق داده های سری زمانی که به سمت بالا و به سمت راست گسترش می یابد ، نشان داده می شود.

با فهمیدن چگونگی و هنگامی که داده ها به آنجا می رسند ، چالش است و ما قصد داریم از برون یابی برای حل آن استفاده کنیم. برون یابی فرآیند ساخت نقاط داده جدید فراتر از مجموعه ای از نقاط داده شناخته شده است. در مورد ما ، ما می خواهیم نقاط داده جدیدی را که در آینده داده های سری زمانی وجود دارد ، تعریف کنیم.

مشکل در اتصالات منحنی و برون یابی این است که شما باید آنچه را که در مورد منبع داده های خود می دانید با معادله ظاهری مناسب آشتی دهید. به این دلیل که منحنی پیدا می کنید متناسب با داده ها با دقت ریاضی 99. 999 ٪ به معنای این نیست که این یک تصویر دقیق از آینده خواهد بود. داده های شما تقریباً همیشه در خارج از معادله ریاضی زمینه خواهند داشت. به عنوان مثال ، پیش بینی فروش بیل های برفی باید شامل ملاحظات مربوط به زمان سال (زمستان در مقابل تابستان) یا جغرافیا (آلاسکا یا آریزونا) باشد.

هنگام یافتن معادلات متناسب با داده های خود ، بهتر است از معادلات چند جمله ای مرتبه بالاتر دوری کنید. آنها وسوسه کننده هستند زیرا تناسب آنها (ضریب تعیین) بسیار خوب است ، اما هر چیزی بالاتر از یک چند جمله ای مرتبه دوم می تواند نوسانات چشمگیر را در خارج از مجموعه داده مورد نظر خود نشان دهد.

اخلاق داستان این است که هنگام منحنی داده های خود ، از یک حس خوب از عقل سلیم استفاده کنید. اصرار نکنید که متناسب با ظرافت کامل باشد ، زیرا آنها اغلب نتیجه فرضیات مشکوک هستند.

ما می خواهیم خط روند خود را به آینده گسترش دهیم. ما می خواهیم آن را به اندازه کافی به آینده گسترش دهیم به گونه ای که از خط مربوط به فضای موجود در کل ما عبور کند. این نکته ای است که در آن می توانیم پیش بینی کنیم که از فضا استفاده خواهیم کرد. در قسمت پیش بینی کادر گفتگو ، 25 واحد را برای یک مقدار وارد کنید. واحدهای ما در این مورد روزها هستند. بعد از اینکه خوب شد ، خواهید دید که پیش بینی ما شبیه به شکل 4-5 است.

نمودار نشان می دهد که در جایی در حدود روز 37 ، ما از فضای دیسک خارج می شویم. خوشبختانه ، ما برای دیدن مقادیر واقعی نیازی به چسباندن در نمودار نداریم. ما معادله ای را برای ترسیم آن خط روند داریم. همانطور که در جدول 4-1 به تفصیل شرح داده شده است ، وصل کردن معادله به اکسل ، و استفاده از واحدهای روز برای مقادیر X ، آخرین روز را می یابیم که زیر محدوده فضای دیسک ما هستیم 8/30/05 است.

Add Trendline Options dialog box

Extending the trend line

دیسک موجود (GB)

y = 0. 7675 x 2 + 146. 96x + 14147

اکنون می دانیم که چه زمانی به فضای دیسک بیشتری احتیاج داریم و می توانیم با سفارش و استقرار آن ادامه دهیم.

این مثال از افزایش فضای دیسک تقریباً به همان اندازه که می آیند ساده است. اما از آنجا که این متریک محور مصرف است ، هر روز ارزش جدیدی دارد که به تعریف منحنی ما کمک می کند. ما همچنین باید در معیارهای اوج محور که نیازهای ظرفیت ما را در سایر قسمتهای سایت ما ایجاد می کند ، عامل کنیم. معیارهای اوج محور شامل منابعی هستند که به طور مداوم بازسازی می شوند ، مانند زمان CPU و پهنای باند شبکه. آنها به طرز چشمگیری نوسان دارند و بنابراین پیش بینی دشوارتر هستند ، بنابراین اتصالات منحنی نیاز به مراقبت بیشتری دارد.

پیوند معیارهای سطح برنامه به آمار سیستم: مثال بانک اطلاعاتی

در فصل 3 ، ما به انجام مقادیر سقف پایگاه داده خود پرداختیم. ما متوجه شدیم (از طریق مشاهده معیارهای سیستم خود) که 40 درصد DISK I/O انتظار برای جلوگیری از یک ارزش مهم برای جلوگیری از آن است ، زیرا این آستانه است که در آن تکثیر پایگاه داده شروع به تجربه تاخیر های مختل کننده می کند.

چگونه می دانیم چه زمانی به این آستانه می رسیم؟ما هنگام نزدیک شدن به سقف خود به برخی از نشانه ها نیاز داریم. به نظر می رسد که نمودارها یک خط واضح و صاف را نشان نمی دهند که فقط در آستانه 40 درصد قرار دارند. در عوض ، نمودار انتظار دیسک I/O ما پایگاه داده ما را نشان می دهد تا زمانی که سنبله 40 درصد رخ دهد. ما ممکن است سنبله های گاه به گاه (و قابل بازیافت) را قابل قبول بدانیم ، اما باید پیگیری کنیم که چگونه مقادیر متوسط ما با گذشت زمان تغییر می کند تا سنبله ها به سقف ما نزدیک نباشند. ما همچنین باید به نوعی زمان انتظار I/O را با استفاده از پایگاه داده خود ببندیم و در نهایت ، از نظر استفاده واقعی برنامه چه معنی دارد.

برای برقراری برخی از کنترل های این داده های نامعلوم ، بیایید یک قدم از آمار سیستم برداریم و به هدف این پایگاه داده در واقع بپردازیم. در این مثال ، ما در حال بررسی یک پایگاه داده کاربر هستیم. این یک سرور در خوشه پایگاه داده اصلی ما است ، که در آن بخشی از کاربران فلیکر ابرداده مرتبط با حساب کاربری خود را ذخیره می کنند: عکس های آنها ، برچسب های آنها ، گروه هایی که به آنها تعلق دارند و موارد دیگر. دو درایور اصلی بار در پایگاه داده ها البته تعداد عکس ها و تعداد کاربران هستند.

این پایگاه داده خاص تقریباً 256000 کاربر و 23 میلیون عکس دارد. با گذشت زمان، متوجه شدیم که نه تعداد کاربران و نه تعداد عکس ها به تنهایی مسئول میزان کار پایگاه داده نیستند. در نظر گرفتن تنها یکی از آن متغیرها به معنای نادیده گرفتن تأثیر دیگری است. در واقع، ممکن است کاربران زیادی وجود داشته باشند که عکس‌های کمی داشته باشند یا عکس نداشته باشند. پرس و جو برای داده های آنها بسیار سریع است و اصلاً مالیاتی نیست. در طرف مقابل، تعداد انگشت شماری از کاربران وجود دارند که مجموعه های عظیمی از عکس ها را نگهداری می کنند.

ما می توانیم برای سرنخ هایی در مورد ارزش های حیاتی خود به معیارهای خود نگاه کنیم. ما تمام معیارهای سیستم، معیارهای کاربردی و رشد تاریخی هر کدام را داریم.

سپس به دنبال یافتن مهمترین معیاری هستیم که می تواند سقف هر سرور پایگاه داده را تعیین کند. پس از بررسی معیارهای انتظار ورودی/خروجی دیسک برای هر یک، نتوانستیم همبستگی خوبی بین انتظار I/O و تعداد کاربران در پایگاه داده تشخیص دهیم. ما سرورهایی با بیش از 450000 کاربر داشتیم که سطوح انتظار I/O را سالم، اما خطرناک نبودند. در همین حال، سرورهای دیگر با تنها 300000 کاربر سطوح بسیار بالاتری از انتظار I/O را تجربه می کردند. نگاه کردن به تعداد عکس‌ها نیز مفید نبود - به نظر نمی‌رسد که انتظار ورودی/خروجی دیسک با جمعیت عکس مرتبط باشد.

همانطور که مشخص شد، معیاری که مستقیماً انتظار ورودی/خروجی دیسک را نشان می‌دهد، نسبت عکس‌ها به کاربران در هر یک از پایگاه‌های داده است.

به عنوان بخشی از داشبورد در سطح برنامه، ما به صورت روزانه (که هر شب جمع آوری می شود) تعداد کاربران ذخیره شده در هر پایگاه داده همراه با تعداد عکس های مرتبط با هر کاربر را اندازه گیری می کنیم. نسبت عکس به کاربر به سادگی تعداد کل عکس ها تقسیم بر تعداد کاربران است. در حالی که این می تواند به عنوان یک عکس متوسط برای هر کاربر در نظر گرفته شود، محدوده می تواند بسیار زیاد باشد، با برخی از کاربران "قدرت" فلیکر که هزاران عکس دارند در حالی که اکثریت فقط ده ها یا صدها عکس دارند. با نگاه کردن به اینکه چگونه انتظار اوج ورودی/خروجی دیسک با توجه به این نسبت عکس به ازای هر کاربر تغییر می‌کند، می‌توانیم ایده‌ای در مورد اینکه چه نوع معیارهایی در سطح برنامه می‌تواند برای پیش‌بینی و کنترل استفاده از ظرفیت ما استفاده شود، به دست آوریم (شکل 4 را ببینید.-6).

این نمودار از تعدادی از پایگاه داده های ما گردآوری شده است و مقادیر انتظار دیسک I/O را در برابر نسبت های فعلی عکس به کاربر خود نشان می دهد. با استفاده از این نمودار ، می توانیم مشخص کنیم که انتظار دیسک I/O از کجا شروع به پرش می کند. در داده های ما در مورد نسبت 85-90 وجود دارد که مقدار دیسک I/O انتظار بالاتر از محدوده 30 درصد است. از آنجا که ارزش سقف ما 40 درصد است ، ما می خواهیم اطمینان حاصل کنیم که نسبت عکس های خود را به کاربر در محدوده 80-100 حفظ می کنیم. ما می توانیم با توزیع عکس برای کاربران با حجم بالا در بسیاری از بانکهای اطلاعاتی ، این نسبت را در برنامه خود کنترل کنیم.

من می خواهم برای لحظه ای متوقف شوم تا کمی در مورد معماری پایگاه داده فلیکر صحبت کنم. پس از رسیدن به محدودیت های سنتی تر Master/Slaves MySQL Architication Miplication (که در آن همه می نویسد به استاد می رود و همه خوانده شده به بردگان می روند) ، ما طرح پایگاه داده خود را مجدداً طراحی کردیم تا فدرال شود ، یا به هم ریخته شود. این تکامل در معماری به طور فزاینده ای متداول می شود زیرا رشد سایت به سطوح بالاتری از تغییر داده ها می رسد. من به این موضوع نمی پردازم که چگونه این مهاجرت معماری به وجود آمد ، اما این نمونه خوبی از چگونگی تصمیمات معماری می تواند تأثیر مثبتی در برنامه ریزی و استقرار ظرفیت داشته باشد. با فدرال کردن داده های خود در بسیاری از سرورها ، ما رشد خود را فقط با میزان سخت افزاری که می توانیم مستقر کنیم ، محدود می کنیم ، نه با محدودیت های تحمیل شده توسط هر دستگاه واحد.

Database—photo:user ratio versus disk I/O wait percent

از آنجا که ما فدراسیون هستیم ، می توانیم کنترل کنیم که چگونه کاربران (و عکس های آنها) در بسیاری از پایگاه داده ها پخش می شوند. این در اصل به معنای این است که هر سرور (یا جفت سرورها ، برای افزونگی) حاوی مجموعه ای منحصر به فرد از داده ها است. این برخلاف بانک اطلاعاتی سنتی یکپارچه است که شامل هر رکورد در یک سرور واحد است. اطلاعات بیشتر در مورد معماری های پایگاه داده فدرال را می توان در کتاب کال هندرسون ، ساخت وب سایت های مقیاس پذیر (O'Reilly) یافت.

خوب ، انحراف کافی - این را به عنوان مثال ظرفیت پایگاه داده ما بازگرداند و جایی را که در این مرحله قرار داریم خلاصه کنید. تأخیر تکثیر بانک اطلاعاتی بد است و ما می خواهیم از آن جلوگیری کنیم. ما وقتی می بینیم که 40 درصد دیسک I/O را می بینیم ، تاخیر تکثیر را دیدیم و وقتی کاربران و عکس های کافی را نصب کردیم تا نسبت عکس به کاربر 110 تولید کنیم ، به آن آستانه می رسیم. ما می دانیم که چگونه عکس های ما و ثبت نام های کاربررشد کنید ، زیرا ما روزانه آن را ضبط می کنیم (شکل 4-7). ما اکنون با تمام اطلاعاتی که برای تصمیم گیری آگاهانه در مورد میزان سخت افزار بانک اطلاعاتی برای خرید و چه موقع تصمیم گیری می کنیم ، مسلح هستیم.

ما می توانیم یک روند را بر اساس این داده ها برانگیختیم تا پیش بینی کنیم چه تعداد کاربران و عکس هایی که در Flickr برای آینده قابل پیش بینی داریم ، سپس از آن استفاده می کنیم تا چگونه نسبت عکس/کاربر ما به پایگاه داده های ما نگاه کند و اینکه آیا ما نیاز به تنظیم داریمحداکثر مقدار کاربران و عکس ها برای اطمینان از تعادل یکنواخت در آن پایگاه داده ها.

ما پیدا کرده ایم که آرنج در عملکرد ما (شکل 4-6) برای این پایگاه داده ها وجود دارد-و بنابراین ظرفیت ما-اما در مورد این نسبت عکس/کاربران برای پایگاه داده های ما چه ویژه ای است؟چرا این مقدار خاص باعث تخریب عملکرد می شود؟این می تواند به دلایل زیادی ، مانند تنظیمات سخت افزاری خاص یا انواع نمایش داده هایی که ناشی از داشتن داده های زیادی در هنگام ترافیک اوج است ، باشد. بررسی پاسخ به این سؤالات می تواند یک تمرین ارزشمند باشد ، اما در اینجا دوباره تأکید می کنم که ما باید به سادگی انتظار داشته باشیم که این اثر ادامه یابد و روی هیچ بهینه سازی احتمالی آینده حساب نشود.< SPAN> ما می توانیم یک روند را بر اساس این داده ها برون یابی کنیم تا پیش بینی کنیم که تعداد کاربران و عکس هایی که در Flickr برای آینده قابل پیش بینی داریم ، از آن استفاده کنیم تا بتوانیم نحوه نگاه عکس/کاربر ما به پایگاه داده های ما و اینکه آیا ما خواهیم بودبرای اطمینان از تعادل یکنواخت در آن بانکهای اطلاعاتی ، باید حداکثر مقدار کاربران و عکس ها را تنظیم کنید.

  • نویسنده : ميرنجفي زاده نگارسادات
  • منبع : sverigeobrott.online
  • بدون دیدگاه

ثبت دیدگاه

مجموع دیدگاهها : 0در انتظار بررسی : 0انتشار یافته : ۰
قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.