Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики.
Продолжая посещать сайты проектов вы соглашаетесь с нашей
Политикой в отношении файлов cookie
112873510090665368075@google
Новичок
Victor Khimenko
Рейтинг
+5.00
Автор не входит в состав редакции iXBT.com (подробнее »)
Хоть бы глянули на то, что это за зверь, перед тем, как кнопки топтать: https://www.sifive.com/boards/hifive-unmatched
Загрузка вообще зависит от подвода электричества. Всегда ж есть задачи, которые можно немного отложить или ускорить.
Можно даже маркетинговой фигнёй заняться, если всё отлажено. Вот, почитайте: https://blog.google/inside-google/infrastructure/data-centers-work-harder-sun-shines-wind-blows/
> И бывало не те диски меняли, и не следовали задокументированному процессу, и полезли в главную БД что-то менять вместо запланированной замены в тестовой БД, и т.д., и т.п. Человеческий фактор.
Человеческий фактор нельзя исключить, но можно минимизировать. А для этого нужно чтобы линейный персонал не знал (и ему не нужно было знать!) где у вас главная БД, где тестовая и на каких серверах вообще что крутится.
В нашем случае линейный персонал вообще не знает где и что крутится, а люди, отвечающие за функционирования разных сервисов понятия не имеют где они физически запущены (понятно, что в критических случаях всё это можно узнать и увидеть, но задача заключается в том, чтобы этих критических случаев было мало и в обычной, стабильной, ситуации это никого не волновало: диск сдох, человек увидел это, пошёл, вырубил сервер, диск заменил… заодно экономия на дорогих RAID-контроллерах… а что там на этом сервере работало и где оно стало работать, когда сервер остановили его волновать не должно).
Ну дык я об этом и говорю: вы не обеспечиваете “много девяток”, вы продаёте СЕРТИФИКАТЫ на много девяток.
Не столько гарантия чего-то, сколько азартная игра.
> Вы должны бы знать, что в контрактах количество девяток указывается на год сервиса. Иногда ежемесячно. С неустойками за указанный срок.
Да знаю я это! Собственно это вот всё и обозначает что все эти “девятки” это такой цирк. Бюрократия. Прикрытие чьей-то задницы. Раз неустойка может всё исправить, то сбой это не катастрофа, а просто “рабочий момент”.
Там где реально нужны много “девяток” (скажем в системах управления АЭС) цирк с ночной заменой дисков не нужен.
Но лженаука физика это запрещает: чтобы у тебя надёжность была “многодевяточная” нужно, чтобы дублирование было, как минимум, десятикратным.
Это даже военные редко где могут себе позволить, а “на гражданке” это работает только если на этих “резервных” мощностях работает кто-то ещё, пока они не нужны для бесперебойности.
Собственно по этой причине всякие суперважные военные системы висят на обычной энергосети с дополнительными генераторами, а не на отдельный “выделенной” электростанции.
Обычная энергосистема, если ты у неё самый приоритетный потребитель УЖЕ даст тебе “три девятки”, а если ещё три девятки добавятся от генератора (который работает только когда энергосистема отключена, но регулярно проверяется), то вам вот, пожалуйста, реальные шесть-семь “девяток”.
А отдельная от энергосистемы электростанция такой надёжности не даст, сколько денег в неё ни вбухай.
Тот же самый подход с датацентрами работает, но почему-то бюрократию это не останавливает.
А если вы про “большие системы”, то вот в том случае, когда Niantic'и устроили вместо заказанных 100K QPS нам 10M QPS… было весело. Пару дней.
Ещё раз: десять МИЛЛИОНОВ запросов. В секунду. Достаточно “нагруженно”?
Разумеется наши датацентры, в некоторым смысле, “публичные”.
В смысле там и всякие Рога и Копыта тоже хостятся.
Потому что единственный способ обеспечить КОМУ-ТО много девяток — то это можно сделать только за счёт КОГО-ТО другого.
Если у вас нет десятикратного запаса (а лучше стократного) для ваших шести-семидевяточников, то не выдадите вы им требуемый сервис. Никак.
Вы же сами показали — почему.
А если у вас есть этот стократный запас, то глупо его не использовать для кого-то ещё. Кому “много девяток” не нужны. Если вы этого делать не будете, то у вас цены окажутся такими, что никто себе такой сервис позволить не сможет.
Ну а дальше — всё из этих соображений строится. Система, где отвал стойки и даже целого датацентра не является нештатной. Отказ от “агрегатов” и дорогущего “супернадёжного” железа (нафига оно вам, если вы ВСË РАВНО должны планировать всё на случай сумасшедших охотников в заповеднике, которые вам оптику расфигачат и вам две недели допуск потребуется оформлять, чтобы кабель заменить… реальный случай, вполне).
Ну и так далее, по списку.
Ну а вы, на самом деле, никаких “много девяток” не обеспечиваете, ваш бизнес, на самом деле, продаёт не супернадёжный сервис, а сертификат о том, что клиент купил такой вот сервис.
Это СОВСЕМ другой бизнес и да, там другие подходы. И я даже понимаю почему он существует и будет существовать…. но многих девяток там не будет в реальности. Хорошо если обеспечите восстановление данных гарантированное (без ограничений на скорость, просто, чтобы данные можно было хоть за какое-то время восстановить), остальное — опционально.
Вот мне интересно: откуда берутся эти сказки и кто в них верит. Если ваша фирма просуществует 100 лет (сомнительно, но пусть) и эти четыре дня больше никогда не повторятся, то вы уже имеете ТРИ девятки. Три — и не больше.
Одно дело надёжность какого-то компонента, другое — всей системы в целом.
> Если специалисты знают, как «это всё разруливается», то почему нам до сих пор приходится стоять в очередях?
Вот именно потому что специалисты прекрасно знают, что лучше иметь очередь, чем неработающий сервис.
> И почему в пик COVID скорые с пациентами часами стояли у больниц, и поэтому на вызов приезжали очень медленно?
Дык вот именно поэтому: поскольку никаких “много девяток” нет, не было и никогда ДЛЯ ВСЕХ не будет, то нужно решить для кого таки будет, а для кого нет.
Но в IT индустрии сплошь и рядом мегаумы, пытающиеся обмануть физику, успешно заваливающие это дело (а его в принципе невозможно не завалить, вы можете либо обеспечить “много девяток” для некоторых, либо “мало девяток” для всех) и потом рассказывающих байки.
Но у вас всегда должен быть протокол, позволяющий понять — кто это безобразие создал и кого нужно тормозить, а то и “резать по живому, не дожидаясь перитонита”.
Ну не могу я себе представить контору с тремя датацентрами и без кучи клиентов, отличающихся по важности и, соотвественно, с разными приоритетами.
Если дикая нагрузка вызвана какими-то важными клиентами, которых просто отключить нельзя — это тяжело, конечно, но даже в этом случае должны быть люди, способные решить кем можно пожертвовать, чтобы не легло сразу всё.
Меня вообще вся эта история дико удивляет: а у специалистов проконсультироваться, чтобы понять как всё вот это вот разруливается?
Проблема-то сто лет как в изучении, ГОЭЛРО как появился так и начали думать.
И тем, не менее, сегодня, через 100 лет кто-то наступает на те же грабли.
Грустно и смешно.
И конечно «оно само», даже очень часто «оно само», но… когда кривожопы из Niantic промахнулись в заявке в оценке того, сколько их поделие нагрузки создаст на два порядка (да, в сто раз), то там сразу пошли отлупы и ограничения.
Два дня куча народу в мыле всё разруливали… но повлияло это только на несчастных охотников на покемонам, сервисам других клиентов не давали заметить, что где-то рядом со всем этим трагедия.
А про дегрэйдед моде вообще смешно: если это нормальный датацентр, так там всё должно быть настроено так, чтобы лампочка загорелась и диск пошли и сменили, не выясняя что у вас там с “тихими часами”.
Ну серьёзно: если в вас в датацентре десять тысяч “шпинделей”, а срок службы винта лет, скажем, десять (и то, под нагрузкой десять лет это круто, обычно меньше), то у вас каждый день будет вылетать по 3-5 винтов… какой, к бесу, “тихий час”?
Когда у вас “основная база” раз в год становится недоступна — можно процессы отладить.
Ну и вбухивать кучу времени и денег во всё это, а потом доводить до 100% CPU load / 100% Disk I/O utilization глупо.
Всё равно что построить дорогущее шоссе из Владивостока в Москву, но “для экономии” не доделать мост через Москва-Реку. Смысл?
При покупке телефона телефон со съёмной батарей проигрывает телефону с несъёмной.
Ибо человек не думает нифига о том, что он будет с телефоном через несколько лет делать. а “прям щаз” он хуже: больше, тяжелее, скрипит.
А так-то да, рыночек уже давно нифига не решает ибо он отлично работает если у покупателей мозги есть, а после стольких лет выращивания “потребителей” там мало что осталось.
Если вы не понимаете, что происходящее это не “игра в Петра I”, а сознательное действие, к которому готовились 20 лет, то я даже не знаю как к этому относиться.
Это для них добром не кончится, но зачем же повторять их ошибки?
Кроме того они судорожно пытаются затащить к себе производство чипов, не понимая, что откат на этом фронте лет на 10-15 фактически не избежен и, на самом-то деле, не слишком и критичен.
А вот авиадвигатели, без которых у них, после развала мира, будут проблемы, они делать не учатся.
Ну это их проблемы, России нужно о себе думать, а не о Китае.
Мой прогноз: этого не произойдёт никогда. Вот вообще никогда.
Разве только они новый самолёт под тем же номером выпустят.
Так что конкуренция будет, конечно.
Это как с быстрой зарядкой: куча проприетарных поделок, которые не обязательно соместимы со стандартом, хотя и появились раньше.
То же самое в случае Thunderbolt 3 и USB 4.
А потом YouTube перестал работаеть — и всё.
И хотя если поплясать с бубном можно и сейчас его заставить работать, но проще оказалось Windows 11 поставить.
Где-то на полгода, от силы год запала хватает.
Потом всё становится слишком грустно.