Автор не входит в состав редакции iXBT.com (подробнее »)
avatar
Не. Не очень. А вот предположить что у железяки есть видеовыход, притом что предшественника его не было и в помине и про него никто никогда не заикался — это вот да, таки очень смело.
Хоть бы глянули на то, что это за зверь, перед тем, как кнопки топтать: https://www.sifive.com/boards/hifive-unmatched
avatar
> Если у вас можно 24/7 basic standard maintenance, то либо вы на подводной лодке, либо у вас нагрузка на ЦОД равномерна в течение суток и года.
Загрузка вообще зависит от подвода электричества. Всегда ж есть задачи, которые можно немного отложить или ускорить.
Можно даже маркетинговой фигнёй заняться, если всё отлажено. Вот, почитайте: https://blog.google/inside-google/infrastructure/data-centers-work-harder-sun-shines-wind-blows/
> И бывало не те диски меняли, и не следовали задокументированному процессу, и полезли в главную БД что-то менять вместо запланированной замены в тестовой БД, и т.д., и т.п. Человеческий фактор.
Человеческий фактор нельзя исключить, но можно минимизировать. А для этого нужно чтобы линейный персонал не знал (и ему не нужно было знать!) где у вас главная БД, где тестовая и на каких серверах вообще что крутится.
В нашем случае линейный персонал вообще не знает где и что крутится, а люди, отвечающие за функционирования разных сервисов понятия не имеют где они физически запущены (понятно, что в критических случаях всё это можно узнать и увидеть, но задача заключается в том, чтобы этих критических случаев было мало и в обычной, стабильной, ситуации это никого не волновало: диск сдох, человек увидел это, пошёл, вырубил сервер, диск заменил… заодно экономия на дорогих RAID-контроллерах… а что там на этом сервере работало и где оно стало работать, когда сервер остановили его волновать не должно).
avatar
> Так что если в контракте было сказано «много девяток ежегодно», то уже в следующем году, без повтора этого события, наша фирма условия контракта выполнила.
Ну дык я об этом и говорю: вы не обеспечиваете “много девяток”, вы продаёте СЕРТИФИКАТЫ на много девяток.
Не столько гарантия чего-то, сколько азартная игра.
> Вы должны бы знать, что в контрактах количество девяток указывается на год сервиса. Иногда ежемесячно. С неустойками за указанный срок.
Да знаю я это! Собственно это вот всё и обозначает что все эти “девятки” это такой цирк. Бюрократия. Прикрытие чьей-то задницы. Раз неустойка может всё исправить, то сбой это не катастрофа, а просто “рабочий момент”.
Там где реально нужны много “девяток” (скажем в системах управления АЭС) цирк с ночной заменой дисков не нужен.
avatar
Очень на то похоже. Масса организаций попадают в эту попу из-за попыток обеспечить ОДНОВРЕМЕННО и супернадёжность и “выделенность”, когда какие-то системы работают только на тебя.
Но лженаука физика это запрещает: чтобы у тебя надёжность была “многодевяточная” нужно, чтобы дублирование было, как минимум, десятикратным.
Это даже военные редко где могут себе позволить, а “на гражданке” это работает только если на этих “резервных” мощностях работает кто-то ещё, пока они не нужны для бесперебойности.
Собственно по этой причине всякие суперважные военные системы висят на обычной энергосети с дополнительными генераторами, а не на отдельный “выделенной” электростанции.
Обычная энергосистема, если ты у неё самый приоритетный потребитель УЖЕ даст тебе “три девятки”, а если ещё три девятки добавятся от генератора (который работает только когда энергосистема отключена, но регулярно проверяется), то вам вот, пожалуйста, реальные шесть-семь “девяток”.
А отдельная от энергосистемы электростанция такой надёжности не даст, сколько денег в неё ни вбухай.
Тот же самый подход с датацентрами работает, но почему-то бюрократию это не останавливает.
avatar
Скажите сначала что вы считаете “нагруженной системой”. Если это “система, которая работает близко к своему пределу”, то да, конечно, но тогда какие там, нафиг, девятки? Парочку обеспечите и то хорошо.
А если вы про “большие системы”, то вот в том случае, когда Niantic'и устроили вместо заказанных 100K QPS нам 10M QPS… было весело. Пару дней.
Ещё раз: десять МИЛЛИОНОВ запросов. В секунду. Достаточно “нагруженно”?
Разумеется наши датацентры, в некоторым смысле, “публичные”.
В смысле там и всякие Рога и Копыта тоже хостятся.
Потому что единственный способ обеспечить КОМУ-ТО много девяток — то это можно сделать только за счёт КОГО-ТО другого.
Если у вас нет десятикратного запаса (а лучше стократного) для ваших шести-семидевяточников, то не выдадите вы им требуемый сервис. Никак.
Вы же сами показали — почему.
А если у вас есть этот стократный запас, то глупо его не использовать для кого-то ещё. Кому “много девяток” не нужны. Если вы этого делать не будете, то у вас цены окажутся такими, что никто себе такой сервис позволить не сможет.
Ну а дальше — всё из этих соображений строится. Система, где отвал стойки и даже целого датацентра не является нештатной. Отказ от “агрегатов” и дорогущего “супернадёжного” железа (нафига оно вам, если вы ВСË РАВНО должны планировать всё на случай сумасшедших охотников в заповеднике, которые вам оптику расфигачат и вам две недели допуск потребуется оформлять, чтобы кабель заменить… реальный случай, вполне).
Ну и так далее, по списку.
Ну а вы, на самом деле, никаких “много девяток” не обеспечиваете, ваш бизнес, на самом деле, продаёт не супернадёжный сервис, а сертификат о том, что клиент купил такой вот сервис.
Это СОВСЕМ другой бизнес и да, там другие подходы. И я даже понимаю почему он существует и будет существовать…. но многих девяток там не будет в реальности. Хорошо если обеспечите восстановление данных гарантированное (без ограничений на скорость, просто, чтобы данные можно было хоть за какое-то время восстановить), остальное — опционально.
avatar
> Много девяток.
Вот мне интересно: откуда берутся эти сказки и кто в них верит. Если ваша фирма просуществует 100 лет (сомнительно, но пусть) и эти четыре дня больше никогда не повторятся, то вы уже имеете ТРИ девятки. Три — и не больше.
Одно дело надёжность какого-то компонента, другое — всей системы в целом.
> Если специалисты знают, как «это всё разруливается», то почему нам до сих пор приходится стоять в очередях?
Вот именно потому что специалисты прекрасно знают, что лучше иметь очередь, чем неработающий сервис.
> И почему в пик COVID скорые с пациентами часами стояли у больниц, и поэтому на вызов приезжали очень медленно?
Дык вот именно поэтому: поскольку никаких “много девяток” нет, не было и никогда ДЛЯ ВСЕХ не будет, то нужно решить для кого таки будет, а для кого нет.
Но в IT индустрии сплошь и рядом мегаумы, пытающиеся обмануть физику, успешно заваливающие это дело (а его в принципе невозможно не завалить, вы можете либо обеспечить “много девяток” для некоторых, либо “мало девяток” для всех) и потом рассказывающих байки.
avatar
Максимальная загрузка, как тут написали чуть выше, может и внезапно настигнуть.
Но у вас всегда должен быть протокол, позволяющий понять — кто это безобразие создал и кого нужно тормозить, а то и “резать по живому, не дожидаясь перитонита”.
Ну не могу я себе представить контору с тремя датацентрами и без кучи клиентов, отличающихся по важности и, соотвественно, с разными приоритетами.
Если дикая нагрузка вызвана какими-то важными клиентами, которых просто отключить нельзя — это тяжело, конечно, но даже в этом случае должны быть люди, способные решить кем можно пожертвовать, чтобы не легло сразу всё.
Меня вообще вся эта история дико удивляет: а у специалистов проконсультироваться, чтобы понять как всё вот это вот разруливается?
Проблема-то сто лет как в изучении, ГОЭЛРО как появился так и начали думать.
И тем, не менее, сегодня, через 100 лет кто-то наступает на те же грабли.
Грустно и смешно.
avatar
Я как раз общался с крупными системами, и прекрасно понимаю что там должен быть мониторинг и ручки, которые позволяют ограничить масштаб бедствия.
И конечно «оно само», даже очень часто «оно само», но… когда кривожопы из Niantic промахнулись в заявке в оценке того, сколько их поделие нагрузки создаст на два порядка (да, в сто раз), то там сразу пошли отлупы и ограничения.
Два дня куча народу в мыле всё разруливали… но повлияло это только на несчастных охотников на покемонам, сервисам других клиентов не давали заметить, что где-то рядом со всем этим трагедия.
А про дегрэйдед моде вообще смешно: если это нормальный датацентр, так там всё должно быть настроено так, чтобы лампочка загорелась и диск пошли и сменили, не выясняя что у вас там с “тихими часами”.
Ну серьёзно: если в вас в датацентре десять тысяч “шпинделей”, а срок службы винта лет, скажем, десять (и то, под нагрузкой десять лет это круто, обычно меньше), то у вас каждый день будет вылетать по 3-5 винтов… какой, к бесу, “тихий час”?
avatar
А потаму шта DiRTа не было: https://queue.acm.org/detail.cfm?id=2371516
Когда у вас “основная база” раз в год становится недоступна — можно процессы отладить.
Ну и вбухивать кучу времени и денег во всё это, а потом доводить до 100% CPU load / 100% Disk I/O utilization глупо.
Всё равно что построить дорогущее шоссе из Владивостока в Москву, но “для экономии” не доделать мост через Москва-Реку. Смысл?
avatar
Это можно сделать только на уровне государства, увы.
При покупке телефона телефон со съёмной батарей проигрывает телефону с несъёмной.
Ибо человек не думает нифига о том, что он будет с телефоном через несколько лет делать. а “прям щаз” он хуже: больше, тяжелее, скрипит.
А так-то да, рыночек уже давно нифига не решает ибо он отлично работает если у покупателей мозги есть, а после стольких лет выращивания “потребителей” там мало что осталось.
avatar
Ну вот когда (и если) выйдет 200й C919 и будет ясно кто какие ошибки совершил.
Если вы не понимаете, что происходящее это не “игра в Петра I”, а сознательное действие, к которому готовились 20 лет, то я даже не знаю как к этому относиться.
avatar
Китайцы наивно полагают, что им дадут плавно перехватить власть на миром.
Это для них добром не кончится, но зачем же повторять их ошибки?
Кроме того они судорожно пытаются затащить к себе производство чипов, не понимая, что откат на этом фронте лет на 10-15 фактически не избежен и, на самом-то деле, не слишком и критичен.
А вот авиадвигатели, без которых у них, после развала мира, будут проблемы, они делать не учатся.
Ну это их проблемы, России нужно о себе думать, а не о Китае.
avatar
Движки у них также не свои и, в отличие от России, своих даже в плане нет.
avatar
А давайте продолжим разговор когда хотя бы пара сотен этих чудесных машинок куда-нибудь полетит, а?
Мой прогноз: этого не произойдёт никогда. Вот вообще никогда.
Разве только они новый самолёт под тем же номером выпустят.
avatar
Откаты зато ниже. А это ж продажи не в розницу, менеджеры их должны отрабатывать креативно.
Так что конкуренция будет, конечно.
avatar
Ещё раз: что это, собственно, меняет? Да, в своё время Apple тоже передала наработки кой-какие в USB-IF. Но вы же не будете утверждать что Lightning — это такой особый стандарт USB? Ну и в чём, собственно, разница с Thunderbolt3?
avatar
Нет. Совместимость с Thubderbolt 3 там только у хабов. Для устройств поддержка опциональная и пока неясно насколько она будет распространена.
Это как с быстрой зарядкой: куча проприетарных поделок, которые не обязательно соместимы со стандартом, хотя и появились раньше.
То же самое в случае Thunderbolt 3 и USB 4.
avatar
Всё это работает до определённого момента. У меня мать примерно по подобной схеме прожила несколько лет на Windows XP после окончания поддрежки.
А потом YouTube перестал работаеть — и всё.
И хотя если поплясать с бубном можно и сейчас его заставить работать, но проще оказалось Windows 11 поставить.
avatar
Уже проходили на поддержке флеша и джавы.
Где-то на полгода, от силы год запала хватает.
Потом всё становится слишком грустно.
avatar
Всё перечисленное это не USB 3+, а низкоскоростная периферия. Переходники копейки стоят, я когда-то зачерпнул пару десятков в техподдержке.