YouTube: как и где хранятся петабайты видеоконтента

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Мнение | Оффтопик

YouTube, мировой гигант онлайн-видео индустрии, ежедневно сталкивается с невероятным наплывом нового контента. Представьте себе: каждые 60 секунд на платформу загружается более 500 часов видеоматериалов, что в сутки составляет ошеломляющие 720 000 часов. Такой информационный поток требует не просто большого, а поистине колоссального и надежного хранилища данных.

Автор: Коллаж mixtrum

Империя данных Google для YouTube

В 2006 году Google приобрела YouTube за внушительную сумму в 1,65 миллиарда долларов. С тех пор видеохостинг получил доступ к передовой инфраструктуре IT-гиганта. Сегодня YouTube опирается на глобальную сеть дата-центров Google, раскинувшихся по всему земному шару.

Эти дата-центры — настоящие технологические крепости. Они оснащены армией мощных серверов, гигантскими хранилищами данных, сложнейшим сетевым оборудованием и инновационными системами охлаждения. По оценкам специалистов, общее число серверов Google может превышать астрономическую цифру в два с половиной миллиона единиц.

Географическое расположение дата-центров:

  • пятнадцать в Северной Америке
  • три в Южной Америке
  • восемь в Европе
  • пять в Азии

В этих центрах «трудится» огромное количество серверов различного назначения: веб-серверы, серверы для индексации данных, рекламные серверы, серверы сбора информации, серверы для работы с документами и даже серверы проверки орфографии.

Автор: Lambtron Источник: commons.wikimedia.org

GFS: «файловый мозг» Google

Для управления гигантскими массивами данных YouTube, Google разработала собственную файловую систему — Google File System (GFS). Это не просто файловая система, а настоящий распределенный кластерный монстр, созданный специально для работы с данными в масштабах, которые и не снились обычным компьютерам.

Последняя версия GFS носит громкое имя «Colossus» и была представлена в 2010 году. Она обеспечивает молниеносную скорость работы, невероятную масштабируемость и «железобетонную» отказоустойчивость, без которых немыслима работа с петабайтами данных YouTube.

Автор: Helpameout Источник: commons.wikimedia.org

Стратегия «не клади все яйца в одну корзину»

Google применяет стратегию многократного резервирования данных. Каждое видео на YouTube существует в нескольких идентичных копиях, разбросанных по разным дата-центрам. Благодаря этому, даже если один из центров внезапно выходит из строя, все видео останутся в целости и сохранности и будут доступны пользователям.

Объём данных

Google хранит в строжайшем секрете точные объемы данных YouTube. Однако, по неофициальным оценкам, ежегодно на платформу загружается около ста двадцати петабайт новых видео. Учитывая, что YouTube существует с 2005 года, общий объем его данных может измеряться в эксабайтами (1 эксабайт = 1024 петабайта). Это число настолько велико, что его трудно представить и осмыслить обычному человеку.

Автор: İsmail Enes Ayhan Источник: unsplash.com

Система хранения данных YouTube — это настоящее «чудо» современных технологий. Сочетание передовых разработок Google, включая распределенные дата-центры, уникальную файловую систему GFS и стратегию многократного резервирования, позволяет YouTube справляться с нескончаемым потоком нового контента и обеспечивать мгновенный доступ к миллиардам видео для «зрителей» по всему миру.

Сейчас на главной

Новости

Публикации

Обзор наушников Tanchjim Soda: взрослый звук без компромиссов

Новинка от Tanchjim получила, очень популярное в наших широтах, наименование: Soda. На ощупь это обычный пластик, однако выглядят наушники эффектно, да и к начинке подошли неординарно. Кроме...

Обзор Sofirn ST10: компактный фонарь на клипсе с тремя режимами работы

Фонарь Sofirn ST10 это EDC-модель компактных размеров с тремя режимами работы и возможностью крепления на клипсу. Компактный фонарь на каждый день, который можно носить просто в кармане. Подсветить...

Странный компьютер, который программировался отверткой и пучком проводов: советский АВК-6

Компьютер без двоичного кода и процессора, который программировали отверткой и проводами. Советский АВК-6 решал сложнейшие уравнения, используя напряжение вместо цифр. Зачем он был нужен?

Обзор моющего пылесоса с функцией умной паузы и голосовым помощником Rawmid Modern RMV-02

Rawmid Modern RMV-02 подойдет для пользователей, которым важна маневренность и простота в управлении. Эта модель пылесоса оснащена функцией авто следования, вам не придется толкать его, он сам...

Обзор сварочного аппарата СТАРТ MMA-200 – компактный инвертор для бытовой сварки

Работа с металлом в мастерской со временем почти неизбежно приводит к мысли о собственном сварочном оборудовании. Сначала это могут быть мелкие ремонты, простые кронштейны или какие-то несложные...