|
|
Регистрация Восстановить пароль |
Повторная активизация e-mail |
Регистрация | Задать вопрос |
Заплачу за решение |
Новые сообщения |
Сообщения за день |
Расширенный поиск |
Правила |
Всё прочитано |
|
Опции темы | Поиск в этой теме |
11.04.2012, 06:13 | #1 |
Форумчанин
Регистрация: 29.10.2009
Сообщений: 259
|
Сверхбольшие базы данных - VLDB
Решил немного почитать про базы данных и наткнулся на такое интересное понятие, как "Very Large DataBase", объем которых измеряется в петабайтах(1ПБ = 1024Тб). Произвел небольшой расчет: допустим, что нам необходимо хранить данные о 2'000'000'000 китайцах(имя, место рождения, место жительство и т.д.) под каждого из которых в базе потребуется 5Кбайт=>2000000000*5=10'000'000'000 Кбайт=9765625Мб=9536Гб=10Тб, т.е. до 1ПБ даже 2'000'000'000 китайцев не дотягивает и это с учетом того, что для хранения информации о каждом из них использовалось 5Кбайт, а 5Кбайт - это не так уж и мало.
Ладно, решил в сети найти примеры сверхбольших баз данных - нашел кучу конференций по их поводу, а конкретного примера нет. Может кто сталкивался с такими базами или хотя бы что о них слышал - для чего они нужны, что в них хранится, сколько в них таблиц и полей в этих таблицах?
Из всех классических книг, посвященных программированию, ненавижу всего одну - русский перевод книги Роберта Седжвика-"Фундаментальные алгоритмы C++". Предпочитаю читать её в оригинале.
|
11.04.2012, 16:26 | #2 |
Пользователь
Регистрация: 02.04.2009
Сообщений: 33
|
Там наверно не обязательно текстовая информация хранится, вполне возможно это и биометрическая информация и фото, видео, аудио записи хранятся
|
11.04.2012, 20:13 | #3 |
Старожил
Регистрация: 08.04.2012
Сообщений: 3,229
|
5 Кбайт - это, конечно, немало, но, боюсь в них не поместится более или приемлемое фото китайца (чтобы по нему можно было отличить этого китайца от любого другого).
|
11.04.2012, 21:49 | #4 |
Пользователь
Регистрация: 15.05.2011
Сообщений: 14
|
А если вдруг понадобится хранить код ДНК, и не только китайцев, а каждого человека на Земле.
|
12.04.2012, 12:51 | #5 | |
Форумчанин
Регистрация: 29.10.2009
Сообщений: 259
|
Цитата:
Фото - я еще согласен - 1Мб * 2'000'000'000=2'000'000'000Мб=19531 25Гб=1907Тб. Однако лично я нигде не натыкался на БД, в которых хранятся фото. Можно пример?
Из всех классических книг, посвященных программированию, ненавижу всего одну - русский перевод книги Роберта Седжвика-"Фундаментальные алгоритмы C++". Предпочитаю читать её в оригинале.
|
|
12.04.2012, 14:47 | #6 |
Старожил
Регистрация: 17.11.2010
Сообщений: 19,042
|
Одной из самых больших научных баз данных является база данных проекта BaBar. Целью эксперимента BaBar является изучение поведения B-мезонов, получаемых на коллайдере PEP-II в Стэндфордском центре линейного ускорителя (Stanford Linear Accelerator Center). Детектор BaBar поставляет около 500 Гбайт информации ежедневно. Данная информация сохраняется в базе данных BaBar, объем которой сегодня составляет более 500 Тбайт. Система включает в себя 2000 процессоров и 100 серверов.
Если бы архитекторы строили здания так, как программисты пишут программы, то первый залетевший дятел разрушил бы цивилизацию
|
12.04.2012, 15:17 | #7 | |
Старожил
Регистрация: 08.02.2012
Сообщений: 2,173
|
Цитата:
Правильно поставленная задача - три четверти решения.
|
|
13.04.2012, 14:52 | #8 | ||
Форумчанин
Регистрация: 29.10.2009
Сообщений: 259
|
Цитата:
К тому же, зачем может понадобиться эта информация, чтобы лет через 200 "стряпать клонов" всяких Верок Сердючек, Пугачевых и т.д. Хранение такого набора данных должно быть четко и разумно обосновано, выражения из вида:"А вдруг это когда-то понадобиться" вызывают у меня один ответ:"Вдруг только понос у детей"(известное выражение), не прими его за хамство. Цитата:
Мое личное мнение по поводу таких объемов и их обработки: нужны компьютеры другого уровня, другого поколения, чтобы все это переварить!
Из всех классических книг, посвященных программированию, ненавижу всего одну - русский перевод книги Роберта Седжвика-"Фундаментальные алгоритмы C++". Предпочитаю читать её в оригинале.
|
||
13.04.2012, 18:46 | #9 | |
Старожил
Регистрация: 08.04.2012
Сообщений: 3,229
|
Цитата:
А то получается как в анекдоте: "вы сначала плавать научитесь, а потом мы вам в бассейн воду нальем". Насчет научных данных - никогда нельзя предсказать заранее, что именно потребуется, а что - нет. И гораздо лучше, если 99% базы никогда не будет востребовано, чем если из необходимых данных в базе окажется лишь 99%. Кстати, в Ленинской библиотеке более половины единиц хранения НИ РАЗУ не были затребованы. Но это совсем не значит, что такие библиотеки никому не нужны. |
|
21.04.2012, 11:13 | #10 |
Форумчанин
Регистрация: 17.02.2010
Сообщений: 399
|
А к примеру социальные сети ? миллионы пользователей и у каждого куча фото видео и прочих данных и инфы. уверен что вконтакте точно измеряется петабайтами.
|
Опции темы | Поиск в этой теме |
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
Базы данных: репликация и хранилище данных | Nikitashtab | Фриланс | 0 | 04.11.2011 23:11 |
Базы данных изменение данных (Delphi (ADO)). | RuthlessD | Помощь студентам | 0 | 16.06.2011 19:57 |
проверка базы данных на корректность веденных данных | samouelson | БД в Delphi | 1 | 20.12.2009 17:23 |