Я обсудил с ИИ твою идею:
На первый взгляд он прав математически, но концептуально упускает кучу вещей. Разберём по слоям.
1️⃣ Человек ≠ одна строка в таблице
Он мыслит так:
один человек → один BIGINT id
На практике:
• человек меняется во времени
• данные имеют версии
• идентичность может:
• дробиться (гражданства, имена)
• сливаться (ошибки, дубликаты)
• исчезать и появляться снова (миграции, архивы)
👉 Нужно:
• temporal tables
• SCD (slowly changing dimensions)
• event sourcing
⸻
2️⃣ Исторические данные — это не «плюс одна колонка»
Фраза «с учётом исторических данных» — самая слабая.
История = это:
• состояния
• события
• контексты
• неопределённость
Например:
• дата рождения ≠ одна дата
• пол, национальность, статус — зависят от эпохи
• даже имя может быть неизвестно или спорно
👉 Реляционная модель начинает трещать.
⸻
3️⃣ Идентификатор — не самая сложная часть
Он фокусируется на BIGINT, но:
Реальные проблемы:
• идентификация личности
• дедупликация
• ошибки источников
• ложные совпадения
Историк скажет:
«Мы не знаем, был ли это один человек или три»
👉 ID есть, а уверенности — нет.
⸻
4️⃣ Время не линейно
MySQL предполагает:
• дискретные даты
• точные таймстемпы
История — это:
• «между 1320 и 1340»
• «вероятно»
• «после войны»
• «до реформы»
👉 Нужна модель нечёткого времени (fuzzy time).
⸻
5️⃣ Масштаб — это не только количество строк
Да, ID хватит. Но:
• индексы?
• связи между людьми?
• версии?
• события?
• репликация?
• архивирование?
Количество записей:
• люди: ~100 млрд
• события: триллионы
• связей: квадратичный рост
👉 MySQL уже не выглядит разумным выбором.
⸻
6️⃣ Этика и философия
Он этого даже не касается.
Вопросы:
• кто владеет данными?
• можно ли «удалить» человека?
• что такое «смерть» в БД?
• можно ли хранить недостоверные факты?
👉 Это уже не IT, а философия + право.
⸻
7️⃣ Технологический анахронизм
MySQL — это:
• ACID
• строгая схема
• централизованная модель
А «база человечества» скорее:
• граф (люди ↔ события ↔ места)
• распределённая
• с вероятностями
• с конфликтующими версиями истины
⸻
Итог одной строкой
Он прав в мелочи (ID хватит),
но упускает главное:
человечество — это не таблица, а процесс во времени с неопределённостью
Размещено через приложение ЯПлакалъ