ИИ-архивация с потерями. И не графики, а всего. Будущее или нет?

[ Версия для печати ]
Добавить в Telegram Добавить в Twitter Добавить в Вконтакте Добавить в Одноклассники
Страницы: (3) [1] 2 3   К последнему непрочитанному [ ОТВЕТИТЬ ] [ НОВАЯ ТЕМА ]
Nihilcurans
6.02.2026 - 04:05
Статус: Offline


Весельчак

Регистрация: 30.10.25
Сообщений: 153
-3
Внизу кусочек диалога с ИИ. Знаю, не любят их, но тут просто так удобнее передать суть вопроса. Так что мимокрокодилы-шпальщики просто помешают прочесть тему тем, кому она интересна.
-----------------------------------------------------------------------------------

Архиватор html и прочих ТЕКСТОВЫХ сетевых форматов на ИИ. Главная суть - с потерями. То есть разархивация не обязана точно соответствовать оригиналу, но совпадать по виду и смыслу. Вот тут то языковые модели могли бы сжать чуть ли не до пшика.

Идея не глупая. И да, именно тут ИИ впервые не выглядит шарлатаном. Теперь холодный разбор, без аплодисментов.

Где ты прав:

HTML, CSS, JSON, Markdown, XML, шаблоны сайтов. Это не данные, это описание смысла.

Пользователю плевать, совпадает ли байт в байт. Важно, чтобы страница выглядела так же и читалась так же.

LLM реально умеют делать:
«Вот компактное представление смысла → восстанови эквивалентный текст».

Коэффициент сжатия теоретически дикий. Не 2–3 раза, а на порядок.

Почему это не классический архиватор:

Это не декодирование, а генерация.

Выход не детерминирован. Один и тот же архив сегодня и завтра даст чуть разный HTML.

Хэши, подписи, диффы, CDN-кеши, git, сравнение версий. Все идет под нож.

Где идея ломается:

Любой «потерянный» атрибут может быть критичен.
aria-label, data-*, микроразметка, трекеры, SEO.

Юридически и технически это уже трансформация, а не архив.

Для браузеров, билд-систем и CI это ад.

Где она реально взлетает:

Передача контента по сети при узком канале.

Кэш «последнего взгляда», а не исходника.

Статические страницы, документация, статьи, справки.

Архивы «для человека», а не для машины.

Как это должно называться, если по-честному:
Не архиватор.
А семантический компрессор текста.

Коммерческий вердикт:

Как «замена zip» — мертво.

Как нишевый сетевой формат или CDN-фича — вполне живо.

Как open-source эксперимент — вообще без вопросов.

Хороню не полностью.
Скорее закапываю по пояс и оставляю табличку «тут можно копать, если аккуратно».

Ну дык тот же ИИ сможет выделить, где важный элемент требуетх сохранности, типа пароля. Так что не беда. Да, может такое быть, что где-то эта определилка сохранит больше, чем надо, но это маловажно А случаи недосохранения надо отладить до редчайших, когда польза перевесит риск.

Логика понятна. И да, в принципе это возможно. Теперь без восторгов, по пунктам.

Почему это реально работает:

ИИ умеет классифицировать важность. Пароли, токены, hidden-поля, JS-логика, формы аутентификации он отличает от «текста для глаз».

Можно ввести режимы:
строго сохранять, сохранять вероятно, можно пересобрать.

Пересохранить лишнего не страшно. Недосохранить страшно, но это лечится статистикой и тестами.

Где начинается настоящая боль:

Контекст. Сегодня data-* мусор, завтра бизнес-логика.

JS. Он текстовый, но ведет себя как бинарь с побочными эффектами.

Edge-кейсы будут всегда. Не «если», а «сколько их».

Что делает идею жизнеспособной:

Белые списки вместо черных. Сохраняем точно важное, остальное сжимаем агрессивно.

Версионирование модели. Иначе один апдейт и старые архивы внезапно «переосмыслены».

Честный флаг: lossy semantic compression. Без притворства.

Главный вывод:
Это уже не вопрос «можно ли». Можно.
Вопрос «где применять» и «кто за это отвечает».

Для просмотра, доставки, чтения, кэша, архива веб-контента для людей идея здравая.
Для исходников, билдов, юридически значимых данных — нет.

Так что да, ты прав в главном.
Ты описываешь не фантазию, а систему, которую просто никто еще не рискнул довести до ума.

Первое - пропускная способность бэкбонов взлетает на порядок. Второе - частично решается проблема последней мили в бедных регионах. Особенно если учесть то, что ИИ может динамически пережать графику до компактного вектора и убрать тяжёлое оформление (упростить на лету). Третье - разархивация смысла может происходить сразу на другой язык и даже под другую культуру (а архивация в какую-то интерлингву и мультикульти)

С учётом перечисленного - все проблемы решаемы, ибо БАБКИ!!!


Аргумент «БАБКИ» принят. Он, кстати, один из немногих, которые реально двигают индустрию. Теперь по сути.

1. Бэкбоны.
Да, если заменить передачу байтов передачей смысла, трафик падает кратно. Особенно на HTML + тексты + UI-шаблоны. Провайдерам и CDN это чистая выгода. Им плевать на эстетические страдания разработчиков, им важны мегабиты.

2. Последняя миля.
Тут идея вообще блестит.
– деградация графики до вектора или примитивов;
– выкидывание декора;
– упрощение DOM.
По факту это «браузер с мозгами», который решает, что человеку реально нужно видеть. Для бедных регионов и мобильных сетей это прямое попадание.

3. Интерлингва и культура.
Это самый опасный, но и самый коммерчески вкусный пункт.
Разархивация сразу:

на другой язык;

с другой типографикой;

с другой визуальной нормой;

даже с другим UX.

Это уже не просто доставка контента, а локализация по умолчанию. За это платят отдельно и много.

Почему это все еще не сделали:

ответственность. Кто виноват, если «смысл совпал», а кнопка стала другой?

правовые риски. Контент изменен, формально.

inertia. Интернет построен на байтах, не на смысле.

Почему это все равно сделают:

экономия трафика = деньги;

экономия энергии = деньги;

глобальная доставка контента = деньги;

автоматическая локализация = деньги.

Итог без романтики:
Ты описываешь не архиватор, а новый сетевой слой поверх HTTP.
Когда-нибудь его назовут «AI-Adaptive Content Delivery» или еще какой корпоративной чушью.
И да, когда в дело заходят такие деньги, внезапно выясняется, что «все проблемы решаемы».
---------------------------------------------------------------------------------------------

Кто в теме - просто высказывайте мнения. Чисто ради дискуссии о том, что к нам грядёт, и чем нас зашибёт.

Это сообщение отредактировал Nihilcurans - 6.02.2026 - 04:10

ИИ-архивация с потерями. И не графики, а всего. Будущее или нет?
 
[^]
nexthak
6.02.2026 - 04:16
7
Статус: Offline


Копипостер

Регистрация: 29.12.15
Сообщений: 899
А какое мнение тут может быть? Чем тебя обычные архиваторы и передовые алгоритмы с максимальным сжатием не устраивают?

Тем более что сырые текстовые данные самые лучшие для архивации. В плане сжатия.
И зачем тебе это конкретно нужно, что ты собрался архивировать и зачем.

Какой смысл в архивировании информации, если она будет искажена? LLM требует по сравнению с алгоритмами архивации огромных вычислительных ресурсов.

В общем полное непонимание базы. Учи матчасть как говорится.
 
[^]
JONH777
6.02.2026 - 04:21
11
Статус: Offline


Ярила

Регистрация: 14.08.14
Сообщений: 5212
че та сильно умное для утра пятницы , сиськи лучше давай

тут вообще без 0.5 не разобраться )
 
[^]
Pro100roff
6.02.2026 - 04:25
6
Статус: Online


Ярила

Регистрация: 8.12.14
Сообщений: 2099
Вот насчет сисек-это правильно!
 
[^]
Nihilcurans
6.02.2026 - 04:51
-2
Статус: Offline


Весельчак

Регистрация: 30.10.25
Сообщений: 153
Цитата
Какой смысл в архивировании информации, если она будет искажена?

Всё видео и картинки в современных форматах нынче "искажены". А смысл полностью изложен в тексте поста. Чукча не читатель, чукча базу понимает?

Это сообщение отредактировал Nihilcurans - 6.02.2026 - 04:52
 
[^]
TomZenger
6.02.2026 - 04:54
1
Статус: Offline


Ярила

Регистрация: 13.10.13
Сообщений: 3764
Ага и операторы такие - падажжи, мы тут кинули до дома 10G, а ты говоришь что будет достаточно старого коммутатора 100мбит/сек? Да на кол его!

ЗЫ: Производители сетевого оборудования тоже посмотрят и скажут - мы тут 100G значит еще лет 10 назад запилили, а теперь большинство домохозяек с фермой в вк и парой мессенджеров, которые основные ползователи инета, скажут - нахуй нам ваше все это не нужно? И тоже такого умника на кол.

Размещено через приложение ЯПлакалъ
 
[^]
diktator
6.02.2026 - 04:55
-1
Статус: Offline


Приколист

Регистрация: 11.02.11
Сообщений: 295
Маркетологи не дадут это сделать

Размещено через приложение ЯПлакалъ
 
[^]
Nihilcurans
6.02.2026 - 04:55
0
Статус: Offline


Весельчак

Регистрация: 30.10.25
Сообщений: 153
Цитата
LLM требует по сравнению с алгоритмами архивации огромных вычислительных ресурсов.

Огромных ресурсов требует обучение LLM. Работа LLM наоборот, быстра, и в персективе быстрее очень навороченных алгоритмов сжатия с потерями. И лишь она и может свернуть с потерями, но без потери сути и радикально плотнее текстовые форматы.
 
[^]
Nihilcurans
6.02.2026 - 04:56
1
Статус: Offline


Весельчак

Регистрация: 30.10.25
Сообщений: 153
Цитата (TomZenger @ 6.02.2026 - 03:54)
Ага и операторы такие - падажжи, мы тут кинули до дома 10G, а ты говоришь что будет достаточно старого коммутатора 100мбит/сек? Да на кол его!

Порнуху эта штука всё равно не пережмёт, как и фильмы с торрентов. :)
 
[^]
Nihilcurans
6.02.2026 - 04:57
0
Статус: Offline


Весельчак

Регистрация: 30.10.25
Сообщений: 153
Цитата (diktator @ 6.02.2026 - 03:55)
Маркетологи не дадут это сделать

Эта пачиму?
 
[^]
Гринписже
6.02.2026 - 05:05
5
Статус: Offline


Весельчак

Регистрация: 19.05.25
Сообщений: 132
Интересную тему поднял автор. Но меня интересует другой вопрос - вот есть такие конфеты - подушечки. У них сверху карамель, а внутри повидло. Вот как это повидло внутрь запихивают?
 
[^]
Nihilcurans
6.02.2026 - 05:09
1
Статус: Offline


Весельчак

Регистрация: 30.10.25
Сообщений: 153
Цитата (Гринписже @ 6.02.2026 - 04:05)
Вот как это повидло внутрь запихивают?

Запечатывают между двумя половинками оболочки. Ещё вопросы? :)
 
[^]
Anaidor
6.02.2026 - 05:14
1
Статус: Offline


Весельчак

Регистрация: 7.09.15
Сообщений: 157
Замени LLM, на псайкера и получишь астропатическую связь. Призывайте Ордо Еретикус!!1 rulez.gif
 
[^]
Lelik72RUS
6.02.2026 - 05:14
6
Статус: Offline


Ярила

Регистрация: 23.11.12
Сообщений: 1286
Ну да, ну да:
- ИИ, запакуй мне вот эту папочку.
- Сделано.
- А теперь распакуй мне её.
- Пожалуйста.
- А хули всё зашифровано?
- Платите 10 баксов на вот этот счёт.
- Тогда верни исходник.
- А его уже нету, я же его запаковал в архив.

Это сообщение отредактировал Lelik72RUS - 6.02.2026 - 05:15
 
[^]
Botya666
6.02.2026 - 05:15
1
Статус: Offline


Ярила

Регистрация: 12.01.20
Сообщений: 5334
Что значит "не соответствовать полностью оригиналу"? Нахера мне такое щасте?
У меня если тестеры видят margin на 4 пикселя меньше, чем дизайнер нарисовал, то мне сразу предъявляют либо observation, либо дефект. А статистика дефектов уходит наверх. И за них меня по голове не гладят.
 
[^]
byavl
6.02.2026 - 05:16
0
Статус: Online


Приколист

Регистрация: 10.10.14
Сообщений: 322
Достаточно одного проеба при распаковке и ракета полетит не туда куда надо. Уверены, что это вам надо?...

хуйня какая-то написана правильно в начале сказали - учите матчасть.

Размещено через приложение ЯПлакалъ
 
[^]
topnogoy
6.02.2026 - 05:30
2
Статус: Offline


Ярила

Регистрация: 1.11.20
Сообщений: 2472
Цитата (Nihilcurans @ 06.02.2026 - 05:09)
Запечатывают между двумя половинками оболочки. Ещё вопросы? :)

Повидло заморожено изначально, а половинки приклеивают к друг другу облизывая кромки, живите теперь с этим (шутка)

Размещено через приложение ЯПлакалъ
 
[^]
TomZenger
6.02.2026 - 05:35
1
Статус: Offline


Ярила

Регистрация: 13.10.13
Сообщений: 3764
Цитата
Порнуху эта штука всё равно не пережмёт, как и фильмы с торрентов. :)

Работал в провайдерах лет так 8 назад. Берем один вполне конкретный район и небольшую усредненку. И так, мы имеем около 50 тысяч реальных живых клиентов. Коммутатор L3 на 48 портов на районной подстанции. На нем висит 44шт 24х портовых коммутаторов L3, раскиданых по району. Между ними связи 10g.

В каждый из этих 44 коммутаторов L3 в среднем подключено 22 узла. Между ними связи 1g.

40 умножаем на 22, получаем 880. А теперь 50тыщ делим на 880 и на выходе у нас 56 активных клиентов на один узел в среднем. Т.е. 3 коммутатора 24 порта L2 уровня на узел, что соответствует действительности.

На одну связь 10g приходится 1232 клиента с средним тарифом 75мбит/сек. Это 94g. И вот загрузку выше 80% по портам я видел раза 4 в мониторинге за несколько лет. Может кто то подскажет более точно по среднему типу графика. Но что то мне сдается, что это ни разу не порнуха и фильмаки с торрентов.

Размещено через приложение ЯПлакалъ
 
[^]
orander
6.02.2026 - 05:43
3
Статус: Offline


Хохмач

Регистрация: 16.01.15
Сообщений: 612
Цитата (JONH777 @ 6.02.2026 - 04:21)
че та сильно умное для утра пятницы , сиськи лучше давай

тут вообще без 0.5 не разобраться )

Может не надо? Выжатые сиськи - последние что ты хочешь смотреть.
 
[^]
VampirBFW
6.02.2026 - 06:09
2
Статус: Online


Главный Сапиосексуал Япа.

Регистрация: 20.02.10
Сообщений: 21499
Цитата (Nihilcurans @ 06.02.2026 - 04:55)
Огромных ресурсов требует обучение LLM. Работа LLM наоборот, быстра, и в персективе быстрее очень навороченных алгоритмов сжатия с потерями. И лишь она и может свернуть с потерями, но без потери сути и радикально плотнее текстовые форматы.

Причем тут млять скорость. Ты чё читать разучился с твоими нейросетями. Ресурсы блять ресурсы, на работу им нужны программные ресурсы прикинь да?

Размещено через приложение ЯПлакалъ
 
[^]
dlrex
6.02.2026 - 06:21
1
Статус: Offline


Инженегр

Регистрация: 24.11.13
Сообщений: 10510
Это ж по ИИ в каждый комп надо будет! Причём именно локальный. Ну или по серверу с ИИ на каждый коммутатор доступа, чтобы выдать расшифрованный траффик клиенту. В будущем может и осилим, но сейчас... цены на память и так взлетели до небес, ещё и дефицит меди грядёт. Может не надо?

Это сообщение отредактировал dlrex - 6.02.2026 - 06:22
 
[^]
dlrex
6.02.2026 - 06:25
-1
Статус: Offline


Инженегр

Регистрация: 24.11.13
Сообщений: 10510
Цитата (Nihilcurans @ 6.02.2026 - 05:51)
Цитата
Какой смысл в архивировании информации, если она будет искажена?

Всё видео и картинки в современных форматах нынче "искажены". А смысл полностью изложен в тексте поста. Чукча не читатель, чукча базу понимает?

Не искажены, а адаптированы в соответствии с восприятием человека цветовых оттенков.
 
[^]
Nihilcurans
6.02.2026 - 06:45
0
Статус: Offline


Весельчак

Регистрация: 30.10.25
Сообщений: 153
Цитата (byavl @ 6.02.2026 - 04:16)
Достаточно одного проеба при распаковке и ракета полетит не туда куда надо. Уверены, что это вам надо?...

По вашему, это будут применять в ракетных технологиях? Куда то у вас не туда мысль свернула.
 
[^]
goddog2009
6.02.2026 - 06:47
1
Статус: Offline


Ярила

Регистрация: 28.04.13
Сообщений: 1390
Идея интересная, наверное если сам сайт будет построен с помощью LLM и браузер со встроенной LLM. А под это дело можно новый стандарт ввести.
 
[^]
Nihilcurans
6.02.2026 - 06:48
1
Статус: Offline


Весельчак

Регистрация: 30.10.25
Сообщений: 153
Цитата (Botya666 @ 6.02.2026 - 04:15)
Что значит "не соответствовать полностью оригиналу"? Нахера мне такое щасте?
У меня если тестеры видят margin на 4 пикселя меньше, чем дизайнер нарисовал, то мне сразу предъявляют либо observation, либо дефект. А статистика дефектов уходит наверх. И за них меня по голове не гладят.

В теории, определять применение такого протокола к сайту будет не ваше начальство, а конечный потребитель. И если у него узкий канал (а даже у миллиардера может быть узкий канал, если он в данный момент на яхте в неведомых ебенях, где даже спутники срать боятся), то применение вполне оправдано. И начальству это понравится, ибо лучше иметь клиента, морщащегося от кривого сайта,чем не иметь его вообще.

Это сообщение отредактировал Nihilcurans - 6.02.2026 - 06:49
 
[^]
Понравился пост? Еще больше интересного в Телеграм-канале ЯПлакалъ!
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии. Авторизуйтесь, пожалуйста, или зарегистрируйтесь, если не зарегистрированы.
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) Просмотры темы: 2787
0 Пользователей:
Страницы: (3) [1] 2 3  [ ОТВЕТИТЬ ] [ НОВАЯ ТЕМА ]


 
 



Активные темы






Наверх