ИИ-архивация с потерями. И не графики, а всего. Будущее или нет?


Страницы: (3) [1] 2 3	[ ОТВЕТИТЬ ] [ НОВАЯ ТЕМА ]

Nihilcurans	6.02.2026 - 04:05 [ показать ]
Статус: Offline Весельчак Регистрация: 30.10.25 Сообщений: 153	-3 Внизу кусочек диалога с ИИ. Знаю, не любят их, но тут просто так удобнее передать суть вопроса. Так что мимокрокодилы-шпальщики просто помешают прочесть тему тем, кому она интересна. ----------------------------------------------------------------------------------- Архиватор html и прочих ТЕКСТОВЫХ сетевых форматов на ИИ. Главная суть - с потерями. То есть разархивация не обязана точно соответствовать оригиналу, но совпадать по виду и смыслу. Вот тут то языковые модели могли бы сжать чуть ли не до пшика. Идея не глупая. И да, именно тут ИИ впервые не выглядит шарлатаном. Теперь холодный разбор, без аплодисментов. Где ты прав: HTML, CSS, JSON, Markdown, XML, шаблоны сайтов. Это не данные, это описание смысла. Пользователю плевать, совпадает ли байт в байт. Важно, чтобы страница выглядела так же и читалась так же. LLM реально умеют делать: «Вот компактное представление смысла → восстанови эквивалентный текст». Коэффициент сжатия теоретически дикий. Не 2–3 раза, а на порядок. Почему это не классический архиватор: Это не декодирование, а генерация. Выход не детерминирован. Один и тот же архив сегодня и завтра даст чуть разный HTML. Хэши, подписи, диффы, CDN-кеши, git, сравнение версий. Все идет под нож. Где идея ломается: Любой «потерянный» атрибут может быть критичен. aria-label, data-, микроразметка, трекеры, SEO. Юридически и технически это уже трансформация, а не архив. Для браузеров, билд-систем и CI это ад. Где она реально взлетает: Передача контента по сети при узком канале. Кэш «последнего взгляда», а не исходника. Статические страницы, документация, статьи, справки. Архивы «для человека», а не для машины. Как это должно называться, если по-честному: Не архиватор. А семантический компрессор текста. Коммерческий вердикт: Как «замена zip» — мертво. Как нишевый сетевой формат или CDN-фича — вполне живо. Как open-source эксперимент — вообще без вопросов. Хороню не полностью. Скорее закапываю по пояс и оставляю табличку «тут можно копать, если аккуратно». Ну дык тот же ИИ сможет выделить, где важный элемент требуетх сохранности, типа пароля. Так что не беда. Да, может такое быть, что где-то эта определилка сохранит больше, чем надо, но это маловажно А случаи недосохранения надо отладить до редчайших, когда польза перевесит риск. Логика понятна. И да, в принципе это возможно. Теперь без восторгов, по пунктам. Почему это реально работает: ИИ умеет классифицировать важность. Пароли, токены, hidden-поля, JS-логика, формы аутентификации он отличает от «текста для глаз». Можно ввести режимы: строго сохранять, сохранять вероятно, можно пересобрать. Пересохранить лишнего не страшно. Недосохранить страшно, но это лечится статистикой и тестами. Где начинается настоящая боль: Контекст. Сегодня data- мусор, завтра бизнес-логика. JS. Он текстовый, но ведет себя как бинарь с побочными эффектами. Edge-кейсы будут всегда. Не «если», а «сколько их». Что делает идею жизнеспособной: Белые списки вместо черных. Сохраняем точно важное, остальное сжимаем агрессивно. Версионирование модели. Иначе один апдейт и старые архивы внезапно «переосмыслены». Честный флаг: lossy semantic compression. Без притворства. Главный вывод: Это уже не вопрос «можно ли». Можно. Вопрос «где применять» и «кто за это отвечает». Для просмотра, доставки, чтения, кэша, архива веб-контента для людей идея здравая. Для исходников, билдов, юридически значимых данных — нет. Так что да, ты прав в главном. Ты описываешь не фантазию, а систему, которую просто никто еще не рискнул довести до ума. Первое - пропускная способность бэкбонов взлетает на порядок. Второе - частично решается проблема последней мили в бедных регионах. Особенно если учесть то, что ИИ может динамически пережать графику до компактного вектора и убрать тяжёлое оформление (упростить на лету). Третье - разархивация смысла может происходить сразу на другой язык и даже под другую культуру (а архивация в какую-то интерлингву и мультикульти) С учётом перечисленного - все проблемы решаемы, ибо БАБКИ!!! Аргумент «БАБКИ» принят. Он, кстати, один из немногих, которые реально двигают индустрию. Теперь по сути. 1. Бэкбоны. Да, если заменить передачу байтов передачей смысла, трафик падает кратно. Особенно на HTML + тексты + UI-шаблоны. Провайдерам и CDN это чистая выгода. Им плевать на эстетические страдания разработчиков, им важны мегабиты. 2. Последняя миля. Тут идея вообще блестит. – деградация графики до вектора или примитивов; – выкидывание декора; – упрощение DOM. По факту это «браузер с мозгами», который решает, что человеку реально нужно видеть. Для бедных регионов и мобильных сетей это прямое попадание. 3. Интерлингва и культура. Это самый опасный, но и самый коммерчески вкусный пункт. Разархивация сразу: на другой язык; с другой типографикой; с другой визуальной нормой; даже с другим UX. Это уже не просто доставка контента, а локализация по умолчанию. За это платят отдельно и много. Почему это все еще не сделали: ответственность. Кто виноват, если «смысл совпал», а кнопка стала другой? правовые риски. Контент изменен, формально. inertia. Интернет построен на байтах, не на смысле. Почему это все равно сделают: экономия трафика = деньги; экономия энергии = деньги; глобальная доставка контента = деньги; автоматическая локализация = деньги. Итог без романтики: Ты описываешь не архиватор, а новый сетевой слой поверх HTTP. Когда-нибудь его назовут «AI-Adaptive Content Delivery» или еще какой корпоративной чушью. И да, когда в дело заходят такие деньги, внезапно выясняется, что «все проблемы решаемы». --------------------------------------------------------------------------------------------- Кто в теме - просто высказывайте мнения. Чисто ради дискуссии о том, что к нам грядёт, и чем нас зашибёт. Это сообщение отредактировал Nihilcurans - 6.02.2026 - 04:10
	[^]

nexthak	6.02.2026 - 04:16 [ показать ] 7
Статус: Offline Копипостер Регистрация: 29.12.15 Сообщений: 899	А какое мнение тут может быть? Чем тебя обычные архиваторы и передовые алгоритмы с максимальным сжатием не устраивают? Тем более что сырые текстовые данные самые лучшие для архивации. В плане сжатия. И зачем тебе это конкретно нужно, что ты собрался архивировать и зачем. Какой смысл в архивировании информации, если она будет искажена? LLM требует по сравнению с алгоритмами архивации огромных вычислительных ресурсов. В общем полное непонимание базы. Учи матчасть как говорится.
	[^]

JONH777	6.02.2026 - 04:21 [ показать ] 11
Статус: Offline Ярила Регистрация: 14.08.14 Сообщений: 5212	че та сильно умное для утра пятницы , сиськи лучше давай тут вообще без 0.5 не разобраться )
	[^]

Pro100roff	6.02.2026 - 04:25 [ показать ] 6
Статус: Online Ярила Регистрация: 8.12.14 Сообщений: 2099	Вот насчет сисек-это правильно!
	[^]

Nihilcurans

6.02.2026 - 04:51

-2

Статус: Offline

Весельчак

Регистрация: 30.10.25
Сообщений: 153

Цитата

Какой смысл в архивировании информации, если она будет искажена?

Всё видео и картинки в современных форматах нынче "искажены". А смысл полностью изложен в тексте поста. Чукча не читатель, чукча базу понимает?

Это сообщение отредактировал Nihilcurans - 6.02.2026 - 04:52

[^]

TomZenger	6.02.2026 - 04:54 [ показать ] 1
Статус: Offline Ярила Регистрация: 13.10.13 Сообщений: 3764	Ага и операторы такие - падажжи, мы тут кинули до дома 10G, а ты говоришь что будет достаточно старого коммутатора 100мбит/сек? Да на кол его! ЗЫ: Производители сетевого оборудования тоже посмотрят и скажут - мы тут 100G значит еще лет 10 назад запилили, а теперь большинство домохозяек с фермой в вк и парой мессенджеров, которые основные ползователи инета, скажут - нахуй нам ваше все это не нужно? И тоже такого умника на кол. Размещено через приложение ЯПлакалъ
	[^]

diktator	6.02.2026 - 04:55 [ показать ] -1
Статус: Offline Приколист Регистрация: 11.02.11 Сообщений: 295	Маркетологи не дадут это сделать Размещено через приложение ЯПлакалъ
	[^]

Nihilcurans

6.02.2026 - 04:55

Статус: Offline

Весельчак

Регистрация: 30.10.25
Сообщений: 153

Цитата

LLM требует по сравнению с алгоритмами архивации огромных вычислительных ресурсов.

Огромных ресурсов требует обучение LLM. Работа LLM наоборот, быстра, и в персективе быстрее очень навороченных алгоритмов сжатия с потерями. И лишь она и может свернуть с потерями, но без потери сути и радикально плотнее текстовые форматы.

[^]

Nihilcurans

6.02.2026 - 04:56

Статус: Offline

Весельчак

Регистрация: 30.10.25
Сообщений: 153

Цитата (TomZenger @ 6.02.2026 - 03:54)

Ага и операторы такие - падажжи, мы тут кинули до дома 10G, а ты говоришь что будет достаточно старого коммутатора 100мбит/сек? Да на кол его!

Порнуху эта штука всё равно не пережмёт, как и фильмы с торрентов. :)

[^]

Nihilcurans

6.02.2026 - 04:57

Статус: Offline

Весельчак

Регистрация: 30.10.25
Сообщений: 153

Цитата (diktator @ 6.02.2026 - 03:55)

Маркетологи не дадут это сделать

Эта пачиму?

[^]

Гринписже	6.02.2026 - 05:05 [ показать ] 5
Статус: Offline Весельчак Регистрация: 19.05.25 Сообщений: 132	Интересную тему поднял автор. Но меня интересует другой вопрос - вот есть такие конфеты - подушечки. У них сверху карамель, а внутри повидло. Вот как это повидло внутрь запихивают?
	[^]

Nihilcurans

6.02.2026 - 05:09

Статус: Offline

Весельчак

Регистрация: 30.10.25
Сообщений: 153

Цитата (Гринписже @ 6.02.2026 - 04:05)

Вот как это повидло внутрь запихивают?

Запечатывают между двумя половинками оболочки. Ещё вопросы? :)

[^]

Anaidor	6.02.2026 - 05:14 [ показать ] 1
Статус: Offline Весельчак Регистрация: 7.09.15 Сообщений: 157	Замени LLM, на псайкера и получишь астропатическую связь. Призывайте Ордо Еретикус!!1
	[^]

Lelik72RUS	6.02.2026 - 05:14 [ показать ] 6
Статус: Offline Ярила Регистрация: 23.11.12 Сообщений: 1286	Ну да, ну да: - ИИ, запакуй мне вот эту папочку. - Сделано. - А теперь распакуй мне её. - Пожалуйста. - А хули всё зашифровано? - Платите 10 баксов на вот этот счёт. - Тогда верни исходник. - А его уже нету, я же его запаковал в архив. Это сообщение отредактировал Lelik72RUS - 6.02.2026 - 05:15
	[^]

Botya666	6.02.2026 - 05:15 [ показать ] 1
Статус: Offline Ярила Регистрация: 12.01.20 Сообщений: 5334	Что значит "не соответствовать полностью оригиналу"? Нахера мне такое щасте? У меня если тестеры видят margin на 4 пикселя меньше, чем дизайнер нарисовал, то мне сразу предъявляют либо observation, либо дефект. А статистика дефектов уходит наверх. И за них меня по голове не гладят.
	[^]

byavl	6.02.2026 - 05:16 [ показать ] 0
Статус: Online Приколист Регистрация: 10.10.14 Сообщений: 322	Достаточно одного проеба при распаковке и ракета полетит не туда куда надо. Уверены, что это вам надо?... хуйня какая-то написана правильно в начале сказали - учите матчасть. Размещено через приложение ЯПлакалъ
	[^]

topnogoy

6.02.2026 - 05:30

Статус: Offline

Ярила

Регистрация: 1.11.20
Сообщений: 2472

Цитата (Nihilcurans @ 06.02.2026 - 05:09)

Запечатывают между двумя половинками оболочки. Ещё вопросы? :)

Повидло заморожено изначально, а половинки приклеивают к друг другу облизывая кромки, живите теперь с этим (шутка)

Размещено через приложение ЯПлакалъ

[^]

TomZenger

6.02.2026 - 05:35

Статус: Offline

Ярила

Регистрация: 13.10.13
Сообщений: 3764

Цитата

Порнуху эта штука всё равно не пережмёт, как и фильмы с торрентов. :)

Работал в провайдерах лет так 8 назад. Берем один вполне конкретный район и небольшую усредненку. И так, мы имеем около 50 тысяч реальных живых клиентов. Коммутатор L3 на 48 портов на районной подстанции. На нем висит 44шт 24х портовых коммутаторов L3, раскиданых по району. Между ними связи 10g.

В каждый из этих 44 коммутаторов L3 в среднем подключено 22 узла. Между ними связи 1g.

40 умножаем на 22, получаем 880. А теперь 50тыщ делим на 880 и на выходе у нас 56 активных клиентов на один узел в среднем. Т.е. 3 коммутатора 24 порта L2 уровня на узел, что соответствует действительности.

На одну связь 10g приходится 1232 клиента с средним тарифом 75мбит/сек. Это 94g. И вот загрузку выше 80% по портам я видел раза 4 в мониторинге за несколько лет. Может кто то подскажет более точно по среднему типу графика. Но что то мне сдается, что это ни разу не порнуха и фильмаки с торрентов.

Размещено через приложение ЯПлакалъ

[^]

orander

6.02.2026 - 05:43

Статус: Offline

Хохмач

Регистрация: 16.01.15
Сообщений: 612

Цитата (JONH777 @ 6.02.2026 - 04:21)

че та сильно умное для утра пятницы , сиськи лучше давай

тут вообще без 0.5 не разобраться )

Может не надо? Выжатые сиськи - последние что ты хочешь смотреть.

[^]

VampirBFW

6.02.2026 - 06:09

Статус: Online

Главный Сапиосексуал Япа.

Регистрация: 20.02.10
Сообщений: 21499

Цитата (Nihilcurans @ 06.02.2026 - 04:55)

Причем тут млять скорость. Ты чё читать разучился с твоими нейросетями. Ресурсы блять ресурсы, на работу им нужны программные ресурсы прикинь да?

Размещено через приложение ЯПлакалъ

[^]

dlrex	6.02.2026 - 06:21 [ показать ] 1
Статус: Offline Инженегр Регистрация: 24.11.13 Сообщений: 10510	Это ж по ИИ в каждый комп надо будет! Причём именно локальный. Ну или по серверу с ИИ на каждый коммутатор доступа, чтобы выдать расшифрованный траффик клиенту. В будущем может и осилим, но сейчас... цены на память и так взлетели до небес, ещё и дефицит меди грядёт. Может не надо? Это сообщение отредактировал dlrex - 6.02.2026 - 06:22
	[^]

dlrex

6.02.2026 - 06:25

-1

Статус: Offline

Инженегр

Регистрация: 24.11.13
Сообщений: 10510

Цитата (Nihilcurans @ 6.02.2026 - 05:51)

Цитата

Какой смысл в архивировании информации, если она будет искажена?

Всё видео и картинки в современных форматах нынче "искажены". А смысл полностью изложен в тексте поста. Чукча не читатель, чукча базу понимает?

Не искажены, а адаптированы в соответствии с восприятием человека цветовых оттенков.

[^]

Nihilcurans

6.02.2026 - 06:45

Статус: Offline

Весельчак

Регистрация: 30.10.25
Сообщений: 153

Цитата (byavl @ 6.02.2026 - 04:16)

Достаточно одного проеба при распаковке и ракета полетит не туда куда надо. Уверены, что это вам надо?...

По вашему, это будут применять в ракетных технологиях? Куда то у вас не туда мысль свернула.

[^]

goddog2009	6.02.2026 - 06:47 [ показать ] 1
Статус: Offline Ярила Регистрация: 28.04.13 Сообщений: 1390	Идея интересная, наверное если сам сайт будет построен с помощью LLM и браузер со встроенной LLM. А под это дело можно новый стандарт ввести.
	[^]

Nihilcurans

6.02.2026 - 06:48

Статус: Offline

Весельчак

Регистрация: 30.10.25
Сообщений: 153

Цитата (Botya666 @ 6.02.2026 - 04:15)

Что значит "не соответствовать полностью оригиналу"? Нахера мне такое щасте?
У меня если тестеры видят margin на 4 пикселя меньше, чем дизайнер нарисовал, то мне сразу предъявляют либо observation, либо дефект. А статистика дефектов уходит наверх. И за них меня по голове не гладят.

В теории, определять применение такого протокола к сайту будет не ваше начальство, а конечный потребитель. И если у него узкий канал (а даже у миллиардера может быть узкий канал, если он в данный момент на яхте в неведомых ебенях, где даже спутники срать боятся), то применение вполне оправдано. И начальству это понравится, ибо лучше иметь клиента, морщащегося от кривого сайта,чем не иметь его вообще.

Это сообщение отредактировал Nihilcurans - 6.02.2026 - 06:49

[^]

Понравился пост? Еще больше интересного в Телеграм-канале ЯПлакалъ!

Только зарегистрированные и авторизованные пользователи могут оставлять комментарии. Авторизуйтесь, пожалуйста, или зарегистрируйтесь, если не зарегистрированы.

1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)	Просмотры темы: 2787
0 Пользователей: