Интернет исчезает: четверть всех веб-страниц с 2013 по 2023 год превратится в дронта.

Интернет исчезает: четверть всех веб-страниц с 2013 по 2023 год превратится в дронта.

Будучи обеспокоенным и давним пользователем Интернета, эти выводы действительно вызывают тревогу. Мысль о том, что богатство знаний и информации, накопленное в сети за последние несколько десятилетий, может исчезать такими тревожными темпами, одновременно разочаровывает и тревожит.


Оказывается, как предполагает исследование Pew Research Center под названием «Когда онлайн-контент исчезает», наш заветный Интернет может ускользнуть из-под нашего контроля — тревожная четверть веб-страниц, созданных в период с 2013 по 2023 год, больше не доступна.

Несмотря на распространенное мнение, что контент в Интернете сохраняется навсегда, недавнее расследование показало, что примерно 38% веб-страниц, существовавших еще в 2013 году, с тех пор исчезли (по данным The Independent). Это также не связано с возрастом страниц.

Примерно восемь процентов веб-страниц, существовавших в 2023 году, исчезли или больше не доступны.

Исследовательская группа использовала Common Crawl, хранилище с открытым исходным кодом, в котором хранятся огромные объемы данных веб-сканирования, а также доступные для общественности архивы и наборы данных. Они случайным образом выбрали из этой коллекции более миллиона веб-страниц, впоследствии проверили функциональность их ссылок и определили те, которые пополнили ряды просроченной или утерянной информации в Интернете.

Я был поражен, обнаружив, что почти четверть новостных веб-сайтов и одна пятая правительственных сайтов, которые я исследовал, содержали по крайней мере одну неработающую ссылку. Но самым тревожным открытием было то, что более половины страниц Википедии, которые я проверил, имели несуществующую ссылку, что затрудняло проверку точности представленной информации.

В современном мире, находящемся под сильным влиянием Интернета, поиск точной информации имеет важное значение. Тем не менее, растущая проблема обманного контента, создаваемого ИИ, представляет собой серьезную проблему. Мы не можем позволить себе игнорировать драгоценные ресурсы достоверной информации, существовавшие до эпохи искусственного интеллекта.

Как любопытный геймер, углубляющийся в цифровой мир, я наткнулся на обескураживающие выводы. Недавнее расследование показало, что почти половина (46,9%) интернет-активности осуществляется ботами. Эти автоматизированные объекты могут распространять дезинформацию, мутить воду и затруднять выход достоверных данных на поверхность.

Помимо растущей угрозы убедительных дипфейков, существуют боты, обобщающие новости с помощью искусственного интеллекта, которые ведут себя хаотично, а также неустанная монетизация Интернета, приводящая к уменьшению ценности тщательно исследованного контента из-за приоритета прибыли.

В будущем может быть сложно доверять вновь полученным данным, а поиск ранее известной информации, предшествующей любому потенциальному снижению, может стать все более трудным.

Эта статья, кажется, рисует мрачную картину, напоминающую мир-антиутопию. К сожалению, из-за скорости представления информации читателям может быть сложно проверить внешние ссылки до их исчезновения. Боюсь, нам придется доверять точности предоставленной информации.

Смотрите также

2024-05-23 14:36