台灣個人新聞台個案
(簡體)中文互聯網正在加速崩塌
(原公眾號文已消失)
先問你一個小問題:如果我們在百度上搜索「馬雲」這兩個字,把時間設定在1998年到2005年,能搜出來的資訊,大概有多少條呢? 是1億條,還是1000萬條,還是100萬條? 我在幾個群問過,大家普遍的猜想是,應該是百萬或者千萬的級別。 畢竟,互聯網資訊如此浩如煙海。 馬雲作為那個時代的風雲企業家,在網上留下的痕跡肯定是非常多的。
但實際上能搜出的全部結果如下:(只有一條)
用百度搜索,選定日期範圍為“1998年5月22日到2005年5月22日”,含有馬雲的信息,總共是1條(2024年5月22日數據)。
而僅有的這一條資訊,也是虛假的。 點進去會發現,文章的發佈時間其實是2021年,不屬於上面限定的時間段,只是不知怎麼回事,它被莫名其妙地搜索出來。
也就是說,如果我們想要瞭解那一段時間關於馬雲的經歷、報導、人們對他的討論、他的講話、公司的發展史等等,我們能得到的有效的原始資訊量,是零。
你可能會覺得,這是不是百度的問題啊? 如果換必應或Google,會不會能搜出來?
我測試過,這兩個網站搜出來的有效資訊,和百度沒有太大區別,比百度略多一些,但也只是個位數。 更多的也都是時間紊亂的無效資訊,只不過不知道是什麼技術原因,被錯誤地抓取出來。
你可能還會覺得,是不是因為馬雲屬於比較有爭議的人,由於某種不可描述的原因,所以他的資訊才無法搜到?
但實際上,不僅僅是馬雲的情況如此,我們去搜馬化騰、雷軍、任正非等,甚至是羅永浩和芙蓉姐姐這樣在那個時候紅極一時的網紅,或周杰倫、李宇春那樣曾經火遍全網的明星,結果也都一樣的。 如搜雷軍的情況,結果是這樣的:
在測試過不同網站、不同人名、不同時間段之後,我發現一個令人震驚的現象:
幾乎所有在那個年代曾經紅火過的中文網站,如網易、搜狐、校園BBS、西祠衚衕、凱迪貓眼、天涯論壇、校內網(人人網)、新浪博客、百度貼吧、以及大量的個人網站等,在一定年份之前的資訊都已經完全消失不見了,甚至大部分網站是所有年份的資訊都消失了。 唯一例外的是新浪網,還能找到一些十幾年前的資訊,但也是極少數的寥寥幾條,其他99.9999%以上的內容,全都消失了。
大家都沒有意識到一個嚴重的問題:中文互聯網正在迅速崩塌,移動互聯網出現之前的中文互聯網內容,已經幾乎消失殆盡。
我們原以為,互聯網是有記憶的,但沒有想到,這種記憶,原來是像金魚一樣的記憶。
2
我之所以注意到這個問題,是因為何加鹽公眾號的主題是研究牛人,所以我需要經常查找他們的資料。
這兩年來,我有一個非常明顯的感覺:網上能找到的原始資料,每年都以斷崖式的速度在銳減。 之前還能看到一些原始的報導,後來慢慢沒有了; 之前還能找到主人公的演講或者他們寫的文章,後來慢慢找不到了; 之前還能看到很多採訪或對談的視頻,後來慢慢消失了。
似乎有一個吞噬網頁的怪獸,它沿著歷史的時間線,從過去向著現在吞噬,先是小口小口,然後大口大口,把中文互聯網的一切內容,以五年、十年為單位,一口吞掉。
等我們回過神來,會發現,在移動互聯網之前曾經存在過的中文互聯網的一切,不管是入口網站、機構官方網站、個人網頁,還是校園BBS、公眾論壇,還是新浪博客、百度貼吧,還是檔、照片、音樂、視頻等,都已消失不見。
記得十幾年前,我曾經因為換電腦,把一些照片和文章打成一個壓縮包,存在某BBS上,幾年之後發現,那整個BBS都沒有了。 我曾經用過hotmail的郵箱,裡面有很多很珍貴的郵件,後來全都沒有了。 我還寫過人人網、MySpace,後來全都沒有了。
我們曾經以為互聯網可以保留一切,但結果是一切都沒能保留。
這讓我想起劉慈欣《三體》裡面提到過的“二向箔”。 歌者文明發現了太陽系有智慧生物的存在,出於宇宙先進文明的清除本能,他們向太陽系扔出一張二向箔,於是,整個太陽系以光的速度從三維坍塌成二維,變化成一張酷似梵古“星空”的畫片。 一切生命、一切文明的痕跡,從此都不復存在。
在互聯網上,我們已經處於二向箔的吞噬之中。 這種二向箔可以稱之為“時間的二向箔”,它吞噬的是時間那一維。
太陽系被歌者文明的二向箔拍扁之後,好歹還留下了一幅《星空》圖,而互聯網被時間的二向箔吞噬後,只留下一片虛空。
3
為什麼會出現這種情況呢? 我猜想,主要原因可能是兩個:
一是經濟原因。
網站的存在,需要伺服器、需要頻寬、需要機房、需要人員運維,還有很多雜七雜八的監管和維護費用,這些都是成本。 如果是有戰略價值(例如需要向外展示公司想要展示的資訊),或者有短期流量價值(例如還時不時有較多的人上來看),同時公司賬上也不差錢,那麼還會有動力去維持。
但是如果公司在商業上走了彎路,沒錢了,整個網站就會直接死掉。 例如人人網就是典型代表。
即便公司還有錢,從運營的角度來看,如果一個網頁一年到頭都沒有幾個人來點擊,對公司來說,就成了一筆負擔,從經濟上最理性的方法,就是直接關掉。 搜狐、網易早年的內容大量丟失,以及以天涯論壇為代表的BBS集體消亡,都是這個原因。
二是監管原因。
總體而言,互聯網信息的監管,是從無到有,從寬到嚴,從嚴到更嚴的過程。 以前可以合法存在的內容,後來不符合監管要求了; 或者是以前可以灰色存在的內容,後來被定義為黑色了。 這些內容都會直接被咔嚓掉。
還有一些是隨著時代的變化,輿論的兩極分化越來越極端,以前“只道是平常”的內容,在後來的輿論環境中顯得非常尖銳、敏感,儘管不違法,但是可能激化矛盾,形成混亂,監管方也有可能會要求處理掉。
除了官方部門之外,憤怒的網友,也時時充當著輿論監管員的角色。 他們會翻出十幾年前某人無意中說的某句話,揪著不放,把人網暴至“社會性死亡”。
但監管上最重要的影響,還不是監管部門的處理或憤怒網友的攻擊,而是它們會造成公司與個人的“自我審查”。
因為誰也不知道,網站上存在的哪一條內容,某人曾說過的哪一句話,會不會在若干年後,給當事人帶來滅頂之災。 最好的辦法,就是直接把這些潛在的“定時炸彈”全部清除,也就是把網站關掉或者把內容全部刪除。
當然,除了上述兩個原因之外,還會有其他很多原因。
例如,在南斯拉夫解體之後不久,所有“yu”(南斯拉夫國名Yugoslavia的縮寫)這個國際域名之下的網頁內容全部消失了。 又如,隨著版權保護的加強,曾經隨處可下載的音樂和電影網站,就都消失了。 還有一些機構和個人,純粹是由於自己的原因,不想在對外展示資訊了,就把官網或個人主頁關掉等等。
但這些原因都是次要的、局部的。 整個互聯網內容系統性的、大規模的消失,主要就是由於經濟規律和自我審查。
本質上,互聯網內容和生命一樣,也受進化論的支配。 其存在的標準只有一條:以盡可能低的成本爭取盡可能多的注意力。
當一個內容能夠在互聯網上的海量內容中爭取到足夠多的注意力,而維持這個內容的成本(包括經濟成本、監管成本和對抗監管的成本)比其他方式更低時,這個內容就有可能存活在互聯網上。 只不過它有可能會換一種呈現方式,例如從文字變為圖片,從靜圖變為動圖,從動圖變為視頻,未來可能從二維視頻變為三維全息視頻等等。 承載這個內容的平臺也會變遷,從入口網站到BBS,到個人博客,到微博微信,到抖音視頻號,到未來可能一個我們不知道什麼平臺。
當一個內容不能再吸引到足夠多的注意力,或者維持這個內容的成本比其他方式更高時,這個內容就會從互聯網上消失。 以電腦為流覽端、以網頁為載體的傳統互聯網的集體消亡,只不過是這種“資訊進化競爭”的必然結果而已。
生物的進化秘訣是「物競天擇,適者生存」,而互聯網內容的進化秘訣是「資訊競,注意力擇,適者生存」。。 由於網路效應,這種競爭比自然界還要猛烈萬倍,殘酷萬倍。 傳統互聯網不是單個物種式的滅絕,而是幾乎所有內容的整體性滅絕。
每一代新的互聯網崛起,舊的互聯網必將崩塌,時間二向箔是所有網站、所有內容無可逃避的宿命。
4
如果未來的文明是互聯網的文明。 我們這一代人,將是沒有歷史的。 因為互聯網沒有留下我們的痕跡。
“沒有歷史”,這件事情重要嗎?
當然很重要。
我曾經為了寫邵亦波的文章,想盡了一切辦法,試圖找到邵亦波2007年參加《波士堂》節目的原始視頻,以及他妻子鮑佳欣以“文愛媽咪”網名在寶寶樹社區發了好幾年的帖子。 最終還是沒有找到,只能深深遺憾。
雖然《紅塵已忘邵亦波》那篇文章,依然很受大家歡迎,短短一周就有70多萬人閱讀,2萬多人轉發,但我十分肯定,我一定還是錯過了某些非常重要的資訊。 如果它們能呈現在那篇文章里,文章品質會更好。
但是我找不到,就只能讓文章以不完美的方式呈現。
你可能會覺得:這隻是對何加鹽這樣的研究者和寫作者有用,我又不寫這樣的文章,互聯網信息沒有就沒有了,對我又沒什麼影響。
真的嗎?
如果我們已經看不到馬雲的所有演講,看不到任正非的以《我的父親母親》和《一江春水向東流》為代表的所有文章,看不到段永平在雪球的所有發帖,你會不會覺得有點可惜?
好吧,你說你並不覺得可惜。
那如果我們已經搜不到黃崢的公眾號,看不到張一鳴的微博,上不了王興的飯否,你會不會覺得有點遺憾?
好吧,你說你也並不覺得遺憾。
那如果某一天,知乎如同天涯論壇一樣沒了,豆瓣就像人人網一樣消失,B站好比新浪博客一樣已無人問津,你會不會有點心痛?
如果某一天,你喜歡的微博博主所有的微博只顯示「作者已設置只展示半年內微博,此微博已不可見」,你常看的公眾號只顯示「此帳號已被遮罩,內容無法查看」,你在抖音或小紅書搜索某些資訊,結果顯示「作者已清空全部內容」......
甚至,微博、公眾號、抖音、小紅書,就像曾經存在過的bbs、貼吧、空間、博客一樣,全部消亡......
你會不會為此難過哪怕是短短的一分鐘?
作為傳統互聯網的一代人,七零后、八零后已經找不回我們的歷史。 因為它們已經全部消失了。
新生代也許還能看看朋友圈,但是朋友圈也越來越多“三天可見”,越來越沉默不語。
唯一還在熱情發圈的,只剩下一水的營銷資訊。
未來就連這些營銷資訊,也終將消亡。
5
如果一件事對我們很重要,而它正在消亡,我們有什麼辦法挽救它嗎?
有人曾作出這樣的嘗試。 美國有一個網站叫做“Internet Archive”,中文譯作“互聯網檔案館”,保存了很多原始網頁。 但是我試過,中文的原始網頁,保存的很少,而且使用非常麻煩,搜索功能十分原始低效,和沒保存差不多。
從技術層面來講,保存從中國有互聯網以來,到移動互聯網興起的十來年時間的所有網頁,應該並不難,成本也不高,畢竟比起現在的視頻時代,原始互聯網的那些圖文網頁,佔的空間幾乎可以忽略不計。
問題是,誰來做這件事,有什麼動機?
商業機構不會做。 因為沒有任何商業利益。
政府或許可以像建圖書館、博物館一樣,搞一個能保存所有網頁的檔案館。 但是政府為什麼要花錢費力幹這件事? 除了保存歷史之外,似乎也沒有其他理由。 再說了,就算是政府做了這件事,對普通線民也沒有任何意義,因為這個檔案館肯定也會需要一定的登陸許可權,以免資訊被濫用。
況且,就算是有機構願意做這件事,現在也晚了。 移動互聯網興起之後,傳統互聯網的中文內容,幾乎已經消失殆盡了。 粗略估算,99%以上應該都已經沒有了。
從某種意義上,何加鹽寫的牛人系列文章,也為保存這些牛人們存在過的歷史,做出了一點貢獻。 如果我沒有寫他們,很多歷史就已經在網上找不到了。 但畢竟這也不是原始資訊,只是經我整合過的二手資訊。
現在的中文互聯網上,這個世紀前十年發生過的所有重大事件,所有留下過深深痕跡的名人,目前還能找到的信息,幾乎已經全是經自媒體編輯過的二手資訊,甚至是傳過多手,早已面目全非的資訊。
關於它們的原始報導沒有了,原始視頻沒有了,原始講話沒有了,原始的網友目擊沒有了,原始的評論沒有了......
再過一些年,這些二手資訊和N手資訊,也都會消失。 就像那些事件從未發生過、那些人從未存在過一樣。
我們已經無能為力,只能接受現實。
在未來的互聯網時代里,回首看21世紀的前二十年,將是沒有歷史記錄的二十年。
我們是互聯網時代消失的一代人。
如果你現在還能看到一些中文互聯網的古早資訊,那只是夕陽的最後一抹餘暉。
如果你明白了它們的轉瞬即逝,可能會像臨死前的浮士德一樣感歎:
你真美啊,請停留一下吧。
但那抹餘暉,很快將和你這句感歎一起,被時間的二向箔吞沒,陷入虛空。
《三體》中,程心和艾AA還能有幸乘坐唯一的一艘曲率飛船,逃離正在二維化的太陽系。
而我們,連曲率飛船都沒有。
逃無可逃。
現在你所看到的、你所創造的幾乎所有內容,連同這篇文章,這個平臺,終究也會淹沒在虛空中。