2024年5月23日 星期四

互聯網崩潰



台灣個人新聞台個案


 (簡體)中文互聯網正在加速崩塌


(原公眾號文已消失)


先問你一個小問題:如果我們在百度上搜索「馬雲」這兩個字,把時間設定在1998年到2005年,能搜出來的資訊,大概有多少條呢? 是1億條,還是1000萬條,還是100萬條? 我在幾個群問過,大家普遍的猜想是,應該是百萬或者千萬的級別。 畢竟,互聯網資訊如此浩如煙海。 馬雲作為那個時代的風雲企業家,在網上留下的痕跡肯定是非常多的。


但實際上能搜出的全部結果如下:(只有一條)


用百度搜索,選定日期範圍為“1998年5月22日到2005年5月22日”,含有馬雲的信息,總共是1條(2024年5月22日數據)。


而僅有的這一條資訊,也是虛假的。 點進去會發現,文章的發佈時間其實是2021年,不屬於上面限定的時間段,只是不知怎麼回事,它被莫名其妙地搜索出來。


也就是說,如果我們想要瞭解那一段時間關於馬雲的經歷、報導、人們對他的討論、他的講話、公司的發展史等等,我們能得到的有效的原始資訊量,是零。


你可能會覺得,這是不是百度的問題啊? 如果換必應或Google,會不會能搜出來?


我測試過,這兩個網站搜出來的有效資訊,和百度沒有太大區別,比百度略多一些,但也只是個位數。 更多的也都是時間紊亂的無效資訊,只不過不知道是什麼技術原因,被錯誤地抓取出來。


你可能還會覺得,是不是因為馬雲屬於比較有爭議的人,由於某種不可描述的原因,所以他的資訊才無法搜到?


但實際上,不僅僅是馬雲的情況如此,我們去搜馬化騰、雷軍、任正非等,甚至是羅永浩和芙蓉姐姐這樣在那個時候紅極一時的網紅,或周杰倫、李宇春那樣曾經火遍全網的明星,結果也都一樣的。 如搜雷軍的情況,結果是這樣的:


在測試過不同網站、不同人名、不同時間段之後,我發現一個令人震驚的現象:


幾乎所有在那個年代曾經紅火過的中文網站,如網易、搜狐、校園BBS、西祠衚衕、凱迪貓眼、天涯論壇、校內網(人人網)、新浪博客、百度貼吧、以及大量的個人網站等,在一定年份之前的資訊都已經完全消失不見了,甚至大部分網站是所有年份的資訊都消失了。 唯一例外的是新浪網,還能找到一些十幾年前的資訊,但也是極少數的寥寥幾條,其他99.9999%以上的內容,全都消失了。


大家都沒有意識到一個嚴重的問題:中文互聯網正在迅速崩塌,移動互聯網出現之前的中文互聯網內容,已經幾乎消失殆盡。


我們原以為,互聯網是有記憶的,但沒有想到,這種記憶,原來是像金魚一樣的記憶。


2


我之所以注意到這個問題,是因為何加鹽公眾號的主題是研究牛人,所以我需要經常查找他們的資料。


這兩年來,我有一個非常明顯的感覺:網上能找到的原始資料,每年都以斷崖式的速度在銳減。 之前還能看到一些原始的報導,後來慢慢沒有了; 之前還能找到主人公的演講或者他們寫的文章,後來慢慢找不到了; 之前還能看到很多採訪或對談的視頻,後來慢慢消失了。


似乎有一個吞噬網頁的怪獸,它沿著歷史的時間線,從過去向著現在吞噬,先是小口小口,然後大口大口,把中文互聯網的一切內容,以五年、十年為單位,一口吞掉。


等我們回過神來,會發現,在移動互聯網之前曾經存在過的中文互聯網的一切,不管是入口網站、機構官方網站、個人網頁,還是校園BBS、公眾論壇,還是新浪博客、百度貼吧,還是檔、照片、音樂、視頻等,都已消失不見。


記得十幾年前,我曾經因為換電腦,把一些照片和文章打成一個壓縮包,存在某BBS上,幾年之後發現,那整個BBS都沒有了。 我曾經用過hotmail的郵箱,裡面有很多很珍貴的郵件,後來全都沒有了。 我還寫過人人網、MySpace,後來全都沒有了。


我們曾經以為互聯網可以保留一切,但結果是一切都沒能保留。


這讓我想起劉慈欣《三體》裡面提到過的“二向箔”。 歌者文明發現了太陽系有智慧生物的存在,出於宇宙先進文明的清除本能,他們向太陽系扔出一張二向箔,於是,整個太陽系以光的速度從三維坍塌成二維,變化成一張酷似梵古“星空”的畫片。 一切生命、一切文明的痕跡,從此都不復存在。


在互聯網上,我們已經處於二向箔的吞噬之中。 這種二向箔可以稱之為“時間的二向箔”,它吞噬的是時間那一維。


太陽系被歌者文明的二向箔拍扁之後,好歹還留下了一幅《星空》圖,而互聯網被時間的二向箔吞噬後,只留下一片虛空。


3


為什麼會出現這種情況呢? 我猜想,主要原因可能是兩個:


一是經濟原因。


網站的存在,需要伺服器、需要頻寬、需要機房、需要人員運維,還有很多雜七雜八的監管和維護費用,這些都是成本。 如果是有戰略價值(例如需要向外展示公司想要展示的資訊),或者有短期流量價值(例如還時不時有較多的人上來看),同時公司賬上也不差錢,那麼還會有動力去維持。


但是如果公司在商業上走了彎路,沒錢了,整個網站就會直接死掉。 例如人人網就是典型代表。


即便公司還有錢,從運營的角度來看,如果一個網頁一年到頭都沒有幾個人來點擊,對公司來說,就成了一筆負擔,從經濟上最理性的方法,就是直接關掉。 搜狐、網易早年的內容大量丟失,以及以天涯論壇為代表的BBS集體消亡,都是這個原因。


二是監管原因。


總體而言,互聯網信息的監管,是從無到有,從寬到嚴,從嚴到更嚴的過程。 以前可以合法存在的內容,後來不符合監管要求了; 或者是以前可以灰色存在的內容,後來被定義為黑色了。 這些內容都會直接被咔嚓掉。


還有一些是隨著時代的變化,輿論的兩極分化越來越極端,以前“只道是平常”的內容,在後來的輿論環境中顯得非常尖銳、敏感,儘管不違法,但是可能激化矛盾,形成混亂,監管方也有可能會要求處理掉。


除了官方部門之外,憤怒的網友,也時時充當著輿論監管員的角色。 他們會翻出十幾年前某人無意中說的某句話,揪著不放,把人網暴至“社會性死亡”。


但監管上最重要的影響,還不是監管部門的處理或憤怒網友的攻擊,而是它們會造成公司與個人的“自我審查”。


因為誰也不知道,網站上存在的哪一條內容,某人曾說過的哪一句話,會不會在若干年後,給當事人帶來滅頂之災。 最好的辦法,就是直接把這些潛在的“定時炸彈”全部清除,也就是把網站關掉或者把內容全部刪除。


當然,除了上述兩個原因之外,還會有其他很多原因。


例如,在南斯拉夫解體之後不久,所有“yu”(南斯拉夫國名Yugoslavia的縮寫)這個國際域名之下的網頁內容全部消失了。 又如,隨著版權保護的加強,曾經隨處可下載的音樂和電影網站,就都消失了。 還有一些機構和個人,純粹是由於自己的原因,不想在對外展示資訊了,就把官網或個人主頁關掉等等。


但這些原因都是次要的、局部的。 整個互聯網內容系統性的、大規模的消失,主要就是由於經濟規律和自我審查。


本質上,互聯網內容和生命一樣,也受進化論的支配。 其存在的標準只有一條:以盡可能低的成本爭取盡可能多的注意力。


當一個內容能夠在互聯網上的海量內容中爭取到足夠多的注意力,而維持這個內容的成本(包括經濟成本、監管成本和對抗監管的成本)比其他方式更低時,這個內容就有可能存活在互聯網上。 只不過它有可能會換一種呈現方式,例如從文字變為圖片,從靜圖變為動圖,從動圖變為視頻,未來可能從二維視頻變為三維全息視頻等等。 承載這個內容的平臺也會變遷,從入口網站到BBS,到個人博客,到微博微信,到抖音視頻號,到未來可能一個我們不知道什麼平臺。


當一個內容不能再吸引到足夠多的注意力,或者維持這個內容的成本比其他方式更高時,這個內容就會從互聯網上消失。 以電腦為流覽端、以網頁為載體的傳統互聯網的集體消亡,只不過是這種“資訊進化競爭”的必然結果而已。


生物的進化秘訣是「物競天擇,適者生存」,而互聯網內容的進化秘訣是「資訊競,注意力擇,適者生存」。。 由於網路效應,這種競爭比自然界還要猛烈萬倍,殘酷萬倍。 傳統互聯網不是單個物種式的滅絕,而是幾乎所有內容的整體性滅絕。


每一代新的互聯網崛起,舊的互聯網必將崩塌,時間二向箔是所有網站、所有內容無可逃避的宿命。


4


如果未來的文明是互聯網的文明。 我們這一代人,將是沒有歷史的。 因為互聯網沒有留下我們的痕跡。


“沒有歷史”,這件事情重要嗎?


當然很重要。


我曾經為了寫邵亦波的文章,想盡了一切辦法,試圖找到邵亦波2007年參加《波士堂》節目的原始視頻,以及他妻子鮑佳欣以“文愛媽咪”網名在寶寶樹社區發了好幾年的帖子。 最終還是沒有找到,只能深深遺憾。


雖然《紅塵已忘邵亦波》那篇文章,依然很受大家歡迎,短短一周就有70多萬人閱讀,2萬多人轉發,但我十分肯定,我一定還是錯過了某些非常重要的資訊。 如果它們能呈現在那篇文章里,文章品質會更好。


但是我找不到,就只能讓文章以不完美的方式呈現。


你可能會覺得:這隻是對何加鹽這樣的研究者和寫作者有用,我又不寫這樣的文章,互聯網信息沒有就沒有了,對我又沒什麼影響。


真的嗎?


如果我們已經看不到馬雲的所有演講,看不到任正非的以《我的父親母親》和《一江春水向東流》為代表的所有文章,看不到段永平在雪球的所有發帖,你會不會覺得有點可惜?


好吧,你說你並不覺得可惜。


那如果我們已經搜不到黃崢的公眾號,看不到張一鳴的微博,上不了王興的飯否,你會不會覺得有點遺憾?


好吧,你說你也並不覺得遺憾。


那如果某一天,知乎如同天涯論壇一樣沒了,豆瓣就像人人網一樣消失,B站好比新浪博客一樣已無人問津,你會不會有點心痛?


如果某一天,你喜歡的微博博主所有的微博只顯示「作者已設置只展示半年內微博,此微博已不可見」,你常看的公眾號只顯示「此帳號已被遮罩,內容無法查看」,你在抖音或小紅書搜索某些資訊,結果顯示「作者已清空全部內容」......


甚至,微博、公眾號、抖音、小紅書,就像曾經存在過的bbs、貼吧、空間、博客一樣,全部消亡......


你會不會為此難過哪怕是短短的一分鐘?


作為傳統互聯網的一代人,七零后、八零后已經找不回我們的歷史。 因為它們已經全部消失了。


新生代也許還能看看朋友圈,但是朋友圈也越來越多“三天可見”,越來越沉默不語。


唯一還在熱情發圈的,只剩下一水的營銷資訊。


未來就連這些營銷資訊,也終將消亡。


5


如果一件事對我們很重要,而它正在消亡,我們有什麼辦法挽救它嗎?


有人曾作出這樣的嘗試。 美國有一個網站叫做“Internet Archive”,中文譯作“互聯網檔案館”,保存了很多原始網頁。 但是我試過,中文的原始網頁,保存的很少,而且使用非常麻煩,搜索功能十分原始低效,和沒保存差不多。


從技術層面來講,保存從中國有互聯網以來,到移動互聯網興起的十來年時間的所有網頁,應該並不難,成本也不高,畢竟比起現在的視頻時代,原始互聯網的那些圖文網頁,佔的空間幾乎可以忽略不計。


問題是,誰來做這件事,有什麼動機?


商業機構不會做。 因為沒有任何商業利益。


政府或許可以像建圖書館、博物館一樣,搞一個能保存所有網頁的檔案館。 但是政府為什麼要花錢費力幹這件事? 除了保存歷史之外,似乎也沒有其他理由。 再說了,就算是政府做了這件事,對普通線民也沒有任何意義,因為這個檔案館肯定也會需要一定的登陸許可權,以免資訊被濫用。


況且,就算是有機構願意做這件事,現在也晚了。 移動互聯網興起之後,傳統互聯網的中文內容,幾乎已經消失殆盡了。 粗略估算,99%以上應該都已經沒有了。


從某種意義上,何加鹽寫的牛人系列文章,也為保存這些牛人們存在過的歷史,做出了一點貢獻。 如果我沒有寫他們,很多歷史就已經在網上找不到了。 但畢竟這也不是原始資訊,只是經我整合過的二手資訊。


現在的中文互聯網上,這個世紀前十年發生過的所有重大事件,所有留下過深深痕跡的名人,目前還能找到的信息,幾乎已經全是經自媒體編輯過的二手資訊,甚至是傳過多手,早已面目全非的資訊。


關於它們的原始報導沒有了,原始視頻沒有了,原始講話沒有了,原始的網友目擊沒有了,原始的評論沒有了......


再過一些年,這些二手資訊和N手資訊,也都會消失。 就像那些事件從未發生過、那些人從未存在過一樣。


我們已經無能為力,只能接受現實。


在未來的互聯網時代里,回首看21世紀的前二十年,將是沒有歷史記錄的二十年。


我們是互聯網時代消失的一代人。


如果你現在還能看到一些中文互聯網的古早資訊,那只是夕陽的最後一抹餘暉。


如果你明白了它們的轉瞬即逝,可能會像臨死前的浮士德一樣感歎:


你真美啊,請停留一下吧。


但那抹餘暉,很快將和你這句感歎一起,被時間的二向箔吞沒,陷入虛空。


《三體》中,程心和艾AA還能有幸乘坐唯一的一艘曲率飛船,逃離正在二維化的太陽系。


而我們,連曲率飛船都沒有。


逃無可逃。


現在你所看到的、你所創造的幾乎所有內容,連同這篇文章,這個平臺,終究也會淹沒在虛空中。

2024年5月14日 星期二

無序之美

 #無序之美:與椋鳥齊飛【諾貝爾物理學獎Parisi解開複雜系統的八堂思辨課】


√ 2021 年諾貝爾物理學獎Parisi的開創性研究 √


☆║諾貝爾物理學獎讚詞║☆

「Parisi發現了從原子到行星尺度的物理系統中,無序和漲落的相互作用。」

亂中有序——「複雜系統」背後存在著共同規律

解開21世紀跨領域間的普遍秩序


  ◎沒有指揮,鳥群為何能快速變化陣形?而且不會相撞?

  ◎微觀細節完全不同,集體行為卻相同?

  ◎看似完全無關的系統之間卻存在著共通性原理?

  ◎解決科學問題的典型過程與小說家創作過程一樣?


  ★一部天馬行空、妙趣橫生的大師之作!

  ★物理學家跑田野,打破你的慣性思維!

  ★看見頂尖科學家自我顛覆與突破的研究過程!

  ★破解21世紀AI技術、網際網路、神經網絡、金融波動、人際關係、流行病學等……多元領域間的共通框架


  愛因斯坦曾說,「21世紀是複雜科學的世紀」。本書是帕里西為一般讀者所寫,罕見用優雅簡潔的論述方式,解開複雜系統的內涵與真相,思想深刻、風趣幽默、深入淺出,忠實呈現並反思自己獲得諾貝爾獎關鍵性成果背後的研究經歷與教訓,令人驚奇且愉快。


  帕里西將科學實踐從實驗室中移出,來到椋鳥群飛的現場。冬天的羅馬,無數椋鳥有節奏地迴旋飛舞,遮蔽天空,就像有個樂隊指揮——這樣複雜的集體行為,是如何做到的?帕里西觀察鳥群的飛行、設計實驗、重建單個標本在空間和時間上的軌跡、建立3D圖像、深化技術操作、自承失敗重新設計……,最終,鳥群的飛行為複雜系統提供了一種啟發性的規則——包括從原子和行星到其他動物;許多不同的、看似毫無關聯的現象,例如大腦網絡、人際關係等,都可以用這種新的模式理解。


  帕里西揭示了微觀行為與宏觀規則之間的關聯;跨學科間合作的優點與缺失;為什麼保留過去的記憶以及理解每一代科學家在想什麼非常重要;1968年全球學運浪潮下,物理學院如何回應這股氛圍以及促進科學躍進;直覺推理、微創造力、隱喻與類比等在科學的重要性與作用?他更廣博深刻地談到科學的文化價值,科學對繁榮社會的意義等。


  每年我們都會興奮地觀看諾貝爾獎揭曉,卻很少人能理解每項發現背後所經歷的時間跨度、前人的努力。這艱辛的過程沒有留下任何痕跡,卻是美麗的。帕里西這本書讓我們看到這個過程。他說,科學需要創造力、大量的紀律,但也需要一點運氣。要取得優異成果,就不能害怕付出努力。


  無序系統的奇境世界已經向你敞開了大門,歡迎即刻進入。


作者: 喬治.帕里西  

原文作者: Giorgio Parisi

譯者: 文錚

出版社:野人  

出版日期:2024/05/08

定價:420元 (書店取書74折)

購書連結: https://tonsanbookstore.cyberbiz.co/products/9786267428597

2024年5月13日 星期一

A New Tree of Flowering Plants

  

A New Tree of Flowering Plants? For Spring? Groundbreaking.

By sequencing an enormous amount of data, a group of hundreds of researchers has gained new insights into how flowers evolved on Earth.

ImageA large circular graph with flower portraits representing different types of flowers on its outer edge.


A new, time-calibrated phylogenetic tree for angiosperms based on 353 nuclear genes.Credit...Baker et al., Nature 2024基於 353 個核基因的被子植物新的、經過時間校準的系統發育樹。


Now, after a heroic DNA sequencing effort, a collaboration involving hundreds of scientists has created a new family tree for flowering plants. Comparing gene sequences from more than 9,500 species — many of them dried specimens preserved in museums — scientists have sketched important branching points in the evolution of flowering plant life. In a study published in April in the journal Nature, the data they present suggests that more than 80 percent of major modern flowering plant lineages originated in a sudden burst of invention that began around 150 million years ago, in the late Jurassic Period.