February 19, 2006

搜尋技術的進步對於郵件與桌面系統的衝擊

這個標題似乎太嚴肅了,內文則恰好相反。晚上思考 zeta function 難以入眠,於是我又開始想 call for paper 的提案 (週四才被 hc 追殺過),反正現在失眠了,索性隨便紀錄想法 (與 call for paper 無關就是)。

我開始用 email,大概是在 1998 年,之前所有投稿或者書信往來,都是親手撰寫並透過傳統紙本傳遞。第一個使用的 email client 是 [NeoPlanet] 內建的,後來我因為興趣與工作需要,在 Win32、Linux、Solaris,以及 QNX 上切換開發環境,免不了要收 email,所以學習了若干個 mail client,像是 pine、mutt、KMail、... 等。那時候覺得 web mail 很蠢,而且自己對 SMTP 的不信任,導致跟 Web 掛勾的項目都直覺性地反感,記得有一次接一個案子,對方就是要我以 JavaMail 提供一個 WebMail 導向的整合環境,當時第一個反應是:「天阿!別鬧了」。

然而,曾幾何時,我漸漸捨棄習慣的 mail client,改用 GMail,過去嗤之以鼻的低效率、操作不便、不安全、垃圾郵件、... 的問題,竟然一掃而淨,我甚至開始將自己以 Giga bytes 計數的 mailing-list folders,逐步置放於 GMail 帳號中,反正 Google 就是有辦法提供空間。最吸引我的地方,就是快速、有效率,而且高度彈性的郵件搜尋,這對於每天都得讀上百篇文件與郵件的我,有非常巨大的幫助,另一者就是聰明的垃圾郵件過濾,我不再需要維護自己的 filter,反正 Google 的工程師總是會處理好。

再者,錯殺資料的次數,大概可跟我讀過的書籍數量相比,當然,我會作備份,但是生活在海島型氣候的台灣,硬體總是會在不預期罷工,並且根據 Murphy's Law,就算事先有因應之道,但是這些已知的潛在問題,總會在關鍵時刻出錯。GMail 的容量實在是驚人,而且申請帳號是如此容易,所以一個人擁有 n 個帳號也非難事,透過現有的工具 (Freshmeat.net 有好多 free software 可協助),無論是備份、紀錄、放照片,或者只是隨身攜帶資料,GMail 都是很理想的選擇,那我,作為一個使用者,為何一定要把資料放在 localhost 呢?

我用以謀生的工作,也很難局限於某個項目,所以常常需要找 marketing、software、hardware、protocol、RF、... 等領域的文件,並且會收到來自內部與外部的 mail,幾年前年紀還小的時候,還會仔細的分類並彙整,但如今,我早已「視茫茫、髮蒼蒼」,沒有足夠的精力去作這些瑣碎的工作,只得一股腦兒都塞到 /home/jserv/doc 或 /home/jserv/picture 等目錄,未來要參照資料怎麼辦呢?Google Desktop 幫了很大的忙,可惜不知道葫蘆裡面賣什麼藥。硬體的運算能力已經可支撐高效率的搜尋技術,是此,有 [Beagle] 與 [Kat] 一類 Desktop Search Engine 的現身,提供了全面性的系統架構,得以與桌面系統和底層的作業系統作緊密的結合,如提昇 Linux 檔案搜尋速度,而出現的實驗性 inotify。

可以想見的未來,公司任何一個職員,只要是坐在辦公室的,絕對要面臨高負載的「數位資料衝擊」,總是有找不到的文件、總是不曉得自己曾經讀過什麼資料,以及總是無法在一堆資料中,找出真正的「資訊」,試想,我這個微不足道的小小工讀生都得為這些資料費神了,那我的老闆怎麼辦?請再多秘書也沒辦法解決問題!Newsweek 刊載了 Bill Gates 的文章 [The Road Ahead],提到當代人總是把「資料」和「知識」這兩個概念搞混淆,前者只是單純、沒有加工的數位訊號集合,換言之,是種「言語」,而,後者則建立於「經驗、環境、闡述,以及反思」的基礎之上,是此,可說是種「語言」。當代人企盼的,正是有系統、得以掌握、充分明暸的「語言」,知識系統也面臨空前的衝擊,如何針對個人、企業,乃至於跨及海內外趨近無限的原始「資料」,分析其「言語」,歸納出有價值的「語言」呢?

同時,層出不窮的 Web applications,除了創造商機與開拓人類視野外,深刻地讓人體會到人和知識之間聯繫的重要性,並且,為每個使用者創造出獨特、客制、前設性的價值,不僅是這些應用程式的特性,更可說是「職責」。GMail 的 tag 引來許多聯想,並激起全球開發者的腦力激盪,像是我在 blog [夢幻軟體計畫八月份進度] 提到的 [CatFS],就是一個 native GMail Taggable meta- Linux file system 的實做 (應該是全球第一個),其他透過 [FUSE - Filesystem in Userspace] 實做的 GMail-based 的 filesystem 就更千奇百怪了,找找 Slashdot 的新聞與評論,總是會出現令人驚艷的新發現。這說明了什麼?我前面提過,使用者逐漸將資料置放於 GMail 一類高負載容量、便於存取,以及相對安全的環境中,資料量的增加是相當驚人,所以有效且直覺的分類系統,是另外一個挑戰,不可避免要提到 data mining 相關的技術。如果我們不看深入的技術,其實我們已經逐步走入過去只在科幻電腦出現的情境,假以時日,我們如果對《生命中不能承受之輕》這本經典有興趣,但沒有足夠時間閱讀,或許可以這麼跟電腦對話:
    請彙整《生命中不能承受之輕》相關的資料並建檔,我需要中文撰寫的評價
在人們享受一杯濃郁的咖啡後,桌面系統就擺放好足夠的資料,並且下載的電子檔也被標示特定的 tag,告訴使用者這本書的作者 - 米蘭.昆德拉 - 的生平與相關著作,等等,這不是早就可以透過 Google 搭配 script 做到?是的,不過未來應該有更強健的 smart tagging 機制,可以動態讓這些資料具備特定的 tag,並依據使用者的偏好與意圖作調整,而,資料的「呈現」,絕對不是死板板的電子檔或摘要,相反地,桌面系統的 "Dashboard" 應該要能生動的呈現,並且讓這些 tagged 的資料,得以依據權重,主動式彙整... 就這個例子來說,使用者或許會在 Virtual Reality 的環境中,一步又一步的帶入米蘭.昆德拉營造的人類境況 (condition humaine),這個「不能承受之輕」究竟為何?除了昆德拉以悖論的手法透過小說提出外,我們還可看到其他旁徵博引的文獻,適度地呈現於視野可及之處,最後,電腦可協助我們將剛才的探索歷程 (traversing) 記錄下來,以特定的資料結構,匯集那些獲取的資料。

GNOME 開發者、VMware 員工- Christian Hammond (chipx86) - 在他的 blog 展示了 [Taggable Desktop] 與 [Tagging and the GNOME Desktop] 的概念與實做,可作為 [Beagle] 與 [Kat] 這類 Desktop Search Engine 的延伸,並整合 taggable meta filesystem,提供一個桌面環境的 MVC (Model-View-Controller) pattern 的實現,當然,這勢必會激發出更多的想像力與功能上的創新。

未來會如何呢?我想,就如 1900 年第二屆國際數學家大會中,知名數學家 David Hilbert 在「數學問題」的開場白提到: (德文原文)
    "Wer von uns wurde nicht gern den Schleier luften, unter dem die Zukunft verbogen liegt, um einen Blick zu werfen auf die bevorstehenden Fortschritte unserer Wissenschaft und in die Geheimnisse ihrer Entwickelung wahrend der Kunftigen Jahrhunderte?"
中文的意思是,身處在這變動的時代,我們之中有哪一個人不想揭開未來的面紗,讓隱藏其後的真相顯露出來,下科學的下一波進展、向未來世紀科學發展的秘密引領盼首呢?的確,我們已感受到搜尋技術的進步,對於郵件與桌面系統的衝擊,這些變動將在不久的未來,大幅改變既有的使用習慣,甚至是桌面環境生態。

Let's Hacking!
由 jserv 發表於 February 19, 2006 04:47 AM
迴響

真是让人非常期待:)

LEE 發表於 February 19, 2006 05:34 PM

似乎你有一个地方的 b 或者 strong 标签没有闭合,导致现在整个首页看起来都是粗体问题。

Livid 發表於 February 19, 2006 06:37 PM

To Livid,

感謝告知,已修正。

jserv 發表於 February 19, 2006 07:35 PM

我認為 tagging 只對 surfing 有幫助,又或是延伸出去的 social tagging 有著一些其他的「好處」。但是,對於「吊出曾經擁有過的資訊」,一點幫助也沒有。全文檢索才是真正有用的東西。

jeffhung 發表於 February 22, 2006 12:12 AM

最近也在思考tag的一些实现。

准备在kde中实现一把。

Jserv,我无法取得catfs的source code。

如果方便,是否可以Mail给我。

多谢。

cjacker at 21cn dot com

cjacker 發表於 February 22, 2006 09:06 AM

To cjacker,

Please refer to http://svn.csie.net/
Thanks!

jserv 發表於 February 22, 2006 02:24 PM

zeta function? Hilbert?
难道你学的数学的啊?

^_^ 發表於 February 22, 2006 02:31 PM