August 31, 2005

夢幻軟體計畫 2005 八月份進度

[夢幻軟體計畫] 是今年 Debian 中文社群的 [年度計畫] 相當重要的項目,從 [熱血三人組] 在一月份提出這個想法後,陸續找到各項目的協調人進行,而現在就 [夢幻軟體計畫] 項目作個簡介,當然,我必須聲明,這僅是個人的觀察,事實上只要您願意貢獻與參與,一定還有更驚人的成果。

這篇 blog 基本上延續 [Debian 在台灣] 的描述,但只針對 [夢幻軟體計畫],其他熱心付出的朋友以及他們的貢獻,我會在稍後的 blog 或 wiki page 中提及。

從輸入法系統來看,[kanru] 與 [PCMan] 積極投入 [OpenVanilla] 發展,貢獻了 Win32 的移植,發展的進度與概況可以參閱 [Win32Issues],目前已經有接近商業產品水準的表現,而 [vgod] 稍早成功移植 [OpenVanilla] 到 [SCIM] 輸入法平台上,所以許多經典的香草輸入法模組,像是 POJ(白話字) 與藏文輸入法,就可以在 Debian GNU/Linux 運作了,同時他也打包好 Debian 套件,詳情可參考 [OpenVanilla Debian packages!]。而 Mat 則在入伍前夕將 [UCIMF] 的程式碼放入 Subversion repository,並且改過 build script,現在 [新酷音] 已經可以透過 IIIMF 與 UCIMF 的機制,在 Linux console/tty 下顯示並輸入了。而我則利用一點空檔研讀 [OpenVanilla] 中 b6s 所實做的 Bi-Gram Generic Filter,並且 import 到 [新酷音] 的 [libchewing/branches/bigram],不過還沒具體突破,但作為新的 Language Model 是不錯的出發點,有機會再跟 b6s 兄請教。此外,之前 blog [Arne 的台灣地區通俗語言之輸入法] 提到的專案,現在已經有進展了,可參閱 [MinNan IM (台式閩南語輸入法) 進度表],楊先生發展的這套以注音輸入法為基礎的表示方式真是特別,這個月初有幸可以參與這個計畫,學到不少表示法與重音的考量,還有,看到自己被分配到的 Task 標示為 100%,不禁湧起一股熱血的衝動 :-)

至於 [TSCC (繁簡體中文用語轉換系統的基礎框架)],進度大致如 blog [中文簡繁轉換的複雜性] 所及,雖然目前有些實做,是 gaim 的 plugin,可以作為即時訊息的繁簡體轉換,主要是因為避免跟大陸網友聊天時,會有語言隔閡,但是還有不少相關資料待涉獵。

網路設定工具的項目,目前 [Linetconf] 算是完成階段性的目標,可以作為完整且複雜 [NetworkManager] 的一個輕量級選擇,我之前有一個委託的案子就是以這個計畫為主軸,加入 WirelessLAN WPA 支援,如果有時間的話,應該可以整合進去。

網路應用程式的部份,當然首推 [PCMan] 兄領導的 [PCManX-pure-GTK2] 計畫,很多熱心的朋友,比方說 [kanru]、[copyleft]、olv,以及 [FourDollars] 陸續投入,並且提出許多創新的發展,比方說 Python script 的支援、BBS 聊天機器人、美觀的字型處理、類似 MSN Messenger Popup 的來訊顯示效果,以及多個錯誤修正,這些特徵在過去 Win32 的版本甚至還沒有出現過,感謝偉大的網際網路,把這群開發者連繫起來,共同創造出更豐富的發展。

在八月中旬舉辦的 [DebianBirthdayParty2005] 中,brianhsu (墳墓) 展示了他跟暨南大學同學共同發展的 CatFS,這是一個 Linux Kernel Virtual File System 的擴充,可以在 kernel-level 做出類似 Google GMail 的分類設計,所以可以輕鬆的指定一個命名,就會對應到真實的 inode,我已經在 Notebook 裡面跑起來,不過還沒有協助 hacking,或許可以請墳墓兄把這些成果放到 [svn.csie.net] ,然後號召幾個對 kernel hacking 與 Desktop Integration 有興趣的朋友來共同改善。

正如我的 blog [2005 下半年計畫] 所及,我會用十月份整個月的時間投入 Free/Open Source Software 的發展,除了撰寫我的 paper 與作基礎研究外 (能否出席 Summit,就靠這些研究與 paper 了,希望我能有突破),當然會貢獻於上述的 [夢幻軟體計畫],並基於 [再談「自由創投」] 的理念,讓專案的進行能夠更順利。同時,軟體程式設計需要對技術有足夠的掌握,所以除了「Free Java Runtimes」與「綜觀 X Window System 新發展」這兩場已經舉辦的演講,Debian@Taiwan 今年的 [IRC Conference] 還是會繼續,如果場地、時間,以及少量資金能配合的話,說不定可以舉辦一場黑客松 (Hackthorn),可參閱之前的 blog [想玩黑客松]。

最後,[chuany] 在 [Debian@Taiwan Wiki] 中發起一個計畫 [Computer Reload / 電腦再生計畫],他寫到:
    電腦再生計畫是為了拯救許多曾經風風光光為我們賣力運作,但現在卻靜靜躺在角落的二手零件,再次賦予他們神聖的使命,讓他們為許多默默為我們寫作自由軟體的創作者運作。
    參與夢幻軟體計畫的開發者並非每一位都很富有,也並非每一位都有能力負擔開發所需要的硬體設備,希望這些曾經風光的舊零件能夠幫助的了這些開發者。
這裡呼應我之前的說法作結:
    很歡迎更多朋友協助,正所謂「有錢出錢、有力出力」,您的貢獻將會驅使整個社群能夠再邁向一步。
看來今年的成果還不錯,還是那句老話:希望能有更多朋友投入,一起來創造 Debian 在台灣的故事。
由 jserv 發表於 August 31, 2005 01:34 PM
迴響

n-gram 的原理請參考: http://www.research.microsoft.com/~joshuago/lm-tutorial-v8.ppt
這份投影片寫得非常棒。

軟體實作方面,參考 SRILM 的 library (http://www.speech.sri.com/projects/srilm/manpages/ 最底下) 會更好,而且前天 release 的 1.4.5 開始透過 mingw 支援 win32,換句話說個 library 也有可能作為跨平台輸入法核心的一部分了。:)

b6s 發表於 August 31, 2005 03:05 PM

推 SRILM... 演算法超多的。

william 發表於 August 31, 2005 04:45 PM