November 22, 2010

新酷音進度報告 8


    「我寧可做人類中有夢想和有完成夢想的願望的最渺小的人,而不願做一個最偉大的無夢想無願望的人。」
晚間忙完雜務後,鍵盤聲響尚未停歇之際,想起紀伯倫的這席名言。記得筆者十年前拿著 iPaq 作實驗,運行著 PocketLinux,讚嘆於 StrongARM 核心時脈高達 200 MHz 的效能,心想自己真是幸運兒;現在到處都能見到採用 45 奈米製程、時脈高達 1 GHz 的 iPad,只覺得自己心態還沒調適好,儘管自知這是 Moore's law 的必然結果。然而,軟體的進展卻沒有如此明顯,在中文輸入法的部份,普遍可說大多在「變老把戲」的狀態,對於一位 2001 年間斷修改酷音輸入法程式、到 2010 年還在零星維護程式碼的人來說,不得不有些感嘆。

難道輸入法開發就是老樣子、永遠在重新造輪子嗎?倒也未必。如前文 [手寫版酷音輸入法雛型] 所及,當使用者族群逐漸採用移動裝置時,需要一個易於書寫且容易讓輸入法引擎 (也就是 "Language Engine" 或 "IM Engine") 涉入處理的設計,現有的智慧型手機,比方說 Android 與 iPhone,都提供了全螢幕書寫的機制,要實現「何不直接辨識注音符號,然後導入新酷音輸入法引擎去作猜字處理?」這類簡單易用的方案,相當可行,也注入新的開發動能。兩年前的 [新酷音進度報告 7] 談到目前 [新酷音計畫] 的開發會集中於 libchewing 0.3.x 開發分支,期望能演化為穩定的 libchewing 0.4.x 版本。距離上一個公開的釋出版本,轉眼間就兩年過去了,以下是 libchewing 0.3.3 開發進度:
  • 穩定性改良,修正不當的記憶體存取 (violation & leaks)
  • 與 [新酷音詞庫計畫] 同步,修正了陳年的「麼」等等注音或詞彙問題
  • 以 CMake 重寫 build system,讓泛 UNIX 系統與 MS-Windows 都能用一致的方式來建構
  • 支援 Microsoft Windows 64bit
  • 修正許氏注音的錯誤組合
  • 修正符號選擇時,不正確的排列
在此同時,SCIM 與 ibus 的整合也持續開發,後者可參考 ibus-chewing 維護者 dingyichen 的文章 [新酷音的發展現況]。感謝諸多開發者的維護、廣大使用者的貢獻,新酷音輸入法的開發過程中,形成一個重要的特色,在於不單單僅是一個輸入法,相反地,我們提供一套簡潔的 API,以銜接各式開放平台的輸入法框架整合,這讓多元的應用變成可能。諸如中正大學、元智大學、交通大學等研究單位,皆有採用新酷音核心為基礎的研究項目,而我們也及時整合到多種視窗環境與架構,像是 MS-IME, OpenVanilla, SCIM, iBus, IIIMF 等等,甚至連 ChromeOS 與 MeeGo 這樣大型的開放原始碼平台,也內建了 新酷音輸入法的成果。對筆者來說,是極大的鼓舞,能夠被世界一流的軟體平台所採納,算是實現了心願,哪怕只是一個不起眼的中文輸入法系統。

以下舉出兩項台灣學術單位近期基於新酷音的研究:(已公佈程式碼)
  • [rela-chewing] (元智大學) : 憑藉字詞間相關性的數據,將選字的正確率更加上升,讓使用者更加流暢放心的使用注音輸入法,而無須擔心內建的自動選字功能選到錯誤的字詞
  • [CitC] (Chewing in the Cloud; 交通大學) : 建立雲端服務,讓新酷音得以使用大量的詞庫,並透過來自諸多使用者貢獻的詞彙習慣,作輸入法辨識的改善
另外,也有熱血的大學生,結合來自 libchewing 的斷詞模組實作智慧選字功能,並利用「行列定符」改進原行列的符號輸入,開創了 [IbusFaft] (自由行列) 的開放原始碼專案。真的,改善每天都會使用的軟體,不僅是個夢,還是能夠實踐的夢,只要您有些巧思,就有機會透過開放原始碼的力量,動手實現,我們期待新的成功案例。

康德《純粹理性批判》述及:
    「我們一切的知識都始自經驗,這是毋庸置疑的。因為若不是透過一些對象的話,那會是什麼激起我們的認知能力呢?這些對象觸動我們感官,有的自己引發想法,有的刺激我們的理解力,讓我們去比較、聯想或區分這些對象。未經處理的感官印象,便是如此被處理成對於對象的認知,也就是所謂的經驗。」
康德定義的「經驗」,事實上即是新酷音這類「智慧型輸入法」的原理,甚至我們可說,「輸入法」本身就是資訊系統中「經驗」的最佳呈現,而既然每天都有機會接觸,何不就使用自己開發/改良/貢獻 (至少透過雲端服務就可) 的輸入法系統呢?
由 jserv 發表於 November 22, 2010 11:34 PM
迴響
發表迴響









記住我的資訊?