DokuWiki 的臺文 localization

規劃

lang code?

  • 可否直接用 ISO 639-3 nan?我不想要被強加什麼 zh- 寄人籬下啊啊啊
    • Telegram #l10n-tw 裡有人建議我去問 g0v 社群
    • 也有建議我直接問 DW 開發者
    • 也有建議我詢問臺灣南島語作業系統 :o
    • 後來我找申請管道時,發現 DW Forum、GitHub 上有人用 3 碼申請成功(ckb 中部庫德語,詳下)

如果可以用 nan 的話,我真正想做給臺文的是:

  • nan-tw-kip
  • nan-tw-hant

∵我把 nan 定位為整體的閩南語,包括中國的廈漳泉 ∴如同華文有 zh-cn、zh-tw 一樣(DW 是 zhzh-tw),我覺得臺文是 nan-tw;然後再依 writing system 不同而分 -kip(教育部臺羅)、-hant(正體漢字)。

但,可能無法跳過 nan 就做「dialect」(DW i18n 網頁上有希望不要直接翻譯 dialect)∴也許我就先弄到 nan,之後再 fork 以後,nan 留給中國人,我們臺灣人繼續做 nan-tw-* 就好?

語言名稱
當然希望最終可以出現 Taiwanese。至於「閩南語」本身的話我則偏好 Minnan 一個單字名就好。

但是,nan | ISO 639-3 記載的語言名稱是 Min Nan Chinese 啊,也就是我一直非常不能接受的,在每個語言後面加什麼勞什子 Chinese 啊,真讓人啼笑皆非的大一桶思想。

如果 DW 開發者們說他們要先照 ISO,那我可能得等 nan 完成,接下來弄 nan-tw-* 的時候,再把 Taiwanese 加進去了。

公開 TM 及開放討論、協作翻譯

  • Google Spreadsheet?
  • DokuWiki
    • TM
      • struct 表?
      • .txt → .txt?
    • glossary
      • struct page data 可供逐頁討論?
      • dw-nan vs. Taigi123 :trans?

原則:

  • 2 套書體:漢羅(漢字為主,可包含少許羅馬字)、全羅
  • 書體之間維持實質一致(應可轉換)

實做

官版

(指 DokuWiki Localization 網頁介面,以及透過 GitHub 協作官版檔案)
申請開設 nan

  • DW i18n mail-list?mail list 好像早就廢了?
  • → 後來好像是到 Forum 申請,再後來到 GitHub 開 issue 即可
    1. 結果稍後就被一位不知是華裔還是中國人的 Henry Pan 詢問為什麼不用 zh-min-nan……
    2. 我回文列舉理由主張 nan 完全合理符合國際規範後,晚上看到 Andi 親自同意用 nan,叫我直接翻譯、PR = 系統之後會自動開 nan:o 酷。
    3. ∴我就真的 fork 了 DW(第一次 fork 整個 DW……),開了個 nan-l10n branch,翻了約 40 條(這次用漢字,與下面自己在本機上用臺羅測試不同 ∵打漢字比較快……;但臺語程度不佳的我,搜索枯腸翻得還是有點蹩腳
    4. 然後就開了第一個 PR,為 10/27 的努力畫下句點,可以先睡了。要趕快想怎樣維護 TM 及版本啦~~~
  • 10/28 早 Klap-in 把我的 PR merge 進去啦!稍後 Localization Hub 上也真的出現 nan 這個語言可以在介面上直接編輯啦!感謝 神!
    • 語言名稱部分,我猜他們是要手動改,目前還是只有顯示 nan。是歐美人怕我和中國人吵政治嗎?目前未竟全功,我想也許等 nan 全部翻完後,比較有底氣時,再去要求改語言名好了。暫時不要太出鋒頭。

自理

10/27 白天 另外我又想到,在向 DW 專案提交翻譯前,我是否可以在自己安裝的 DW 上先做 inc/lang/nan,然後在 config 裡設 nan 來試翻、試用?

  1. 似乎不宜直接下載 GitHub 上的最新 DW 原始碼
    ∴到 DokuWiki 官方下載頁,選了 2020-10-24 的最新 snapshot,順便包進 translation plugin;語言全選
  2. 解壓成 dw-nan 資料夾放 MBA,然後 install.php 裝起來
  3. 奇怪了,config 裡沒有看到中部庫德語鄉親們正在做的 ckb,inc/lang 裡也沒有
  4. 那我還是先把 en 複製一份,改名為 nan
    → config 裡馬上有 nan 可選用!太好了,DW 常常都只要吃 folder/file 就好,有東西就接受,不用其他安裝或調整,真方便!
  5. 試著把 nan/lang.php 前幾行翻成臺羅文,像這樣:
    $lang['btn_edit']              = 'Kái tsit iah';
    $lang['btn_source']            = 'Hián-sī guân-sú-bé';
    $lang['btn_show']              = 'Hián-sī bāng-ia̍h';
    $lang['btn_create']            = 'Tshòng tsit iah';
    $lang['btn_search']            = 'Tshiau-tshuē';
    $lang['btn_save']              = 'Thú-tsûn';
    $lang['btn_preview']           = 'Sian khuànn-māi--a';

    然後重整 dw-nan 頁面 → 效果出來了!搜尋框裡出現 Tshiau-tshuē,真感動~

    • 所以其實不需要等 Translation Hub 開好這個語言,我就可以先開始翻譯了;而且說實在的,技術上也絕對不需要先弄 nan。只是說如果要公開發表 merge 到官方時,也許會有人有意見說不應該先弄 nan-tw-*

初步先這樣;再來我可能得趕快想想怎樣維護 TM37) 以及邀請協作了,臺羅的跟漢字的都要,可能要弄成對照表;但又可能需要有討論頁……

問題

  • 還沒有翻譯的字串、檔案,要留著嗎?
    • lang.php 裡的似乎只要有已翻譯的字串就好,未翻譯的我猜就直接套 en 的
    • 但其他的 .txt、.js、.html 文件呢?如果拿掉的話,系統會直接套英文嗎?
37)
translation memory

討論區

輸入您的意見. 允許使用維基語法:
A M G J​ P