https://zh.wikipedia.org/wiki/大五碼#衝碼問題
▽▼↓▽▼↓▽▼↓▽▼↓ 截取自WIKI百科 ▽▼↓▽▼↓▽▼↓▽▼↓
衝碼問題
因為低位元字元中包含了程式語言、shell、script中,字串或命令常會用到的特殊字元,例如0x5C「\」、0x7C「|」等。「\」在許多用途的字串中是當作轉義符號,例如\n(換行)、\r(歸位)、\t(tab)、\\(\本身符號)、\"(引號)等等。而「|」在UNIX作業系統中大多當作命令管線的使用,如"ls -la | more"等等。如果在字串中有這些特殊的轉義字元,會被程式或直譯器解釋為特殊用途。但是因為是中文的原因,故無法正確解釋為上面所述的行為,因此程式可能會忽略此轉義符號或是誤當作轉義符號而中斷執行。若此,就違反了使用者本來要當成中文字元一部份使用的本意。
低位元字元與ASCII重疊的字元如下︰
@ A-Z [ \ ] ^ _ ` a-z { | } ~
在常用字如「功」(0xA55C)、「許」(0xB35C)、「蓋」(0xBB5C)、「育」(0xA87C)中時常出現,造成了許多軟體無法正確處理以Big5編碼的字串或檔案。這個問題被戲謔性地人名化,稱為「許功蓋」或「許蓋功」(這三個字都有這種問題)。
一般的解決方法,是額外增加「\」的字元,因為「\\」會被解釋為「\」,所以「成功\因素」這個字串就能無誤地被程式當作「成功因素」的字串來處理。但是額外的困擾是,有些輸出功能並不會把「\」當作特殊字元看待,所以有些程式或網頁就會錯誤地常常出現在「許功蓋」這些字後面多了「\」。
△▲↑△▲↑△▲↑△▲↑ 截取自WIKI百科 △▲↑△▲↑△▲↑△▲↑
【 ORC光學字元辨識 】類比與數位的過渡時期
我覺得 許功蓋 不再是問題的今天,來說說【 ORC光學字元辨識 】的原理,和早期1979年的輸入法的定義,是否相同。早期80年代,最通用的輸入法【倉頡輸入法】【大易輸入法】為主要使用者,再輔以【注音輸入法】為用。
於90年代中期,最常見的電腦中文輸入法,主要是【倉頡、大易、注音】三種輸入法。
在 1990 年出現一個【無蝦米輸入法】流行近十年就報廢了,當時教育部還主力推廣過【無蝦米】,甚至主辦【輸入法比賽】,在很多【原有 輸入法 技術】來講?【無蝦米輸入法】有侵犯各種以【形名】概念設計的輸入法技術,甚至是【抄襲 點字檔 排列技術】,致使【 無蝦米輸入法 】被【各大 輸入法 軟體公司】提告侵權!
使得【無蝦米輸入法】宣告【提供 自由軟體 版權】來散佈,卻只是【字碼數量不足的輸入法】,必須要【付費註冊】後,才能開啟其他【字根表】的使用。
PS . 我不喜歡無蝦米輸入法,但他的概念?似乎可取?卻又被【各大 輸入法 廠商】撻伐,使得無蝦米並未大賺錢就退出輸入法市場,現在的輸入法取得?幾乎是【作業系統 必備 內建】再無所謂【搭配購買】的問題。
基於【 ORC 光學字元辨識 】和早期的【類比輸入法】,所採取的基礎技術是相同的實踐!
有趣在這一連串的技術都相同於【一個概念】,甚至【飛彈尋標器】也是同一種設計概念。
光學字元辨識 | 圖文光學辨識 | 人臉肢體辨識 |
電子數位表格 | 色卡頻譜建立 | 輪廓誤差檢定 |
抽象圖素應證 | 單色圖塊篩選 | 細微尺寸比例 |
早期的點字碼順序,採取的技術背景?基於【點陣字型 8x8 / 8x16 / 16x16 / 16x24 / 24x24 】的表現,到今天所謂【向量字形】的定義是【無限大】
https://zh.wikipedia.org/wiki/點陣字型
https://zh.wikipedia.org/wiki/向量字型
早期的輸入法,是否支援【字型】,那必須有【輸入法軟體廠商】去定義,並不是你隨便都可以使用,直到【Win3.1】和【Linux 5 (Lux OS) 】破壞了輸入法軟體廠商的定義,將字型轉變成【作業系統】可規範條件,才把【輸入法】【字型】【字碼表】拆分開來。
因此?這裡就要參考一張 倉頡 輸入法的教案,讓大家直接明白,為什麼【類比】發展【數位】,除了【定義存址編碼】外,到底是怎麼回事!
問題在 誰長得像誰 呢?
以下圖片取自【倉頡大解碼】網址 https://www.classes.com.hk/news/education/倉頡大解碼
-------------------------------------------------------------
-------------------------------------------------------------
-------------------------------------------------------------