ISO 639-3




ISO 639-3 是個國際語種代號標準,在2007年2月5日出版。它延伸了 ISO 639-2 裡的 Alpha-3 code(三個字母的代號),目標是涵蓋所有的語言。所以,它是 ISO 639-1 的超集合。 ISO 639-3 是 ISO 639-2 個別語言的超集合,但是因為 ISO639-3 沒有 ISO639-2 的語言集合,所以 ISO 639-3 不是整個 ISO 639-2 的超集合。


自2005年7月30日發佈的計畫草案,共有 7,602 個語言條目,這些語言的來源有三個:基本資料來自 ISO 639-2 所收錄的個別語言,和取自《民族語》裡的現代語言調查資料。而過去歷史的各類語言及古老的語言和人工語言,則是出自 the Linguist List 的資料。




目录






  • 1 編碼空間


  • 2 大語言 (Macrolanguages)


  • 3 集合語言 (Collectives)


  • 4 參見


  • 5 外部連結





編碼空間


因為這是採用 3 個字母,所以這套 3 字母編碼理論上最多可代表 26×26×26 = 17,576 種語言。但是,因 ISO 639-2 定義了4個特別代碼、 520個預留區域和23個 B 類代碼,故此 ISO 639-3 可用的編碼只有 17,576 − 547 = 17,030 個。


其中有4個代碼用來代表特殊情況:




  • mis──「uncoded languages」(未編碼語言);


  • mul──「multiple languages」(多語種);


  • und──「undetermined language」(未確定的語種);


  • zxx──「no linguistic content」(没有语言内容)。


標準中亦有一個供私人使用的範圍: qaa-qtz



大語言 (Macrolanguages)


在 ISO 639-3 代碼中,以下的語言被視為是某些其他語言的大語言 (macrolanguage),即這些語言可再細分為數種以上的語言。就以漢語為例,SIL 就把漢語細分為 14 種語言。




  • 阿坎语(aka


  • 阿拉伯语(ara


  • 艾马拉语(aym


  • 阿塞拜疆语(aze


  • 俾路支语(bal


  • 比科尔语(bik


  • 布里亚特语(bua


  • 马里语(chm


  • 克里语(cre


  • 特拉华语(del


  • 史拉维语(den


  • 丁卡语(din


  • 多格拉语(doi


  • 爱沙尼亚语(est)自2008-043號修訂,2009年1月16日生效


  • 波斯语(fas


  • 弗里西亚语(fry


  • 富拉语(ful


  • 巴亚语(gba


  • 贡德语(gon


  • 格列博语(grb


  • 瓜拉尼语(grn


  • 海达语(hai


  • 塞尔维亚-克罗地亚语(hbs


  • 苗语(hmn


  • 因纽特语(iku


  • 依努庇克语(ipk


  • 犹太-阿拉伯语(jrb


  • 卡努里语(kau

  • Kalenjin(kln)自2007-169號修訂,2008年1月14日生效


  • 孔卡尼语(kok


  • 科米语(kom


  • 刚果语(kon


  • 克佩勒语(kpe


  • 库尔德语(kur


  • 拉亨达语(lah

  • Luyia(luy)自2007-171號修訂,2008年1月14日生效


  • 曼丁哥语(man


  • 马达加斯加语(mlg


  • 蒙古语(mon


  • 马来语(msa


  • 马尔瓦利语(mwr


  • 挪威语(nor


  • 奥克语(oci 由2007年3月14日取消


  • 奥吉布瓦语(oji


  • 奥洛莫语(orm


  • 普什图语(pus


  • 凯楚亚语(que


  • 拉贾斯坦语(raj


  • 吉普赛语(rom


  • 阿尔巴尼亚语(sqi


  • 撒丁语(srd


  • 斯瓦希里语(swa


  • 古叙利亚语(syr


  • 塔马奇克语(tmh


  • 乌兹别克语(uzb


  • 依地语(yid


  • 萨波特克语(zap


  • 壮语(zha


  • 汉语(zho


  • 扎扎其语(zza


它們所包括的語言可在 http://www-01.sil.org/iso639-3/macrolanguages.asp 查看。



集合語言 (Collectives)


SIL 在檢視過七千多種語言之後,發現以下 11 種被列在 ISO 639-2 的語言,它們之下所包含的語言,並非屬於同一語種,故在 ISO 639-3 代碼中被刪除。




  • bad 班达语


  • bih 比哈尔语(有一個 ISO 639-1 代碼 bh


  • btk 巴塔克语


  • day 达雅克语


  • him 喜马偕尔语


  • ijo 伊乔语


  • kar 克伦语


  • kro 克鲁语


  • nah 纳瓦特尔语


  • son 桑海语


  • znd 赞德语


註:比哈爾語之下有10多種語言之多,故理論上不應獲發一個 ISO 639-1 代碼 bh



參見



  • ISO 639

  • ISO 639-1代码表

  • ISO 639-3字母代码表

  • 《民族語》

  • 中国语言列表



外部連結



  • ISO 639-3

  • ISO 639-3 code retirement mappings

  • Linguist List - List of Ancient and Extinct Languages

  • explanation by Håvard Hjulstad

  • ISO 639-3 status from the ISO Website






Popular posts from this blog

GameSpot

connect to host localhost port 22: Connection refused

Getting a Wifi WPA2 wifi connection