時(shí)間:2020年02月05日 分類:文學(xué)論文 次數(shù):
摘要:大數(shù)據(jù)發(fā)展日新月異,新的應(yīng)用需求和實(shí)踐問題層出不窮,社會(huì)各界越來越重視大數(shù)據(jù)的基礎(chǔ)研究。百科全書作為知識門類的概述性著作,是開展和推動(dòng)基礎(chǔ)研究的重要載體。作為大數(shù)據(jù)知識傳播的工具,《大數(shù)據(jù)百科全書》不僅要有實(shí)用與新穎兼?zhèn)涞闹R內(nèi)容,并且還應(yīng)具備準(zhǔn)確嚴(yán)謹(jǐn)與通暢易懂的專業(yè)化語言文字表達(dá)。其中,術(shù)語是《大數(shù)據(jù)百科全書》不可或缺的有機(jī)組成部分,文章總結(jié)大數(shù)據(jù)領(lǐng)域的術(shù)語特點(diǎn),并以此提出《大數(shù)據(jù)百科全書》術(shù)語方面的收錄和處理原則。
關(guān)鍵詞:大數(shù)據(jù);百科全書;術(shù)語
相關(guān)論文投稿刊物:《百科知識》雜志社與中國大百科全書出版社同期創(chuàng)建于1979年, 是由中國大百科全書出版社主辦的國內(nèi)惟一文理合編的國家級科普刊物; 是國內(nèi)公認(rèn)的具有權(quán)威性的老牌科普雜志之一。《百科知識》雜志的特 色是門類廣泛、文理合編、權(quán)威準(zhǔn)確、通俗易懂。
2017年5月,中國大數(shù)據(jù)領(lǐng)域第一部專業(yè)百科全書———《大數(shù)據(jù)百科全書》正式啟動(dòng)編纂工作,該書將由大數(shù)據(jù)戰(zhàn)略重點(diǎn)實(shí)驗(yàn)室負(fù)責(zé)研究編纂,并經(jīng)全國科學(xué)技術(shù)名詞審定委員會(huì)(以下簡稱“名詞委”)審定發(fā)布。該書將在科學(xué)方法論的指導(dǎo)下,以歷史和發(fā)展的眼光,對大數(shù)據(jù)知識體系進(jìn)行全面梳理,覆蓋大數(shù)據(jù)理論、大數(shù)據(jù)戰(zhàn)略、大數(shù)據(jù)技術(shù)、數(shù)字經(jīng)濟(jì)、數(shù)字金融、數(shù)據(jù)治理、數(shù)據(jù)安全、數(shù)權(quán)法、大數(shù)據(jù)史九個(gè)方面,并以專業(yè)規(guī)范的百科全書語言的形式編纂成書,以期推動(dòng)大數(shù)據(jù)領(lǐng)域的知識傳播和普及,并為深入研究大數(shù)據(jù)提供基礎(chǔ)性研究素材。《大數(shù)據(jù)百科全書》以大數(shù)據(jù)領(lǐng)域內(nèi)的豐富知識為主體,包括大數(shù)據(jù)領(lǐng)域的基本理論、重要事件、基本事實(shí)、基本概念、重要流派、重要機(jī)構(gòu)組織、重要著作和出版物、重要人物、重要政策文本等內(nèi)容。術(shù)語作為概念、理論的語言指稱,是《大數(shù)據(jù)百科全書》不可或缺的有機(jī)組成部分和研究重點(diǎn),主要分布在百科全書的立目用詞和釋文用語。
一術(shù)語是《大數(shù)據(jù)百科全書》的有機(jī)組成部分
1.術(shù)語是大數(shù)據(jù)領(lǐng)域主要的專業(yè)用語
隨著大數(shù)據(jù)的飛速發(fā)展,相關(guān)知識體系逐步完善,其領(lǐng)域詞匯越來越豐富,相關(guān)術(shù)語所占的比重越來越大。術(shù)語是特定領(lǐng)域?qū)W科中的專門用語,是構(gòu)建學(xué)科體系的基本元素。根據(jù)詞匯使用范圍的不同,德國學(xué)者希爾默(A.Schirmer)將其分成通用詞和專業(yè)詞匯,專業(yè)詞匯由術(shù)語、專名①、行業(yè)用語等詞匯單位組成,其中術(shù)語是基本的專業(yè)詞匯單位[1]。與專名相比,術(shù)語稱謂的普通概念更具概括性,可以指稱客觀世界的一類客體,而專名往往處于概念體系的最底層,指稱客觀世界的唯一客體,包括人名、機(jī)構(gòu)名等等。
同時(shí),術(shù)語與專名具有相通性,在某些情況下可以互相轉(zhuǎn)化。如“ENIAC”(ElectronicNumericalIntegratorandComputer),最初是指1946年的第一臺電子計(jì)算機(jī),屬于專名,但由其發(fā)展而來的“電子計(jì)算機(jī)”已經(jīng)成為計(jì)算機(jī)科學(xué)術(shù)語。與行業(yè)用語相比,術(shù)語和行業(yè)用語雖都用于專業(yè)領(lǐng)域,且稱謂某個(gè)專門的概念,但術(shù)語更具規(guī)范性,而行業(yè)用語中常用具有俚俗色彩的口頭語,修辭色彩更強(qiáng)。如計(jì)算機(jī)領(lǐng)域從事軟件開發(fā)的工作人員也常常自嘲為“碼農(nóng)”。
2.術(shù)語是《大數(shù)據(jù)百科全書》的重要研究內(nèi)容
術(shù)語不僅僅是專業(yè)領(lǐng)域內(nèi)的語言交流的工具,還是對學(xué)科知識的凝練和濃縮,是科學(xué)理論的組成部分。術(shù)語既是語言單位,又是科學(xué)知識單位,術(shù)語符號與該知識領(lǐng)域的概念系統(tǒng)中的概念相互對應(yīng),它不僅是對專業(yè)領(lǐng)域內(nèi)理論概念的語言指稱,還是對在認(rèn)知過程中出現(xiàn)并完善的專業(yè)概念的形式化。它能夠概括、增加和傳遞科學(xué)知識,反映某一認(rèn)知領(lǐng)域的發(fā)展階段和程度[2]。《大數(shù)據(jù)百科全書》在全面梳理大數(shù)據(jù)領(lǐng)域的基礎(chǔ)理論、知識門類與發(fā)展實(shí)踐的過程中,必然要對其領(lǐng)域的相關(guān)術(shù)語進(jìn)行研究探索。以大數(shù)據(jù)領(lǐng)域概念為基礎(chǔ)的術(shù)語系統(tǒng),是歸納概括領(lǐng)域知識的符號系統(tǒng),在一定程度上體現(xiàn)了人們對大數(shù)據(jù)的知識系統(tǒng)的認(rèn)識,也是《大數(shù)據(jù)百科全書》框架體系的重要參考依據(jù)。
3.術(shù)語符合《大數(shù)據(jù)百科全書》的語言要求
術(shù)語是科學(xué)語言,其科學(xué)性、簡明性以及中立性等特性與百科全書的語言要求相符,使得術(shù)語成為《大數(shù)據(jù)百科全書》的重要用語。首先,術(shù)語的科學(xué)性要求術(shù)語要與所稱謂的概念一致,準(zhǔn)確傳遞概念內(nèi)容。其次,術(shù)語的簡明性要求術(shù)語簡明扼要,易讀易記,術(shù)語一般不宜過長。各語言中超過7個(gè)字(或詞)的術(shù)語短語數(shù)量有限。冗長術(shù)語在使用時(shí)往往會(huì)被簡化,從而構(gòu)成縮略形式。如“筆記本”(筆記本式計(jì)算機(jī))、“微機(jī)”(微型計(jì)算機(jī))等。最后,術(shù)語的修辭中立性是指術(shù)語不帶有修辭色彩、主觀情態(tài)性和其他表現(xiàn)力因素。在構(gòu)詞時(shí),避免使用方言或俗語詞匯[2]。
這與百科全書準(zhǔn)確、平實(shí)、簡明的用詞特征相符。《大數(shù)據(jù)百科全書》要為相關(guān)讀者釋疑解惑,就必須具備真實(shí)、準(zhǔn)確、科學(xué)的大數(shù)據(jù)知識或信息。這不僅要求其內(nèi)容是大數(shù)據(jù)領(lǐng)域的客觀真理或規(guī)律,符合客觀實(shí)際,經(jīng)得起推敲和邏輯推理;同時(shí),作為內(nèi)容載體的文本語言力求嚴(yán)謹(jǐn)顯真,客觀準(zhǔn)確反映表達(dá)的內(nèi)容。這就要求其用詞表意準(zhǔn)確,選用恰當(dāng)、最能反映事物或現(xiàn)象真諦和精髓的詞語入文,忠實(shí)地表達(dá)概念,多選擇具有科技語體色彩并且表意準(zhǔn)確的書面用語,避免使用口語化或存在歧義的日常用語[3]。
二大數(shù)據(jù)術(shù)語特點(diǎn)
《大數(shù)據(jù)百科全書》作為大數(shù)據(jù)領(lǐng)域的專業(yè)百科全書,應(yīng)盡可能體現(xiàn)所有或者至少大多數(shù)大數(shù)據(jù)領(lǐng)域的專業(yè)詞匯單位。因此,《大數(shù)據(jù)百科全書》術(shù)語的范圍以大數(shù)據(jù)術(shù)語為主,此外《大數(shù)據(jù)百科全書》還包括一部分相鄰領(lǐng)域的相關(guān)術(shù)語。同時(shí),大數(shù)據(jù)領(lǐng)域術(shù)語的一般規(guī)律和基本原則決定了《大數(shù)據(jù)百科全書》的術(shù)語特點(diǎn),并深刻影響著《大數(shù)據(jù)百科全書》術(shù)語的收錄和處理。
1.前沿性
大數(shù)據(jù)作為近年出現(xiàn)的新興領(lǐng)域,相關(guān)新事物、新概念、新技術(shù)層出不窮,大數(shù)據(jù)領(lǐng)域術(shù)語更具有鮮明的時(shí)代性。大數(shù)據(jù)領(lǐng)域知識相比其他傳統(tǒng)學(xué)科更為年輕,該領(lǐng)域大部分科技術(shù)語較其他學(xué)科術(shù)語發(fā)展歷程較短。相關(guān)的概念作為新概念的期限一般不長,很快就進(jìn)入使用階段。它們既是在某一段時(shí)期內(nèi)科學(xué)技術(shù)領(lǐng)域的研究熱點(diǎn),也是社會(huì)大眾關(guān)注焦點(diǎn)的科技名詞。“大數(shù)據(jù)”一詞首次使用于1997年,20世紀(jì)末到21世紀(jì)初期,逐漸為學(xué)術(shù)界的研究者所關(guān)注。直到2014年,“大數(shù)據(jù)”作為我國科技新詞②之一,由全國科學(xué)技術(shù)名詞審定委員會(huì)正式對外發(fā)布試用。同時(shí),大數(shù)據(jù)領(lǐng)域的新詞數(shù)量多,發(fā)展快,很多術(shù)語尚未形成共識和規(guī)范,這為大數(shù)據(jù)領(lǐng)域的術(shù)語整理提出挑戰(zhàn)。
2.跨學(xué)科性
大數(shù)據(jù)術(shù)語的跨學(xué)科性來源于大數(shù)據(jù)領(lǐng)域多學(xué)科交叉發(fā)展的特點(diǎn)。大數(shù)據(jù)與多門學(xué)科都有緊密聯(lián)系,其理論基礎(chǔ)來自多個(gè)不同的學(xué)科領(lǐng)域,包括計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、信息科學(xué)等,其知識系統(tǒng)本身具有極高的復(fù)雜交叉性[4]。大數(shù)據(jù)領(lǐng)域固有術(shù)語③較少,大數(shù)據(jù)領(lǐng)域部分基礎(chǔ)詞匯來源于相鄰學(xué)科的術(shù)語混合,也存在受其他學(xué)科影響而獲得新義的術(shù)語。根據(jù)國家標(biāo)準(zhǔn)《GB∕T35295—2017信息技術(shù)大數(shù)據(jù)術(shù)語》,大數(shù)據(jù)術(shù)語中包含“數(shù)據(jù)、數(shù)據(jù)處理、數(shù)據(jù)管理、關(guān)系模型、關(guān)系數(shù)據(jù)庫”等與信息技術(shù)密切相關(guān)的通用術(shù)語。大數(shù)據(jù)術(shù)語的跨學(xué)科性對整理術(shù)語及術(shù)語集界限的確定造成了一定的困難。
3.融合性
隨著大數(shù)據(jù)與經(jīng)濟(jì)社會(huì)各領(lǐng)域進(jìn)一步融合發(fā)展,大數(shù)據(jù)應(yīng)用也向各細(xì)分領(lǐng)域延伸拓展,其領(lǐng)域詞匯也逐漸擴(kuò)展到各細(xì)分的應(yīng)用領(lǐng)域,并在相互作用時(shí)產(chǎn)生術(shù)語的混合體。2017年5月,名詞委聯(lián)合大數(shù)據(jù)戰(zhàn)略重點(diǎn)實(shí)驗(yàn)室首次對外發(fā)布塊數(shù)據(jù)、主權(quán)區(qū)塊鏈、秩序互聯(lián)網(wǎng)、激活數(shù)據(jù)學(xué)、5G社會(huì)、數(shù)據(jù)鐵籠、數(shù)權(quán)法等大數(shù)據(jù)十大新名詞。這些新詞不僅反映大數(shù)據(jù)的創(chuàng)新與發(fā)展,更是大數(shù)據(jù)在各個(gè)領(lǐng)域融合應(yīng)用的結(jié)果。融合術(shù)語集有的模糊不清,有的基本術(shù)語完全保留了原義,有的略有修改,有的經(jīng)過專業(yè)化后完全改變了原義,因其成分不純,這些術(shù)語界線的確定和系統(tǒng)化顯得更為復(fù)雜[5]。
三《大數(shù)據(jù)百科全書》的術(shù)語收錄和使用原則
新聞出版總署等多部門曾明確發(fā)文要求“各編輯出版單位今后出版的有關(guān)書刊、文獻(xiàn)、資料,要求使用公布的名詞。特別是各種工具書,應(yīng)把是否使用已公布的規(guī)范名詞作為衡量該書質(zhì)量的標(biāo)準(zhǔn)之一”。大數(shù)據(jù)作為新興學(xué)科領(lǐng)域,相關(guān)術(shù)語規(guī)范標(biāo)準(zhǔn)尚未完善,部分大數(shù)據(jù)術(shù)語的規(guī)范和選擇還處于過程階段。《大數(shù)據(jù)百科全書》作為大數(shù)據(jù)知識傳播的重要載體,理應(yīng)在整理、規(guī)范大數(shù)據(jù)術(shù)語方面承擔(dān)更大的責(zé)任,發(fā)揮更大的作用。
1.適量使用術(shù)語,在保證科學(xué)性的基礎(chǔ)上注意通俗性
《大數(shù)據(jù)百科全書》的讀者對象主要是政府的政策制定與執(zhí)行部門、研究機(jī)構(gòu)、企事業(yè)單位中從事大數(shù)據(jù)相關(guān)研究和應(yīng)用的人士。其中,既包括大數(shù)據(jù)領(lǐng)域的專業(yè)人士,也包括其他大數(shù)據(jù)領(lǐng)域的相關(guān)人士,受眾范圍相對寬泛。由于個(gè)人專業(yè)水平和文化素質(zhì)等因素的影響,這些受眾對大數(shù)據(jù)的專業(yè)認(rèn)知存在差異。為盡可能滿足每一位讀者的需要,《大數(shù)據(jù)百科全書》的語言運(yùn)用要處理好通俗化的問題,總體控制相關(guān)術(shù)語的收錄數(shù)量、釋義篇幅、使用范疇,盡可能避免使用艱深晦澀的專業(yè)術(shù)語,使得其知識的縱深適合。具體注意事項(xiàng)有以下幾點(diǎn):一是釋義時(shí)僅在必要的情況下使用術(shù)語,在可以不用術(shù)語時(shí),要選用大眾熟知的表達(dá)方式;二是在使用過于艱深羞澀的術(shù)語時(shí)需對術(shù)語做出解釋和說明;三是根據(jù)語言經(jīng)濟(jì)原則,要盡可能避免術(shù)語套術(shù)語,忌循環(huán)使用術(shù)語解釋術(shù)語。
2.謹(jǐn)慎對待科技新詞,避免使用爭議詞
人們對大數(shù)據(jù)領(lǐng)域的認(rèn)識有一個(gè)逐漸清晰的過程。在大數(shù)據(jù)相關(guān)概念產(chǎn)生和構(gòu)建的過程中,部分詞匯的內(nèi)涵有可能不夠明確,概念不夠穩(wěn)定,學(xué)界對其認(rèn)識也有個(gè)過程,在此過程中出現(xiàn)了大量科技新詞。隨著時(shí)間的推移,有的科技新詞逐步穩(wěn)定,進(jìn)入成熟的概念體系,而有的科技新詞會(huì)被更為規(guī)范的術(shù)語代替。作為一部規(guī)范性的權(quán)威辭書,《大數(shù)據(jù)百科全書》具有可信的精確性、時(shí)代性以及相對的穩(wěn)定性的特點(diǎn),其科技新詞和爭議詞的處理是積極但又比較謹(jǐn)慎的。對于這部分詞語收錄的意義不僅在于對其進(jìn)行實(shí)錄和保留,更重要的是對其定型、規(guī)范釋義和傳播指導(dǎo)。
一方面,《大數(shù)據(jù)百科全書》的科技新詞收錄標(biāo)準(zhǔn)是嚴(yán)格的,態(tài)度是慎重的。詞的理據(jù)④上,要求名詞合理,符合漢語的構(gòu)詞規(guī)律,排除和限制不規(guī)范的詞語;詞的使用上,要求收錄具有生命力⑤和普遍性⑥的詞語。一些偶發(fā)詞⑦依賴于既有詞和特定語境,且復(fù)用率極低,其意義也是臨時(shí)性的,這類詞應(yīng)當(dāng)避免。另一方面,有些問題雖未最終穩(wěn)定下來,或者說尚未“蓋棺定論”,但已形成人們熟知的話題,形成穩(wěn)定下來的問題,也具有收錄的意義。諸如類術(shù)語、準(zhǔn)術(shù)語、偽術(shù)語這類專業(yè)詞匯,它們是大數(shù)據(jù)術(shù)語發(fā)展過程的產(chǎn)物,是大數(shù)據(jù)領(lǐng)域概念的唯一稱謂,對于那些能夠反映重要研究成果、對大數(shù)據(jù)發(fā)展影響重大的關(guān)鍵性代表性的詞匯,在經(jīng)過認(rèn)真篩選和審慎取舍后,應(yīng)當(dāng)和術(shù)語一同收入《大數(shù)據(jù)百科全書》條目表中,但在釋義中一般不推薦使用。對于這些專業(yè)詞匯的規(guī)范需要極為謹(jǐn)慎,以避免誤導(dǎo)讀者。
3.科學(xué)選擇術(shù)語,規(guī)范術(shù)語使用
對于經(jīng)過時(shí)間沉淀或已形成共識的術(shù)語,我們須以科學(xué)術(shù)語規(guī)范意識為引領(lǐng),積極學(xué)習(xí)大數(shù)據(jù)相關(guān)的國家術(shù)語標(biāo)準(zhǔn),關(guān)注名詞委的新詞發(fā)布,及時(shí)了解學(xué)界術(shù)語發(fā)展,不用已被淘汰的舊名稱或概念的非推薦名,如“3D打印”(以后應(yīng)使用“三維打印”)。在具體術(shù)語收錄時(shí),綜合考慮以下因素進(jìn)行取舍:術(shù)語的重要性、使用頻率、主體所屬、系統(tǒng)性、術(shù)語的構(gòu)成能力、術(shù)語集收詞是否全面、時(shí)間因素和搭配特點(diǎn)等。
對于已有規(guī)范的多領(lǐng)域交叉術(shù)語,不同學(xué)科術(shù)語標(biāo)準(zhǔn)參差不齊。大數(shù)據(jù)領(lǐng)域具有跨學(xué)科交叉的特點(diǎn),其基礎(chǔ)學(xué)科相應(yīng)術(shù)語的規(guī)范形成的時(shí)間不同,規(guī)范制定的專家和出發(fā)點(diǎn)不同,形成的標(biāo)準(zhǔn)也不盡相同。同時(shí),同一個(gè)術(shù)語,由于使用的地域不同,術(shù)語常常發(fā)生分歧。例如,“程序”這個(gè)術(shù)語,美國為program,英國則為programme。在中文術(shù)語中,由于我國臺灣地區(qū)特殊的地理、歷史和政治因素的影響,許多術(shù)語與大陸不同。如海峽兩岸計(jì)算機(jī)科技術(shù)語中,兩岸不一致的約占40%以上[6]。對于以上情況,有兩個(gè)最基本的原則:一是遵循服從主學(xué)科的原則,即在以大數(shù)據(jù)為核心內(nèi)容的前提下,篩選術(shù)語;二是擇善而從,考慮術(shù)語出現(xiàn)的時(shí)間先后,以及目前的使用頻率。同時(shí),未選擇的術(shù)語的緣由應(yīng)做相應(yīng)的交代。