- 相關推薦
文獻資源數字化與數字化資源開發
摘 要 以浙江圖書館的實踐和探索為例,論證在復合型圖書館發展階段,在文獻資源數字化建設中,應以系統科學理論為指示燈,以特色數據庫為制高點,以地方文獻為重頭戲,以開發利用為生命線。
關鍵詞 數字化;復合型圖書館;系統科學;特色數據庫;地方文獻
中圖分類號 G25O.76
文獻標識碼 A
文章編號 1005—8214(2005)03一OOO9—02,
文獻資源數字化和數字化資源開發是數字圖書館建設中的核心問題,也是復合型圖書館研究課題的核心問題。本文圍繞這一命題,以浙江圖書館的實踐探索為例進行理性思考。
1 以系統科學理論為指示燈
系統科學將系統作為研究對象,構成與自然科學、數學科學和社會科學并立的新興科學門類。系統科學一方面以提煉融合20世紀四五十年代出現的運籌學、控制論、信息論等技術科學為基礎,另一方面因20世紀六七十年代誕生的自身綜合性橫斷學科自組織理論的創立而豐實。由此,極大地推動了系統科學前進的步伐。
數字圖書館建設是一項典型的系統工程,具備了系統的整體性、關聯性、目的性、環境適應性、動態性、有序性等基本特征。
1.1 數字圖書館是人類大智慧的結晶和高科技產物的龐大人造系統,不可能畢其功于一役
從宏觀視角而言,數字圖書館的建設脫離不了國際間的攜手合作。例如美國聯邦政府提供資金的合作規劃——數字圖書館創始工程第二階段,是一個由美國國家科學基金會(NsF)等單位主辦,由博物館和圖書館服務協會(IMLS )等單位協辦的政府機構內的計劃。該啟動計劃是由多機構發起,旨在尋求提供下一代數字圖書館基礎研究的統一領導,以推動分布于全球的信息資源的有效利用,并贊助現存的和新建的團體關注有所創新的應用領域。我國文化部于2ooo年開始在全國倡導實施中國數字圖書館工程,旨在建設超大規模的優質中文信息資源庫群,并通過國家高速寬帶網向全國及全球提供服務,最終形成世界上最全面、最系統的網上中文信息基地和服務中心。再如中美100萬冊圖書數字化計劃,預計耗資近2ooo萬美計劃在3年內對100萬冊中、英文圖書進行數字化加工,實現網上全文檢索、閱讀。該計劃已于2003年上半年正式啟動。從微觀而論,數字圖書館的準確定義應該是超大規模的、分布的、多文化、多媒體、多語種,可無縫連接、跨庫檢索的海量數字化信息資源庫。由若干子系統構建,包括數字資源的采集、加工、知識挖掘、信息發布與檢索、管理、參考咨詢、用戶培訓等。因此,無論從規模、內容到形式、技術都遠非僅憑任何一個館的實力能夠企及的。
1.2 數字圖書館系統是一個實體和抽象相結合的動態的開放系統,技術創新為其不竭源泉和動力
數字圖書館系統以計算機硬件、網絡通信設備等物理狀態的存在作為組成要素,又由概念、原理、指令、程序等非物質實體構成。比如,以處理文獻資源為基本目的的元數據標準,以揭示收藏和服務功能的OPAC體系,知識產權的授權使用,數字化資源質量保障體系和效益評估體系,與環境有信息、物質和能量交互作用,系統內部結構也可以隨時間變化。數字化信息資源組織形式從順序的、線性結構轉變為直接的、網狀結構;信息存儲形式從單介質轉變為多媒體。技術是數字圖書館系統演化進程系統的序參量,技術軌跡的斜率,即技術突變,引起局面的突變。數字圖書館建設本身充滿著不確定性,無處不在的非線性永久地發生作用。
互聯網實現了計算機硬件的連通,萬維網實現了網頁的連通,如何將物理上互連的眾多資源匯聚起來,聯合提供服務,是近幾年新興的網格技術的實質。網格就是要實現互聯網上所有資源(包括計算資源、存儲資源、通信資源、軟件資源、信息資源、知識資源等)的全面連通,其應用將遍及各個領域,成為具有高性能處理、海量數據存儲和大量儀器設備等特征的21世紀人類社會的信息處理基礎設施,最終實現網絡虛擬環境上的資源共享和協同工作,消除信息孤島和資源孤島。
2 以特色數據庫為制高點
2.1 拿來主義
數字圖書館好比長江大海,不棄涓流,容納百川;而形形色色規模不等的數據庫構成其主體和實質性基礎。我國已建成一批特色鮮明、內涵宏富、使用成熟的大型數據庫,僅浙江圖書館先后引進及建成的大型鏡像站就有<超星數字圖書館》《方正Apabi數字圖書館》《書生之家數字圖書館》《中國學術期刊》《萬方數據資源系統》《國務院發展研究中心信息網》《中國財經報刊數據庫》《新華社多媒體數據庫》《維普中文科技期刊全文數據庫》《中國基本古籍庫》等。上述數據庫可能其內容有交叉,但已沒有必要重復建設。國家圖書館制定的數字資源建設八原則:即統籌規劃有序推進的原則,公益性為主的原則,突出重點原則,嚴格遵照標準規范的原則,自建與購進并舉、相互協調與相互補充的原則,注重規模與時效的原則,統一管理、定期維護的原則,自邊建設邊服務的原則,歸納精當透辟,可資各圖書館借鑒。
2.2 自建
我國數字圖書館建設的宗旨是將中文信息為主的各種信息資源數字化,加速改變互聯網上中文信息匱乏的狀況,形成中華文化在互聯網上的整體優勢。將我國悠久的歷史、燦爛的文化、當代建設的輝煌成就通過互聯網向全世界展示,讓世界了解中國,讓中國走向世界。各圖書館正根據自身館藏特色與地域優勢,利用“都柏林核心元數據”格式,按照選題、編排、數據質量、檢索途徑、用戶界面等規定建立專題數據庫,盡全挖掘、掃描、收集(或鏈接)、整合、存貯、揭示有價值的實體和虛擬資源。
2.2.1 古籍善本數字化
古籍因其不可再生,亟待保護的文物價值和不涉及知識產權保護范疇的可操作性,應當列為先行實施數字化的文獻資源。已獲浙江省哲學社會科學成果二等獎的《浙江圖書館古籍善本書目》收錄范圍為:“一般以清代乾隆六十年為下限。凡乾隆六十年以前之寫本、刻本、活字本、抄本與稿本,皆在選錄之列。清代嘉慶元年以后宣統三年以前之稿本,流傳較少之刻本、抄本、名家批校題跋本,1912年以后罕見之傳抄本,亦在選錄之列!惫彩珍浌偶6935種7506部,其中經部864種955部,史部1894種2021部,子部1528種1641部,集部2574種2805部,叢部75種84部。2OO2年7月起,文化部、財政部聯合啟動了“中華再造善本”工程。確定再造善本1300種,首期再造唐宋善本700種。2OO3年已再造善本4o余種,耗資2OOO萬元。2OO4年再造200種。古籍尤其是孤本、善本的數字化,堪稱是最妥善的保護、保存措施。
2.2.2 縮微膠片轉化
縮微攝影技術采用專門的設備、材料和工藝,把文獻資料以縮小影像的形式攝影記錄在膠片上,經加工制作成縮微品保存和使用,為保護文獻原件、提高文獻利用率、降低管理費用發揮過重要作用,成為文獻管理的一種有效手段。然而,與數字化資源比較,其存儲空間仍舊占用大,保管條件要求高以及檢索不便的缺點也顯而易見。浙江圖書館經過2o年的努力,已將大量古籍和特藏制成縮微膠片,僅清末民國期間的浙江版舊期刊就逾530余種、舊報紙250余種,共計50萬拍。將這批珍貴資源的數字化已納入議事日程。
2.2.3 擁有自主知識產權的特色庫
集中精兵強將,開發研制既兼容通用又特性鮮明的、擁有自主知識產權的數據庫,本身極具科學探索意義,并且蘊涵著明顯的或潛在的經濟實用價值,應當予以重點扶持和鼓勵。比如,浙江圖書館初步建成的《中國歷代名人圖像數據庫》和《外國名人圖像數據庫》,上下五千年,縱橫八萬里,濃縮了中華文明和世界文明的創造者中的代表人物的風貌,具備文化、教育、審美、統計、工具等多種功能。前者設立了名人姓名、漢語拼音、生卒年、生平功名(例如官銜升降、職業變更、中舉登第等)、字號別稱、時代(分遠古、夏、商、周、秦、漢、三國、晉、南北朝、隋、唐、五代十國、宋、元、明、清、近現代)、籍貫(古今地名)、圖片說明等檢索點,已收錄人物5OOO余名,圖像10000余幅,預計人物將達10000余名,圖像2O00O余幅;后者設立有英文名、中譯名、身份、生卒年、生平事跡、國別及出生地、所屬大洲、圖片說明等檢索點,已收錄人物2OOO余名,圖像4OOOO余幅,預計將達10000余人,3OOOOO余幅圖像。數據庫分別可通過局域網和廣域網訪問.問世以來廣受歡迎。
3 以地方文獻為重頭戲
家有譜,方有志,國有史。古人云: “治天下者以史為鑒,治郡國者以志為鑒。”地方志作為中華文化寶庫的珍貴財富和奇葩,享有“地域百科全書”的美譽,具備資治、存史、教化、興利等功能。開發、利用其宏富祥瞻的信息內涵,為社會主義精神、物質文明服務,意義顯著、前景廣闊。但紙質地方文獻不少系非正式出版、未廣泛流通的灰色文獻,存在著冗余度大,頭緒紛繁,查檢不便,引用困難等諸多缺陷。浙江圖書館從1900年建館肇始,就將盡全收藏本省地方文獻臚列為文獻采集條例的重中之重。迄今為止,經多方征集和采購已入藏新編浙江省省級志、綜合志、專業志1600余種。浙江圖書館正著手將此1600余種新編方志印刷本全文,采用先進錄入加工技術數字化。并經標引,建成操作電腦化、檢索智能化、傳遞網絡化、存儲自由化、資源共享化的浙江省新編地方志數據庫,為浙江省地方志的取精用弘開創一個嶄新的局面。地方戲曲是珍貴的非物質文化財富,根深而葉茂,浙江圖書館將建立多媒體數據庫的首選目標鎖定為發源于本土而影響全國、享譽環球的<越劇》。其框架結構為越劇史料、越劇簡史、梨園往事:軼聞、傳記;越劇之最;越劇劇目:傳統劇、經整理的古裝劇、新編古裝劇、現代劇;流派唱腔:越劇音樂、常用樂器;越劇表演流派和藝術特色,表演行當及表演程式,名家新秀:演員、編劇、導演、作曲;舞臺美術、化妝;越劇機構和學校(19個):戲班、劇團、研究機構,另有相關資料,包括:越劇研究、相關論著、演出習俗、越劇戲考、戲曲會演資料、評獎資料、拍攝電影、錄像名單等。
浙江圖書館初步建成和在建的數據庫尚有《浙江旅游文化多媒體數據庫》,以遍及浙江的成千上萬的名勝古跡、文化景觀為經,以名人、翰墨、特產、佳話為緯;<浙江藏書研究數據庫》全面揭示1260余位浙江籍藏書家的獨特魅力和藏書活動的文化底蘊,以及<浙江期刊選目數據庫》《關注長三角專題數據庫》等。
4 以開發利用為生命線
紙質出版物增長勢頭依然迅猛,而網上可利用資源更呈海量發展趨勢,智能化模糊檢索體系極大提升了文獻的查準率、查全率,強化了信息的可共享性和增值性;紛至沓來的信息用戶也愈漸成熟,需求更凸顯多元化、理性化、專業化和個性化的特征。全天候開放f下轉第頁)(上接第1O頁)和全方位揭示各類實體和虛擬資源,構建便捷的信息通道、知識平臺和導航系統,理所當然地成為以保存文化遺產、傳播知識信息、開啟智力資源為己任的圖書館工作者在知識經濟新時代的神圣職責。
4.1 弘揚先進文化,倡導網絡文明
“網絡文明工程”是由文化部、團中央、廣電總局、全國學聯、國家信息化推進工作辦公室、光明日報、中國電信、中國移動、人民日報、新華社等單位于2OOO年l2月7日共同發起主辦,以“文明上網、文明建網、文明網絡”為宗旨的大型網絡管理和引導活動。根據對搜索引擎進行分析的結果顯示:互聯網上相對獨立的中文文化網站約為52000個,其中以WWW開頭的,約有34OOO個。我國數以千計的公共圖書館大多建有自己的網站,而且開設了電子及多媒體閱覽室,也正在以高品位的創意,高格調的內涵,高標準的管理,高質量的服務成為網絡文明工程
的骨干力量。
4.2 主動激活信息,積極參與競爭
數字化資源因其多文化、多語種,紛繁而虛擬,既形成汪洋大海式的取之不盡、用之不竭的信息、知識、智力源頭活水,也造就了深不可測、奧妙無窮的科技迷宮,增大了深度挖掘、精當整合的難度,對于圖書館工作者的文化素養、業務功底和動手能力相應提出了全新的要求。浙江圖書館在網頁上不僅啟用館藏書目查檢、預約、續借,自建和引進數據庫,搜索引擎推薦和技巧指導,有關網站鏈接、網絡資源導航等功能,并且開辟信息服務和互動熱線,快捷解答咨詢,代為檢索遍及科研課題、專利發明、技術革新、編史修志、策劃設計、留學深造、論文撰寫等各類資料,并編匯和原文傳遞包括飲用水、乳制品、酒業、保健品、管理營銷、房地產、等多項專題系列資料。占有優勢的豐瞻廣袤的資源,訓練有素的嫻熟查檢技能和世代相傳的職業道德根基,構建了圖書館介入市場經濟的核心競爭力。
4.3 建設開發并舉,紙質網絡雙贏
枯樹無果實,空話無價值,數字資源建設不僅需要坐而論道,更需要起而行動。我們親身參加了數據庫建立的實踐,真切地體會到其調研、籌謀、搜尋、輸入、校對、補充、更新..道道工序的繁瑣艱辛,也領略到其包含的創造性勞動、智力展現與個性張揚的成就感,尤其可以分享被開發使用、發揮效益的喜悅。而被愈來愈多的人所認識、所使用乃至信賴和倚重,正是數據庫建立以及數字圖書館建設的終極目標。邊建邊用,以使用的深度、廣度、力度作為評估價值、改進質量的試金石和催化劑,可以確保文獻數字化的蓬勃生機與旺盛活力。
人類文化傳統和圖書館事業發展規律注定了復合型圖書館的長期客觀存在,事實雄辯地證明,數字化資源建設不會因為停電的煩惱以及病毒、黑客的作崇,減緩前進的步伐。與此同時,紙質文獻的全方位開架閱覽、外借,也沒有因為失竊頻仍而畏首畏尾;以人為本的精神貫穿于這一不可逾越的圖書館發展階段的各個工作環節。遵循系統科學要素,前瞻性地通盤考慮實體和虛擬資源的現狀與發展,有目的地推動兩者的相濟互補、共存共榮,制定一館一地一省以至全國的文獻數字化建設、開發及共建共享規劃,采取切實有效的建設與使用并重的措施,圖書館必定會取得文獻數字化的飛躍,開創紙質與數字化資源管理及利用雙贏的新天地。
參考文獻
[1]錢學森.大力發展系統工程,盡早建立系統科學體系 光明日報,1979—11—10(2).
[2]黃曉斌,鄧愛貞.網格技術的發展與數字圖書館建設情報資料工作,2003,(5):32—35.
[3]劉世昕.新一代互聯網將升華為“網格”WWW要變CCC.中國青年報,20O2—04—12(5).
[4]趙達雄.美英數字圖書館建設工程項目概覽[J].圖書館雜志,2O02,(3):70—71.
[5]勞萊斯·萊斯格.重圍中的因特網
[6]國家圖書館數字資源建設指導小組.國家圖書館數字資源建設(2003--2005年規劃)
(趙達雄,男,浙江圖書館研究館員)
(陳蓓,女,浙江圖書館館員)
(張蓉,女,浙江圖書館副研究館員)
〔出處〕 圖書館理論與實踐 2005年第3期
【文獻資源數字化與數字化資源開發】相關文章:
地方文獻資源數字化思考08-09
淺議數字化資源課程的開發研究實施方案08-25
試析地方文獻情報資源開發08-09
數字化館藏資源的多層次揭示08-05
論地方文獻的開發與資源共享08-09
也談地方文獻情報資源的開發08-09
淺談海南地方文獻數字化建設08-09
山西地方文獻資源開發利用研究08-09
開發文獻資源、發展地方經濟08-09